消除网络监视器错误警报的5个步骤

您在垃圾填埋场工作的时间越长,气味对您的警觉就越少。当没有任何问题时,您的网络监控系统仪表板以红色和黄色点亮的时间越长,警报对您的意义就越小。配置您的网络监视器警报阈值,使红色真正意味着“现在做点什么”。我们的一位高级服务工程师 (SE) 在安装网络监控系统后不久就拜访了一位客户。看着客户的仪表板,SE 看到了一些罕见而美妙的东西。

消除网络监视器错误警报的5个步骤

他对客户说:“您主页上的所有内容都是绿色的。这正常吗?一切(即监控系统)工作正常吗?”“哦耶。我在这附近经营着一艘非常紧张的船,”客户回答道。“我知道应该监控什么以及何时监控。“诚然,该客户端几乎没有大型客户端维护的网络规模,在任何给定时间都不太可能有零警报。但是客户的观点仍然有效。正确配置的警报是必不可少的,配置不当的警报可能比没有警报更糟糕。

这里有 5 种方法可以确保您的警报正在执行您支付的费用:

1. 清点您的设备(必要时获得帮助),以确保您可以看到您需要它的地方 - 并且只在您需要的地方。

在解决警报阈值之前,请确定您是否甚至需要监控给定的设备或系统。正如我在上一篇关于为监控系统安装准备网络的文章中提到的,您可以使用“自动发现”工具来清点系统和设备。我们有客户告诉我们,自动发现过程帮助他们识别了一些他们没有意识到他们可以如此轻松地监控的关键设备。现在,他们发现了解这些设备非常有用。

对于其他客户,最好手动清点他们的网络,通常是在我们 SE 的帮助下。这可以帮助您识别您可能不需要监控的设备。你知道,就像那个已经“关键”了 250 天的来宾虚拟机,但实际上其中 249 天可能并不存在?请记住,如果您使用具有预设警报阈值的自动发现功能,您可能需要立即调整阈值。对于您不立即调整的阈值,请在它们运行几周左右后留出时间进行审查。确保你有你认为你有的知名度。

2. 确定每个警报将直接通知谁,以及如何通知他们。

如果您有生成操作项通信的警报,请确保只有需要对警报采取行动的人(可能连同备份和/或直接主管一起)接收电子邮件、文本等。与仪表板警报一样,一个装满无关通知的收件箱只会训练人们忽略所有警报,包括他们应该采取行动的警报。

3. 考虑将警报从单个设备监控工具迁移到一个集成监控系统中。

作为 OmniCenter 的创建者,我们显然相信全面的监控、警报和报告设备。然而,我并不是说某些设备的专有监控工具或为基础设施的特定元素构建的本土工具没有用处。关键是不要让这些不同的工具以大多数工作人员不完全理解并且不能始终正确响应的警报形式产生噪音。

不同工具的报警系统可能使用不同的协议来轮询他们的设备。每个都可能有不同的 UI。这可能会迫使您在网络管理操作中不必要地创建孤岛。综合监控系统促进了更多跨职能、更灵活的工作人员。您可以避免服务瓶颈(以及随之而来的不可避免的指责)。

使用 SNMP 轮询每台设备的管理系统使您能够了解整个基础架构,包括您无法通过代理管理的设备。例如,SNMP 可以向您显示没有操作系统的设备(如交换机端口或 UPS 电池)的利用率。无论您决定需要警报配置的设备,您都应该能够使用单一、连贯的 UI 来概览所有设备。

4. 配置警报阈值以发现重大异常,而不是可预测和/或瞬时峰值。

正如我在一篇关于发现隐藏在虚拟化网络中的异常的帖子中所描述的,静态阈值(例如服务器 CPU 或内存)可能会产生误导性警报。一个典型的例子是 SQL 数据库服务器。它可能每天四次达到 100% CPU,但您并不真的希望每次发生这种情况时都收到警报。您真正需要知道的是它何时表现异常。

也许在周五上午 10 点,它通常以 80% 的速度运行,但本周五同时以 20% 的速度运行。这可能表明您的应用程序或用户存在问题 - 但不会触发静态警报。通过异常检测,您将收到警报,以便您了解发生了什么。

或者你可能有一些用户通常不会使用超过 20% 的端口带宽,而现在他们正在使用 70% — 仍然可能不足以触发静态“高水位”阈值,但绝对应该这样做调查。如果您的监控系统只是在寻找固定的阈值,您可能看不到全貌。这取决于设备的常规工作负载。

5. 尽可能自动化为新设备预先设置阈值的过程。

一旦您清点了您的系统,将所有需要的设备映射到您的监控系统并自定义了阈值,您的警报管理工作就完成了。只是在开玩笑。只要您的网络不断变化和增长,它就永远不会完成,对吗?但是你可以让这项工作更容易向前推进。

根据您已设置的参数,配置您的网络监控系统以预设特定设备类别的警报阈值。即使新设备通常不需要与设备类别完全相同的警报参数,也可能会接近预设阈值。如果不立即重新配置设备的警报,您至少会获得一些保护。而且您可能会发现,大多数情况下预设的阈值都是正确的。这是你自己经营一艘非常紧张的船的明显迹象之一。

文章链接: https://www.mfisp.com/7364.html

文章标题:消除网络监视器错误警报的5个步骤

文章版权:梦飞科技所发布的内容,部分为原创文章,转载请注明来源,网络转载文章如有侵权请联系我们!

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
IDC云库

什么是互联网蠕虫,为什么它们如此危险?

2022-6-7 14:10:07

IDC云库

如何解决数据隐私和数据保护的问题?它们之间的区别是什么?

2022-6-7 14:43:14

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
客户经理
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索

梦飞科技 - 最新云主机促销服务器租用优惠