在Scale II上管理IT:基础架构管理软件的可扩展性与易用性

企业的成长是一件令人兴奋的事情,但它往往会给 IT 专业人员带来独特的挑战。在尝试升级 IT 管理环境时会遇到一些常见的障碍。在我们大规模管理 IT 基础架构系列的第二篇博客中,我们讨论了如何在监控软件可扩展性和易用性之间找到合适的平衡点。

在Scale II上管理IT:基础架构管理软件的可扩展性与易用性

两种类型的基础设施管理软件

基础设施管理软件传统上分为两类之一:易于使用、流畅、快速但可能从未设计为真正可扩展的软件,以及昂贵、令人困惑且难以定制的四大遗留系统

适用于小型环境的基于 Windows 的系统:

第一类通常是为小型环境设计的基于 Windows 的系统。这些在中小型企业和组织中非常常见,随着它们的发展和发展,它们试图尽可能长时间地保留这些系统。这些解决方案通常使用添加额外服务器以进行扩展的方法,但通常会遇到性能和管理开销问题。例如,Windows 修补、许可、防病毒和维护要求都以与我们添加服务器和性能经常受到影响的速度相同的速度扩展,从而限制了我们可以使用这种解决方案真正管理的最大规模。他们有时也会成为目标受众的受害者,当我们试图管理数千甚至数万台设备时,用于管理一百台服务器或路由器的 UI 突然变得非常痛苦。

许多这些解决方案的吸引力在于“无限”许可证,这似乎很吸引人,因为它应该允许您根据需要添加任意数量的设备,但只能添加与一台服务器可以处理的设备一样多的设备,并且在很多情况下,这比你想象的要少得多。我们测试的一个软件解决方案开始在单个服务器上的 1500 台设备上出现严重问题,而且没有添加大量复杂的服务或应用程序检查,甚至没有运行网络流量。一份设计指南仅推荐每台服务器最多 500 台设备!

老派“四大”解决方案

第二类管理系统,老式的“四大”解决方案旨在处理非常大的环境,但用户界面“晦涩难懂”,对这些系统进行小的更改或定制可能会很昂贵,并且需要专业培训或顾问。重要的是要理解这实际上是设计使然,因为这些公司中的大多数从服务和咨询业务中赚到的钱比从销售软件中赚到的钱要多得多。这意味着许多公司最终得到了一个在必须升级之前从未完全实施的平台。我们的一位客户花了三年时间和超过 200 万美元尝试实施其中一种解决方案,由于年度升级不得不重新开始两次,最后不得不放弃它并改变方向。

在Scale II上管理IT:基础架构管理软件的可扩展性与易用性

解决这一挑战的方法是保持管理、报告和配置集中化,以简化扩展。通过确保这些任务有一个单一的用户界面——一个旨在扩展的用户界面——我们消除了创建自定义网页、访问多个 UI 或学习脚本语言来管理和维护平台的要求。只需单击几下,您就可以根据需要部署服务引擎,从而更快地扩展,而所有内容都可以从您习惯的同一个集中式 Web 界面进行管理和访问。

基础架构管理软件更新流程旨在让您可以完全自动化和安排它,或者只需单击一下,您就可以在不中断服务的情况下下载和安装最新版本 - 然后这些更新会自动推送到所有不同的服务和远程收集引擎,使这个过程完全无痛。

还采用分布式方法来解决这个问题,确保远程收集器——我们称之为“服务引擎”——正在做大量繁重的计算和数据库工作,这样虽然您仍然可以从单个中央控制台获取所有数据,繁重的工作被分散,再次帮助扩展到世界上最大的网络环境。

基于设备的方法意味着无需管理或配置外部数据库,也无需满足操作系统或防病毒要求。内置自动化旨在简化配置,无需人工干预,即使在高度动态的环境中也是如此,因此该解决方案可以在几天而不是几个月或几年内部署,并且即使在 DevOps 节奏的环境中也可以保持同步。

被警报淹没

警报过载是大多数管理员曾经处理过的事情,但随着环境的扩大,它变得更加严重。这是最常见的抱怨:收件箱、电话和聊天应用程序都在爆炸式通知中,有时一天数百甚至更多,没有人能够跟上它们,更不用说在解决潜在问题上取得进展了。结果,您的操作员和工程师开始忽略甚至过滤掉这些警报,让您在生产应用程序失败时等待用户投诉。

忽略这样的警报是自找麻烦,因为总有一天,有人不可避免地会忽略错误的警报,而您将遇到本可以很容易避免的重大中断。当用户因为数据库集群的最后一个成员失败而呼叫帮助台时,您已经陷入困境。这甚至可能比没有监控更糟糕,因为当现实与盲目一样好时,管理层可能会感到安全,因为事情正在受到密切关注。这意味着即使是拥有多个高级监控系统的组织也经常陷入消防模式,在警报发生时做出反应,而没有真正提前并在影响用户之前防止中断。

在Scale II上管理IT:基础架构管理软件的可扩展性与易用性

那么,如何在不让指挥中心充斥警报的情况下,确保一切都得到良好监控?作为一般规则,您应该只为可操作的项目保留活动警报。如果您不打算在收到通知后立即对其做出反应,则不应对其发出警报。例如,如果您在硬盘驱动器达到 90% 的利用率时收到警报,然后因为不紧急而忽略它们,则会发生两件事:首先,您迟早会因为忘记在驱动器填满之前返回该警报,其次,您正在调整自己和您的团队以忽略可能代价高昂的警报。相反,您应该使用详细的报告来告诉您有关每台服务器的关键指标。

但是,使这种方法发挥作用的一个关键点是安排和自动化这些报告,这样就不会遗漏任何东西。平台使您可以在 Web 界面中查看任何内容,只需单击几下即可转换为自动报告,无需任何特殊培训或 SQL 知识,也无需使用可能令人讨厌的外部报告工具。

结论

您可以观察到一些解决方案是可以在您为 IT 基础架构奠定基础之前实施的。在创建新企业时,您通常会制定允许无缝增长以实现组织目标的程序,同样重要的是,您的 IT 团队必须为自己设想增长。

文章链接: https://www.mfisp.com/6826.html

文章标题:在Scale II上管理IT:基础架构管理软件的可扩展性与易用性

文章版权:梦飞科技所发布的内容,部分为原创文章,转载请注明来源,网络转载文章如有侵权请联系我们!

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
IDC云库

NFT盗窃中是如何使用网络钓鱼的?

2022-5-16 14:28:03

IDC云库

减少监控噪音的终极指南

2022-5-16 14:46:21

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
客户经理
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索

梦飞科技 - 最新云主机促销服务器租用优惠