现在,组织比以往任何时候都更倾向于向云迁移。随着IT的不同领域(包括存储、应用和网络)向云转移,IT专业人员正在使用基于云的监控工具来评估其内部和外部基础架构的性能。
这迁移到云有必要为云环境开发高级性能工具。云监控工具可帮助组织管理其IT基础架构,而不管其部署在何处。同时,基于云的网络监控可以帮助组织管理其内部网络基础设施。
工具因供应商产品和网络位置而异。企业应该评估不同类型的云监控工具,以确定哪种工具最适合他们的组织。
云网络监控工具的类型
有不同类型的云监控工具可用,但它们都侧重于管理和评估云基础架构和应用程序的运行状况和性能。其中一些工具还可以管理内部或混合网络,将内部数据中心与云服务相集成。
相比之下,基于云的网络监控工具通常托管在云中,支持内部和云网络的管理。这包括监控网络流量、性能和连接性。
比较传统的云监控和基于云的网络监控。基于云的网络监控工具的特性
基于云的网络监控工具以不同的方式观察内部网络,具体取决于工具。每个监控工具都通过仪表板提供对运营的洞察,但提供的指标和分析各不相同。然而,它们都提供了相同的核心功能,适合基于云的网络监控类别。
典型的基于云的网络监控工具的功能集包括以下内容:
- 实时分析。测量和分析网络中各种来源的数据指标,以提供有关网络性能和行为的详细信息。
- 可观察性。监控网络运行状况,以便深入了解网络基础设施及其应用。
- 发出警报。跟踪网络性能,并在出现问题时向团队发出警报,以便组织能够主动管理停机和事件。
- 自动化。提供自动化网络监控并执行重复性任务以节省时间。
4个基于云的网络监控工具
许多供应商已经发布了基于云的网络监控工具,这些工具提供了跨组织的互连系统的网络操作的详细视图。以下概述介绍了一些基于云的网络监控工具,并评估了它们的特性和主要差异。
该概述基于对可用产品、供应商文档和最近行业报告的研究。以下工具按字母顺序列出,没有排名:
- 数据狗。
- Dynatrace。
- 格拉夫纳。
- Splunk。
数据狗
Datadog是一个位于SaaS的基础设施监控和安全平台。Datadog成立于2010年,为现代IT环境提供可观察性,专注于云计算服务、应用程序和基础架构的监控和分析。
Datadog的服务优化了云、混合和内部网络环境,提供了对网络环境每一层的可见性,而不受部署位置的影响。该平台集成了网络配置管理为团队提供网络运行集中视图的工具。
Datadog提供了一种统一的方法来解决监控、记录和可追溯性问题,同时缩短了解决问题的平均时间。它提供仪表板,使团队能够监控网络,提供详细的地图来直观显示性能,提供指标来分析数据库操作,并提供警报来识别事件以进行主动管理。
Datadog在详细和汇总级别监控网络操作。其特征包括以下内容:
- AI日志分析。定位和识别异常并提供纠正措施。
- 调试工具。识别并解决问题。
- 安全设施。持续监控软件堆栈,以便在问题出现之前发现问题。
Datadog平台与主要云提供商的监控工具相接口,如AWS、Google Cloud和Microsoft Azure。它还可以与各种供应商环境集成,如OpenStax、Red Hat OpenShift和VMware。
Datadog免费为多达五台主机提供基本功能。对于需要超过五台主机或更高级别的功能的网络,该平台按主机收费。费用从每月15美元到34美元不等,具体取决于层级模型。
Dynatrace
Dynatrace成立于2005年,是一个云观察平台,提供分析、自动化和安全功能,帮助管理员优化其基础架构和应用程序。它提供了跨所有部署环境的可见性,包括公共云和私有云、混合基础架构和内部网络。
Dynatrace Managed是Dynatrace平台的自托管SaaS版本,设计用于内部或私有云部署。它在本地存储数据,并提供数据中心分析等功能。组织可以将Dynatrace OneAgent直接安装到他们想要管理的每台主机上。然后,OneAgent从每台主机收集性能指标,并使用高级分析和自动化功能进行管理。在网络运营方面,OneAgent确保跨网络的通信,并提供数据来帮助团队监控网络容量、评估运行状况和了解网络拓扑.
Dynatrace功能包括以下内容:
- 分析和可观察性。收集和分析整个基础架构中来自多个来源的数据,以提供详细的性能洞察。
- 安全。检测基础架构和应用安全威胁,并提供关于真实和潜在事件的分析。
- 自动化。自动化威胁响应和数字化转型。
- 戴维斯·艾。使用专有人工智能进行根本原因分析,并在问题影响员工和客户之前找到并纠正问题。
Dynatrace集成了亚马逊、谷歌和Azure以及红帽OpenShift、OpenStack、甲骨文云等软件平台。Dynatrace为堆栈的每一层提供了统一的视图,并提供了跨云和内部系统的视图。
Dynatrace提供多种定价模式,根据监控的规模和持续时间按主机收费。所有型号都提供对服务和产品功能的全平台访问。
格拉夫纳
Grafana是一个可观察性平台,在一个统一的仪表板中包含可见性工具。Grafana实验室在2014年发布了Grafana作为开源云监控平台。该公司后来发布了该平台的两个商业版本:Grafana Cloud和Grafana Enterprise。拥有内部数据中心的组织可以使用后一种方法来监控其网络。
Grafana Enterprise与其他平台集成,从外部来源收集数据。其中包括基于云的监控平台,如Datadog和Dynatrace,以及AWS、Azure和Google等云提供商。
Grafana Enterprise提供了高级功能,可通过Prometheus和Splunk等工具提供数据可观察性和编译指标。仪表板可帮助用户跟踪洞察、创建报告和实施安全策略。它还支持数据库插件,并提供用户支持功能。
Grafana企业功能包括以下内容:
- 高级报告。生成PDF格式的数据报告,并记录查询以确定趋势。
- 门禁。使用户能够实施权限以允许某些用户访问数据。
- 安全。允许用户将数据访问权限限制在特定用户,并审核数据以防止潜在威胁并保持合规性。
Grafana Enterprise的成本取决于用户和集成的数量以及所需的层级模型等因素。对Grafana Enterprise感兴趣的组织必须直接联系Grafana,以获得其特定网络的报价。
Splunk
Splunk于2004年首次发布,是一个数据观察平台,最初旨在整合和分析孤立的数据。这项服务已经发展成为一个全面的基于云的可观测性平台。思科完成了对Splunk的收购2024年3月,将Splunk的分析和观察能力添加到其产品组合中。
有两种Splunk平台可用:Splunk云和Splunk Enterprise。虽然两者都是云监控平台,但Splunk Cloud适用于在云环境中有工作负载的组织,而Splunk Enterprise部署在内部。组织将Splunk Enterprise安装到其内部设备上,并能够监控其整个基础架构。
Splunk云和Splunk Enterprise提供了几乎相同的特性和功能,但是Splunk Enterprise由于其内部部署而为组织提供了更多的管理控制。
Splunk企业功能包括以下内容:
- 仪表板和可视化。包括多个定制的仪表板和图表可视化,具有提供数据可观察性的指标。
- 监控和警报功能。提供对基础架构的持续监控,并向用户发出事件警报,让他们了解运营状态。
- 报告和指标。支持创建仪表板中使用的实时报告。
Splunk的费用取决于所选择的计划。Splunk计划按工作负载或数据量、服务或使用的主机数量收费。对Splunk感兴趣的组织必须首先决定他们想要部署哪种类型的计划,以获得准确的估计。
3个云监控工具
网络操作可以存在于云环境中。在云中具有网络工作负载或具有公共云服务的内部基础架构的组织也可以使用云监控工具。
公共云提供商提供的常见监控平台包括:
- 亚马逊云手表。
- 谷歌云监控。
- 微软Azure监视器。
每个云监控平台提供大致相同的功能,但只对订阅了相应云服务的用户可用。除了生成详细的日志并提供搜索每条记录的方法之外,它们都包含了能够详细了解网络操作的工具。它们还包括监控内部运营并提供云性能指标的软件。
每个云服务都可以查看外部云或内部环境中的操作,并可以管理与这些系统上的组件交互的应用程序。它们提供关于CPU使用和磁盘活动的信息,并提供设置触发警报的级别的方法,这些警报可以通知某人或改变性能参数。云管理员可以使用这些服务来改变分配的内存量,并衡量其对性能的影响。
然而,云服务在价格上确实有所不同。
亚马逊云观察
亚马逊CloudWatch是AWS的监控服务部分。亚马逊CloudWatch没有固定费用,但它有一个层级,其中包括一组在前12个月免费的指标。需要超出免费信息限制的信息的用户每月付费,通常是每千兆字节(GB)付费。
亚马逊CloudWatch功能包括以下内容:
- 网络监控。监控网络性能并收集指标,以提供网络运行状况的可见性并识别潜在问题。
- 日志和指标。记录高达5 GB的数据,并提供监控指标。
- 数据库洞察。将来自各种资源的数据日志和指标合并到一个控制面板中。在免费层下,用户最多可以拥有三个自定义控制面板,每个控制面板有50个指标。
在第一个12个月之后,亚马逊CloudWatch提供了一组额外的指标,每月继续免费。免费的功能集足以满足一些用户的需求,因此他们可以继续免费使用该平台。
谷歌云监控
谷歌云监控是整个谷歌云平台的一部分。云管理员可以在Google Cloud Monitoring中管理配置,除了应用程序处理的成本之外,不需要额外的成本。基本指标——如谷歌云指标、GKE企业指标和谷歌Kubernetes系统指标——是免费的,但每月每GB的专业服务收费。
组织可以使用网络智能中心,另一个谷歌云平台服务,以及谷歌云监控。网络智能中心在一个控制台中包括五个模块,所有模块都旨在实现网络可观察性、监控和故障排除。
网络智能中心的功能包括:
- 网络拓扑。可视化云网络拓扑及其指标。
- 性能仪表板。识别经历过数据包丢失或延迟的云网络区域。
- 网络分析仪。监控网络以提供网络服务洞察、潜在问题和最佳实践.
将网络情报中心与谷歌云监控集成的成本取决于一个组织使用多少平台。有些功能是免费的,而有些则根据使用的资源数量收费。组织应检查定价详细信息,以获得服务的定价估计。
Microsoft Azure Monitor
微软Azure Monitor是微软Azure云服务的监控工具。Azure Monitor收集和分析云和内部网络的应用程序和性能数据。它免费提供基本指标、日志和见解。但是,需要自定义指标的用户必须根据处理完成的地理位置,每月为每GB的额外功能付费。
组织还可以将Azure Monitor与Azure Network Watcher集成,后者是用于监控网络和查看指标的网络监控平台。Azure Network Watcher包括一系列工具,帮助组织管理他们的云或混合网络并对其进行故障排除。
Azure网络观察器功能包括:
- 网络监控。提供拓扑工具来准备网络的可视化和连接监视器,以确保云服务和混合端点之间的连接。
- 网络诊断。包括一系列诊断工具(如IP流验证、连接故障排除和数据包捕获)来识别和修复网络问题。
- 交通可视化。向以下人员提供流量日志和流量分析可视化网络流量.
与Azure Monitor类似,Azure Network Watcher免费提供有限的GB分配。一旦用户达到这一阈值,他们就要为每增加一个GB的容量按月付费,价格根据功能的不同而不同。计划将Azure Monitor与Azure Network Watcher结合使用的组织必须联系销售团队,以更准确地估计管理其网络环境的服务成本。
网络的云监控考虑事项
大多数公司已经将部分或全部处理转移到了云上,这使他们能够为其工作负载部署云监控工具。那些还没有将基于云的网络监控工具放在云上的公司。这些服务通常更容易部署更加经济高效。它们为组织提供了有关其网络环境的实时数据,同时具有更好的可访问性和可扩展性等优势。
对云感兴趣的组织应该仔细检查所有类型的云监控服务。在网络中实施云监控工具之前,考虑每家公司的全部能力。