部署普罗米修斯(Prometheus)监控平台前需考虑的六大因素-电子发烧友网

企业在采用容器的同时，也将容器的监控问题放在了比较优先的位置上，不少企业使用普罗米修斯（Prometheus）监控容器和微服务，对于规模企业通常会更加激进，所以当他们规模部署时将面临扩展的挑战。

容器使情况复杂化

监控整体环境过去相对简单，企业具有一定数量的静态物理服务器和虚拟机，以及数量有限的指标。现在由于容器以及向微服务架构的迁移，要跟踪的实体数量激增。

容器的数量不断增加，有时每台机器上有数百台，而新的机器也在增加，并且与Kubernetes等编排工具一起使用时，使得容器的寿命可能非常短，使得跟踪它们变得更加困难，并且如果不小心的话，它们可能会造成很多问题。

随着环境的复杂性和分布的增加，需要监控的实体数量也在增加。此外，你可能希望监控更多属性，来确保对所发生的事情有准确的了解，或者在进行故障排除或事件响应的情况下，可以了解所发生的事。在这些短暂的环境中，故障的排除尤其成问题，因为当你想了解问题的根本原因时，通常有问题的资源已经停用，这意味着监控解决方案必须提供一种存储足够的历史记录来进行取证的方法。

Prometheus

当需要进行云监控时，IT团队越来越多地倾向于Prometheus，它是由云原生计算基金会开源的项目。Prometheus已成为开发人员在云原生环境中收集和理解指标的首选监控工具。它由一个大型社区支持，有超过700多家企业贡献者。

默认情况下，典型的云原生应用程序堆栈（例如Kubernetes，Ngnix，MongoDB，Kafka和golang）会公开Prometheus指标。Prometheus被设计为可垂直缩放的Go程序。例如，将其轻松部署为单个容器或单个主机。这意味着从Prometheus入门很容易就能了解你的Kubernetes集群。但这也意味着随着基础架构的增长，监控规模也面临极限的挑战。

规模问题

随着环境的发展，需要跟踪的时间序列数据数量激增，在某个特定点上，单个Prometheus实例将无法跟上。直接的选择是在整个企业中运行一批Prometheus服务器，但这也带来了一些挑战。例如，管理和联合数十或数百个Prometheus服务器上的数据并不容易。类似地，确定企业工作流、单点登录、基于角色的访问控制以及遵守SLA或遵从性也不是容易的问题。随着应用程序的增长，在不中断开发人员工作的情况下操作一个包罗万象的监控解决方案将成为一个巨大的可管理性和可靠性问题。

为了解决这个问题，企业采用了一些方法。

简单的第一步是为每个名称空间或每个集群使用单独的Prometheus服务器。这种方法显然很难扩展到某个特定的点，除此之外，它还有创建大量断开连接的数据孤岛的缺点。这使得故障排除变得很麻烦，因为大多数问题将跨越多个服务/团队/集群。不仅很难在每个环境中找到相同的度量标准，而且还必须将数据结合起来，试图理解正在发生的事情。

另一种常见的方法是使用如Cortex或thanos等开源工具来联合多个Prometheus服务器。它们是功能强大的工具，能够以集中的方式查询服务器，收集数据，然后在单个仪表板中共享数据。然而，与任何数据密集型分布式系统一样，它们需要大量的技能和资源来操作。

要考虑的六个因素

对于那些从Prometheus开始，然后寻找商业解决方案来提供整体监控的企业来说，重要的是不要失去所有在Prometheus标准化的开发工作，如仪表盘、警报等工作。然而，这不是你应该考虑的唯一，下面的这些因素或许对你有帮助。

1. 兼容性，支持所有Prometheus功能

企业选择的云供应商、工具或SaaS解决方案需要能够使用任何可产生Prometheus指标的数据，无论是本地Kubernetes还是任何的云服务。Prometheus指标相对来说比较琐碎，但不要忽略一些小事情，例如将指标提取到存储中或扩充数据时能够重新标注指标，这样对环境更加有意义。这些事情叠加，在使用大量收集的数据方面会产生很大的不同。

2. PromQL兼容性

Prometheus查询语言用于提取Prometheus存储的信息。PromQL能够询问有关指标，例如特定服务或特定用户。它还允许聚合或分段数据，例如可以使用它在应用程序基础上显示所有容器的CPU利用率，或者仅显示Cassandra容器的数据，并将其显示为每个集群的单个值。所以，PromQL解锁了Prometheus的真正价值;因此，在不完全支持PromQL的产品中加入Prometheus度量标准会破坏使用Prometheus的目的。

3. 热插拔

要真正与Prometheus兼容，解决方案必须是可热插拔的，以便能够与现有的仪表板、警报和脚本一起工作。例如，许多使用Prometheus的企业使用Grafana作为仪表盘。这个开源工具与Prometheus很好地集成在一起，包括在查询级别，并且可以用于生成一系列有用的图表和指示板。因此，那些声称与Prometheus兼容的商业产品应该与Grafana这样的工具兼容。仅仅说解决方案可以在Grafana中查看数字是不够的。需要能够按原样提取现有的Grafana仪表板，并将它们重新应用于商业解决方案中的数据。

4. 访问控制

访问控制是评估工具时应该考虑的另一个安全问题。通过使用行业标准协议（包括LDAP、谷歌Oauth、SAML和OpenID）来确保用户身份验证的安全，企业能够通过基于服务的访问控制来隔离和保护资源。

5. 故障排除

Kubernetes简化了容器化应用程序和微服务的部署、伸缩和管理。这有助于保持服务的正常运行，但是要识别和解决底层问题，比如性能下降、失败的部署和连接错误，需要能够收集和可视化来自生产环境的深入基础设施、应用程序和性能数据。不能同时访问实时信息和上下文数据，就几乎不可能在环境中关联度量，从而更快地解决问题。

6. 现有警报的兼容性

最后，如果你正在寻找一个商业答案来帮助解决Prometheus可伸缩性问题，请确保它支持所有级别的警报。实现这一点的关键是完全支持警报管理器功能，这反过来需要100%的和PromQL兼容性。
责编AJX

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

平台

平台

+关注

关注
1

文章
199

浏览量
23588
云计算

云计算

+关注

关注
39

文章
7709

浏览量
137145
监控系统

监控系统

+关注

关注
21

文章
3852

浏览量
173458

普罗米修斯的火种以色列创新技术和IoT领域专家引到中国创新之都深圳

创新如同普罗米修斯的火种，为人类文明的延续与发展燃起了希望之光。不论是曾震惊世界的中国古代四大发明、诞生于美国硅谷的第一台可编程计算机，还是令沙漠开出花朵的以色列滴灌技术，都体现出了人类在不同时期

发表于 11-27 15:29 •1.8w次阅读

速腾聚创首次发布LiDAR算法六大模块助力自动驾驶

、车道标识线检测、障碍物检测、动态物体跟踪、障碍物分类识别等六大功能模块，有助于自动驾驶车辆立刻获得LiDAR感知能力。今年4月份，速腾聚创宣布启动“普罗米修斯”计划，致力于向合作伙伴提供一系列软硬件

发表于 10-13 16:08

即插即用的自动驾驶LiDAR感知算法盒子 RS-Box

"高精度定位、障碍物识别、动态物体跟踪、车道线检查......"你的智能汽车准备好升级L3级别以上的LiDAR算法方案了吗？今年4月份，速腾聚创推出「普罗米修斯」计划。该计划承诺

发表于 12-15 14:20

人工智能的神奇复活

了青春，引发了新一轮研究，例如，公开抓物演示，引起了对机器人的恐惧潮，使得人们重新思考系统设计的某些门类。图1. 就像“现代普罗米修斯”中的怪物，AI通过对早期概念的修修补补看起来又复活了。

发表于 07-16 09:00

prometheus做监控服务的整个流程介绍

一定的格式，不然Prometheus也是无法识别的，这个格式就是 Metrics 格式.{=, ...}主要分为三个部分各个部分需符合相关的正则表达式metric name：指标的名称，主要反映被监控

发表于 12-23 17:34

普罗米修斯芯片布局

发表于 02-16 17:48 •16次下载

电解液行业的普罗米修斯什么时候会降临？

受益新能源车高速发展，电解液未来需求增速高，或将逐渐呈现成长性。预计到2020 年，国内锂电池需求量有望达到153GWh，对应电解液需求量22.7 万吨。

发表于 07-11 10:37 •2930次阅读

数字货币交易平台“IX”能做些什么？

lX是全球首家支持比特币作为平台权益证明的交易所，持有比特币的平台用户，按照在平台。上的比特币持有比例分配平台的部分收入。比特币就是区块链世界的普罗

发表于 09-25 10:55 •6237次阅读

中通最新油电混合无人机完成首飞

12月7日，中通快递最新发布的普罗米修斯1600A油电合物流无人机在国家级贫困县陕西旬阳完成山区恶劣天气条件下首次载货飞行。

发表于 12-12 10:58 •4171次阅读

小度在家体验代表了旗舰标杆的水准

5月底百度推出了普罗米修斯计划—小度校园Open Day活动开始在全国范围内展开，全年计划走访6大城市的10余所高校，同时选拔高校学子作为小度在家的体验官。

发表于 04-12 11:04 •2357次阅读

AI在医疗领域的潜力露出冰山一角心血管领域痛点问题或能解决

电影《普罗米修斯》中有一个桥段，女主通过全自动手术机器人取出寄生在体内的外星生物。电影展现的医疗AI，给我们带来了强烈的视觉震撼与对未来无限的遐想！或许某一天电影中的情节能够实现。

发表于 03-27 10:31 •2145次阅读

1G空白、2G跟随、3G参与、4G追赶,5G同步!中国移动通信发展史

在这场如普罗米修斯为人间盗火一般的时刻里，中国的有志之士第一次和西方同仁站在了同一起跑线上。

发表于 03-28 16:17 •1.9w次阅读

从仿象到仿真，什么才是真实的世界？

纵观人类文明史，可以说，技术的发展与人的生存相伴相生。早在古希腊时代，就有柏拉图对于“爱比米修斯造人”的技术源发性意义的思考。而普罗米修斯为人类盗来的技术与火种正是人类得以超越自身“缺

发表于 10-08 14:00 •1771次阅读

网龙子公司普罗米休斯推出ActivPanel LX

其全球领先的课堂技术子公司普罗米休斯，推出一款价格较低的互动平板ActivPanel LX，为客户提供更优越的易用性及灵活性功能，同时保证产品的质量和使用寿命。随着这一新产品的推出，普罗米休斯

发表于 05-05 06:56 •457次阅读

普罗米修斯：接近完美的监控系统

普罗米修斯(Prometheus)是一个SoundCloud公司开源的监控系统。当年，由于SoundCloud公司生产了太多的服务，传统的监控已经无法满足

发表于 10-17 11:44 •2260次阅读

搜索历史

部署普罗米修斯(Prometheus)监控平台前需考虑的六大因素

评论

普罗米修斯的火种以色列创新技术和IoT领域专家引到中国创新之都深圳

速腾聚创首次发布LiDAR算法六大模块助力自动驾驶

即插即用的自动驾驶LiDAR感知算法盒子 RS-Box

人工智能的神奇复活

prometheus做监控服务的整个流程介绍

普罗米修斯芯片布局

电解液行业的普罗米修斯什么时候会降临？

数字货币交易平台“IX”能做些什么？

中通最新油电混合无人机完成首飞

小度在家体验代表了旗舰标杆的水准

AI在医疗领域的潜力露出冰山一角心血管领域痛点问题或能解决

1G空白、2G跟随、3G参与、4G追赶,5G同步!中国移动通信发展史

从仿象到仿真，什么才是真实的世界？

网龙子公司普罗米休斯推出ActivPanel LX

普罗米修斯：接近完美的监控系统