如何获取采集服务器Kubernetes监控指标-电子发烧友网

对比

node-exporter用于采集服务器层面的运行指标，包括机器的loadavg、filesystem、meminfo等基础监控，类似于传统主机监控维度的zabbix-agent。

metric-server/heapster是从api-server中获取CPU、内存使用率这种监控指标，并把他们发送给存储后端，如InfluxDB或云厂商，他当前的核心作用是：为HPA等组件提供决策指标支持。

kube-state-metrics关注于获取Kubernetes各种资源的最新状态，如Deployment或者DaemonSet。

例如：

我调度了多少个Replicas？现在可用的有几个？

多少个Pod是running/stopped/terminated状态？

Pod重启了多少次？

我有多少job在运行中？

这些指标都由kube-state-metrics提供。

之所以没有把kube-state-metrics纳入到metric-server的能力中，是因为他们的关注点本质上是不一样的。

metric-server仅仅是获取、格式化现有数据，写入特定的存储，实质上是一个监控系统。

kube-state-metrics是将Kubernetes的运行状况在内存中做了个快照，并且获取新的指标，但他没有能力导出这些指标。

部署metric-server

下载metric-server部署的yaml文件到本地。

wget https://github.com/kubernetes-sigs/metrics-server/releases/download/v0.3.7/components.yaml

拉取metric-server的镜像到本地：

# docker pull zhaoqinchang/metrics-server:0.3.7 0.3.7： Pulling from zhaoqinchang/metrics-server 9ff2acc3204b： Pull complete 9d14b55ff9a0： Pull complete Digest：

sha256:c0efe772bb9e5c289db6cc4bc2002c268507d0226f2a3815f7213e00261c38e9 Status： Downloaded newer image for zhaoqinchang/metrics-server:0.3.7 docker.io/zhaoqinchang/metrics-server:0.3.7

修改components.yaml文件为如下内容：

# cat components.yaml --- apiVersion： rbac.authorization.k8s.io/v1 kind： ClusterRole metadata： name： system:aggregated-metrics-reader labels： rbac.authorization.k8s.io/aggregate-to-view： “true” rbac.authorization.k8s.io/aggregate-to-edit：

“true” rbac.authorization.k8s.io/aggregate-to-admin： “true” rules： - apiGroups：［“metrics.k8s.io”］ resources：［“pods”， “nodes”］ verbs：［“get”， “list”， “watch”］ --- apiVersion： rbac.authorization.k8s.io/v1 kind： ClusterRoleBinding metadata： name： metrics-serverauth-delegator roleRef：

apiGroup： rbac.authorization.k8s.io kind： ClusterRole name： system:auth-delegator subjects： - kind：

ServiceAccount name： metrics-server namespace： kube-system --- apiVersion： rbac.authorization.k8s.io/v1 kind：

RoleBinding metadata： name： metrics-server-auth-reader namespace： kube-system roleRef： apiGroup：

rbac.authorization.k8s.io kind： Role name： extension-apiserver-authentication-reader subjects： - kind：

ServiceAccount name： metrics-server namespace： kube-system --- apiVersion：

apiregistration.k8s.io/v1beta1 kind： APIService metadata： name： v1beta1.metrics.k8s.io spec： service： name： metrics-server namespace： kube-system group： metrics.k8s.io version：

v1beta1 insecureSkipTLSVerify： true groupPriorityMinimum： 100 versionPriority： 100 --- apiVersion：

v1 kind： ServiceAccount metadata： name： metrics-server namespace： kube-system --- apiVersion：

apps/v1 kind： Deployment metadata： name： metrics-server namespace： kube-system labels： k8s-app：

metrics-server spec： selector： matchLabels： k8s-app： metrics-server template： metadata： name： metrics-server labels： k8s-app： metrics-server spec： serviceAccountName： metrics-server volumes： # mount in tmp so we can safely use from-scratch images and/or read-only containers - name：

tmp-dir emptyDir： {} containers： - name： metrics-server image： zhaoqinchang/metrics-server:0.3.7 #修改镜像为刚刚拉取下来的镜像

imagePullPolicy： IfNotPresent args：

- --cert-dir=/tmp - --secure-port=4443 command： #添加以下三行command命令 - /metrics-server - --kubelet-preferred-address-types=InternalIP - --kubelet-insecure-tls ports： - name： main-port containerPort： 4443 protocol：

TCP securityContext： readOnlyRootFilesystem： true runAsNonRoot： true runAsUser： 1000 volumeMounts： - name： tmp-dir mountPath：

/tmp nodeSelector： kubernetes.io/os： linux --- apiVersion： v1 kind： Service metadata： name： metrics-server namespace： kube-system labels： kubernetes.io/name：

“Metrics-server” kubernetes.io/cluster-service： “true” spec： selector： k8s-app： metrics-server ports：

- port： 443 protocol： TCP targetPort： main-port --- apiVersion： rbac.authorization.k8s.io/v1 kind： ClusterRole metadata： name： system:metrics-server rules： - apiGroups： - “” resources： - pods - nodes - nodes/stats - namespaces - configmaps verbs： - get - list - watch --- apiVersion： rbac.authorization.k8s.io/v1 kind： ClusterRoleBinding metadata： name： system:metrics-server roleRef：

apiGroup： rbac.authorization.k8s.io kind： ClusterRole name： system:metrics-server subjects： - kind： ServiceAccount name： metrics-server namespace： kube-system部署metric-server：

# kubectl apply -f components.yaml clusterrole.rbac.authorization.k8s.io/system:aggregated-metrics-reader created clusterrolebinding.rbac.authorization.k8s.io/metrics-serverauth-delegator created

rolebinding.rbac.authorization.k8s.io/metrics-server-auth-reader created

apiservice.apiregistration.k8s.io/v1beta1.metrics.k8s.io created serviceaccount/metrics-server created

deployment.apps/metrics-server created service/metrics-server created

clusterrole.rbac.authorization.k8s.io/system:metrics-server created clusterrolebinding.rbac.authorization.k8s.io/system:metrics-server created

查看metric.k8s.io是否出现在Kubernetes集群的API群组列表中：

# kubectl api-versions | grep metrics metrics.k8s.io/v1beta1

使用

kubectl top命令可显示节点和Pod对象的资源使用信息，它依赖于集群中的资源指标API来收集各项指标数据。它包含有Node和Pod两个子命令，可分别显示Node对象和Pod对象的相关资源占用率。

列出Node资源占用率命令的语法格式为“kubectl top node ［-l label | NAME］”，例如下面显示所有节点的资源占用状况的结果中显示了各节点累计CPU资源占用时长及百分比，以及内容空间占用量及占用比例。必要时，也可以在命令直接给出要查看的特定节点的标识，以及使用标签选择器进行节点过滤。

［root@master metric］# kubectl top nodes NAME CPU（cores） CPU% MEMORY（bytes） MEMORY% master 282m 14% 1902Mi 51% node-02 70m 3% 1371Mi 37% node-03 121m 1% 892Mi 11%

而名称空间级别的Pod对象资源占用率的使用方法会略有不同，使用时，一般应该跟定名称空间及使用标签选择器过滤出目标Pod对象。例如，下面显示kube-system名称空间下的Pod资源使用状况：

［root@master metric］# kubectl top pods -n kube-system NAME CPU（cores） MEMORY（bytes） etcd-master 32m 300Mi kube-apiserver-master 86m 342Mi kube-controller-manager-master 30m 48Mi kube-flannel-ds-l5ghn 5m

10Mi kube-flannel-ds-rqlm2 4m 12Mi kube-flannel-ds-v92r9 4m 14Mi kube-proxy-7vjcv 18m 15Mi kube-proxy-xrz8f 13m 21Mi kube-proxy-zpwn6 1m 14Mi kube-scheduler-master 7m 17Mi metrics-server-5549c7694f-7vb66 2m 14Mi

kubectl top命令为用户提供简洁、快速获取Node对象及Pod对象系统资源占用状况的接口，是集群运行和维护的常用命令之一。

原文链接：https://juejin.cn/post/6996862439560052773

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

服务器

服务器

+关注

关注
12

文章
9342

浏览量
86209
监控系统

监控系统

+关注

关注
21

文章
3949

浏览量
177658

使用 Flexus 云服务器 X 实例部署 Kubernetes 图形化管理平台

Kubernetes 作为当今最流行的容器编排平台，随着云计算、微服务架构和 DevOps 文化的普及，Kubernetes 在自动化部署、扩展和管理容器化应用程序方面扮演着越来越重要的角色。未来

发表于 01-21 16:14 •116次阅读

使用 Flexus 云<b class='flag-5'>服务器</b> X 实例部署 <b class='flag-5'>Kubernetes</b> 图形化管理平台

基于华为云 Flexus X 实例部署 Uptime-Kuma 服务器监控面板

系统来实时掌握服务器的运行状态。在这样的背景下，uptime-kuma 应运而生。uptime-kuma 是一款开源的服务器监控面板，它能够帮助用户实时监控

发表于 01-17 09:42 •360次阅读

基于华为云 Flexus X 实例部署 Uptime-Kuma <b class='flag-5'>服务器</b><b class='flag-5'>监控</b>面板

Flexus 云服务器 X 实例实践：部署 ServerBee 监控工具

引言在当今数字化的时代，服务器的有效监控与管理对于企业和开发者至关重要。华为云作为云计算领域的佼佼者，一直以强大的技术实力和卓越的服务品质著称。其 Flexus 云服务器 X 实例，

发表于 01-14 09:26 •431次阅读

Flexus 云<b class='flag-5'>服务器</b> X 实例实践：部署 ServerBee <b class='flag-5'>监控</b>工具

Flexus 云服务器 X 实例实践：安装 Ward 服务器监控工具

了强大而灵活的计算能力。而在系统运维管理方面，Ward 这一专为 Linux 系统打造的监控工具功能强大，当我们将其安装在华为云 Flexus 云服务器 X 实例上时，又会擦出怎样的火花呢？一、Flexus 云服务器 X 实例

发表于 01-13 15:51 •169次阅读

Flexus 云<b class='flag-5'>服务器</b> X 实例实践：安装 Ward <b class='flag-5'>服务器</b><b class='flag-5'>监控</b>工具

理解云服务器网络指标：关键性能指标

在云计算领域，网络度量对于评估云服务器操作的性能、可靠性和效率至关重要。这些指标提供了对网络服务运行状况和性能的洞察，使管理员能够就资源分配、扩展和优化做出明智的决策。本文将探讨云服务器

发表于 11-11 17:04 •429次阅读

使用zabbix监控云服务器的方法

Zabbix环境在开始监控云服务器之前，你需要准备Zabbix环境。这包括安装Zabbix服务器、Zabbix代理和配置Web界面。 2.1 安装Zabbix服务器 Zabbix

发表于 11-08 10:47 •406次阅读

Kubernetes集群搭建容器云需要几台服务器？

Kubernetes集群搭建容器云需要几台服务器？至少需要4台服务器。搭建容器云所需的服务器数量以及具体的搭建步骤，会根据所选用的技术栈、业务规模、架构设计以及安全需求等因素而有所不同

发表于 10-21 10:06 •218次阅读

独立服务器与云服务器的区别

随着互联网技术的飞速发展，企业对于服务器的需求日益增加，而服务器市场也随之出现了多种类型的产品，其中最常见的是独立服务器和云服务器。这两种服务器

发表于 10-12 14:34 •352次阅读

如何在阿里ECS服务器上架设自己的OpenVPN服务器？

需要自己架设服务器，让现场的IR615路由器连接自己的服务器。能通过自己的服务器进行数据采集和远程运维。

发表于 07-25 06:14

如何获取DNS服务器IP？

当ESP8266在 STA 模式下连接时，访问分配给 DHCP 客户端的 DNS 服务器地址将非常有用。理想情况下，这些地址要么通过 wifi_get_ip_info 在ip_info结构中返回，要么通过专用 API（例如 espconn_dns_getserver）返回。

发表于 07-11 06:15

云服务器和虚拟服务器的区别是什么

云服务器和虚拟服务器是两种常见的服务器类型，它们在很多方面有相似之处，但也有一些关键的区别。本文将详细介绍云服务器和虚拟服务器的区别，包括它

发表于 07-02 09:48 •968次阅读

　K8S学习教程一:使用PetaExpress云服务器安装Minikube 集群

使得开发人员能够在本地机器上轻松创建一个单节点的 Kubernetes 集群，从而方便开发、测试和学习 Kubernetes。我们看下如何使用PetaExpress云服务器安装Minikube 集群

发表于 07-01 15:41 •430次阅读

京准科技、大数据监控网络里的NTP时钟同步服务器应用

京准科技、大数据网络监控系统里的NTP时钟同步服务器应用

发表于 06-06 14:15 •373次阅读

云服务器监控完整指南

运行混合云环境时。下面，恒讯科技小编我给大家介绍下云服务器监控完整指南。一、什么是云服务器监控？我们应该根据既定的自定义指标持续

发表于 03-20 17:19 •478次阅读

linux服务器和windows服务器

Linux服务器和Windows服务器是目前应用最广泛的两种服务器操作系统。两者各有优劣，也适用于不同的应用场景。本文将对Linux服务器和Windows

发表于 02-22 15:46

搜索历史

如何获取采集服务器Kubernetes监控指标

评论

使用 Flexus 云服务器 X 实例部署 Kubernetes 图形化管理平台

基于华为云 Flexus X 实例部署 Uptime-Kuma 服务器监控面板

Flexus 云服务器 X 实例实践：部署 ServerBee 监控工具

Flexus 云服务器 X 实例实践：安装 Ward 服务器监控工具

理解云服务器网络指标：关键性能指标

使用zabbix监控云服务器的方法

Kubernetes集群搭建容器云需要几台服务器？

独立服务器与云服务器的区别

如何在阿里ECS服务器上架设自己的OpenVPN服务器？

如何获取DNS服务器IP？

云服务器和虚拟服务器的区别是什么

K8S学习教程一:使用PetaExpress云服务器安装Minikube 集群

京准科技、大数据监控网络里的NTP时钟同步服务器应用

云服务器监控完整指南

linux服务器和windows服务器