华为云服务治理 | ** 服务治理的一般性原则**

服务治理通常是指通过限流、熔断等手段，保障微服务的可靠运行，即运行时治理。更加宽泛的服务治理还包括微服务持续集成（开源软件管理、自动化测试等），微服务部署最佳实践（滚动升级、灰度发布等），微服务可观测性能力（日志、监控、告警等）构建等。

华为云微服务治理专题主要探讨运行时治理。接下来我们探讨故障处理的一般性原则。

故障识别

在用户看来，故障场景和正常场景是非常容易区分的。在服务治理的角度，识别故障则非常困难。

以调用超时为例，产生调用超时的原因非常多，包括：（1）服务端部分接口处理慢，导致超时，而其他接口处理正常；（2）服务端故障，网络不可达，可能是短暂的，也可能是持续的；（3）服务端内存、CPU高，导致处理变慢；（4）大量并发请求在服务端排队，当请求被处理的时候，已经超过了很长的时间；（5）客户端并发建立连接，内存、CPU增高，导致请求握手超时等。这些不同类型的错误，从调用者看起来，都体现为一样的行为。

以错误码为例，服务端返回503错误，也可能包含很多不一样的原因。比如系统未就绪，正在启动过程中，下次重试就可以访问；或者服务出现内存泄漏等原因，导致无法进行响应；当服务内部的一些部件不可用的时候，也可能返回503错误码。

基于上述原因，服务治理能够识别少量的故障类型，而无法识别更细维度的故障原因。

故障反馈

高并发场景下，相对于单个请求处理的时延，故障反馈过程非常缓慢。比如单个请求处理只需要几个毫秒，但是检测到请求超时，至少需要几秒时间。如果减少超时时间，检测就会变得很不准确，通常会由于系统调度延迟，让超时时间出现大范围的波动。而且请求超时会触发一些系统资源，比如HTTP连接的关闭和重建，引起更大范围的超时。再比如依赖于CPU、内存或者请求TPS的监控数据，一般是通过异步线程在后台周期性进行统计实现的，当统计数据反馈到服务治理策略的时候，相比较请求时延，已经过去很长时间了，这个时候再去实施治理策略，得到的反馈数据已经不足以支持治理策略的实施。

服务治理的一般原则

故障识别困难、故障反馈缓慢导致了在故障场景下，不能像处理正常功能逻辑一样，通过复杂的逻辑，比如转移故障、采集更多历史数据计算最优解等保障本次请求尽可能成功。也不能假设一个实际无法模拟验证的故障，然后针对这个故障进行保护。

服务治理策略需要结合大量的实践来进行验证，总结起来有几个非常核心的原则：

· 快速失败优先于保障本次请求成功。通过快速失败降低故障的影响时间，减少故障对于系统资源的占用，让系统能够快速恢复到正常的处理水平。

· 治理策略的逻辑应该采用无状态算法，不依赖于其他微服务或者中间件，只依赖于本服务的内部状态就能够实施，避免依赖于复杂的错误检测机制。这个原则使得服务治理的策略依赖于相对实时的故障数据，减少治理策略本身的处理时间，让治理策略的前提和结果变得更好预测。

· 治理策略的实施条件和结果必须可以通过模拟的方式进行验证。虽然故障识别是非常困难的，但是任何治理策略都需要假设他出现的场景是什么，这个场景发生的时候，故障表现是什么，依赖于故障场景、故障表现来执行治理策略，并且可以评估不同治理策略对同样的故障场景和故障表现得出的保护效果。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

华为

华为

+关注

关注
216

文章
34417

浏览量
251521

租用GPU服务器一般多少钱

租用GPU服务器的费用受到多种因素的影响，包括服务器配置、租用时长、服务提供商以及市场供需状况等。下面，AI部落小编带您了解租用GPU服务器的一般

发表于 11-25 10:28 •177次阅读

HarmonyOS NEXT应用元服务开发Intents Kit（意图框架服务）上架配置指导

击“确定”，若没有找到对应意图可联系华为工程师，检查是否未配置该意图。添加完成后，需录入接口信息配置，具体信息如下： API：即开发者的URL地址信息，供华为侧服务器进行云侧意图调用

发表于 11-12 16:44

租用容器云服务费用高吗？

租用容器云服务费用高吗？租用容器云服务的费用并不是特别高，其费用通常包括基础资源费用、附加服务费用以及其他可能的费用。基础资源费用每月

发表于 10-10 10:54 •147次阅读

服务网格DPU卸载解决方案

服务网格（Service Mesh）是微服务架构中的一种重要技术，它主要处理服务之间的通信，为服务间的信息交换提供更安全、更快速且更可靠的基

发表于 09-20 16:25 •301次阅读

容器云服务价格高吗？容器云服务价格表一览

一般来说，其价格并不是特别高。容器云服务的费用价格高低取决于多种因素，包括服务提供商、所选服务的类型、资源配置、地理位置等。对于

发表于 09-12 10:05 •222次阅读

Proxyless的多活流量和微服务治理

：服务间通信的复杂性：不同服务之间需要进行可靠的通信，处理失败重试、负载均衡等问题。故障的容错处理：系统的复杂性给与运维及故障处理带来更大的挑战，如何快速处理故障解决线上问题，

发表于 08-28 16:54 •1578次阅读

无缝升级云服务，华为云 Flexus X 实例带来零门槛极致体验

随着数字化转型的加速，云计算已成为企业运营的重要基础设施。企业在选择云服务时，会综合考虑成本效益、性能稳定性，以及服务的灵活性和可扩展性。特别是中小企业需要

发表于 08-21 18:03 •651次阅读

日本云服务器多少钱一个月？

一般来说，日本云服务器的月租费用在几十元至数百元不等，具体取决于所选的配置和服务。例如，一些基础配置的日本

发表于 08-16 11:22 •310次阅读

重塑云服务，华为云 Flexus X 实例破解云服务传统难题

服务的局限性也逐步显现，成为阻碍企业发展的障碍。华为云深刻洞察中小企业和开发者在云服务应用中遇到的挑战，推出了创新的

发表于 08-12 09:54 •575次阅读

如何预防云服务器被攻击？

服务器被攻击的应急措施当然，预防总是胜于治理。调查表明，如果遵循网络安全建议，最近频发的WannaCry勒索软件对英国国家医疗服务体系(NHS)的攻击可能得到有效的阻止。为了避免未来的黑客行为，保持警惕

发表于 07-05 11:16 •280次阅读

云计算与企业IT成本治理

时至今日，云计算已逐步替代传统IT中服务器、存储、虚拟化等单体软硬件的IT架构，成为企业IT能力中最重要的组成部分。企业在利用云计算带来的便利、敏捷的同时，也越来越多依靠云计算提供的持

发表于 06-19 09:40 •540次阅读

电能治理篇章：谐波治理产生的源头和治理方法

安科瑞在电力系统中，谐波治理一直是一项重要而复杂的任务。随着电力电子技术的广泛应用和非线性负载的不断增加，谐波问题日益突出，对电网的安全稳定运行和用电设备的正常使用构成了严重威胁。本文将深入探讨

发表于 05-16 14:09 •730次阅读

解析 Sermant 热插拔能力：服务运行时动态挂载 JavaAgent 和插件

一、概述 Sermant 是基于 Java 字节码增强技术的无代理服务网格，其利用 Java 字节码增强技术，为宿主应用程序提供服务治理功能，以解决大规模微

发表于 02-18 10:09 •979次阅读

软通动力成为华为云联合基线解决方案TOP1服务商

近日，软通动力与华为云长期以来的深入合作、深度协作再结硕果，双方共同设计的企业上云服务解决方案、数据中台及数据治理

发表于 01-09 10:59 •802次阅读

中软国际成功上榜信通院《数据治理产业图谱2.0》，全面满足数据治理全链路需求

再次入选产业图谱。 · 中软国际成功上榜三大板块 · · 数据治理产品——数据管理一体化平台 · 数据治理服务商——咨询实施综合类服务 ·

发表于 12-25 19:00 •1369次阅读