KubeCon + CloudNativeCon + Open Source Summit China 2021 —— 年度最顶级的云原生开源技术峰会要来了!
可不要被这“超长”的大会名称吓到。四年前,Linux 基金会正式宣布将旗下的 LinuxCon + ContainerCon + CloudOpen 大会升级为 Open Source Summit (开源技术峰会),同时与 CNCF 主办的 KubeCon + CloudNativeCon 大会合并 —— 由此,“三会合一”的 KubeCon + CloudNativeCon + Open Source Summit 成为了云原生与开源软件领域最富盛名的技术盛会。
自 2018 年首次落地中国以来,历年的 KubeCon + CloudNativeCon + Open Source Summit China 都得到了国内外众多 IT 巨头的鼎力支持,汇聚了全球最活跃的开源云原生社区、最先进的技术代表与行业的最佳落地实践,推动云原生计算领域的知识更新和技术进步。除了聚焦行业发展方向的精彩主题演讲以外,广大开发者们最关心的云原生前沿技术革新与最新落地实践都将在各大专题论坛中一一呈现。大会专题论坛涵盖云基础设施、可观察性、存储、定制和扩展 Kubernetes、性能、服务网格、无服务器、容器运行时、CI/CD、网络等云原生与开源技术细分领域,将为开发者们带来近百场云原生技术干货分享。下面就让我们来看看本届大会上有哪些精彩的技术议题:
云基础设施 | Cloud Infrastructure
本专题将与大家深入探讨支撑云原生技术背后的基础设施建设,包括混沌工程、边缘计算基础设施、基于 RISC-V 的云原生平台搭建等。
Cwen Yin,PingCAP
议题:Chaos Mesh 2.0:让混沌工程更为简单 | Chaos Mesh 2.0: Make Chaos Engineering Easy - Cwen Yin, PingCAP
时间:12 月 10 日,11:20-11:55
简介:混沌工程是一种通过模拟例外或破坏性条件来测试生产软件系统稳健性的方法。然而,对于许多人来说,从学习混沌工程到在自己的系统上着手实践的转变是令人怯步的。在本会话中,Cwen Yin 将分享 Chaos Mesh,一个开源的云原生混沌工程平台,在使混沌工程更为简单的目标下是如何实施和发展的。他还将介绍 Chaos Mesh 2.0 GA 版本的特性,如何使用它来快速地做第一个混沌实验,以及如何将混沌实验集成到自己的系统中。
Yanjun Chen,China Mobile
议题:中国移动 5G 边缘计算开源实践与思考 | China Mobile 5G Edge Computing Open Source Practice and thinking - Yanjun Chen, China Mobile
时间:12 月 10 日,12:10-12:45
简介:本文将介绍中国移动在 CNCF 等开源项目基础上构建边缘计算生态系统相关的实践和思考。同时,本演讲还将分享中国移动最好的 5G MEC 应用案例之一,即 5G 边缘计算 + 区块链的实施。就详细内容而言,本演讲将分享中国移动的 5G 边缘计算产品如何与 CNCF 项目等开源项目相结合的最新实践。还将介绍的另一关键内容是网络运营商在边缘计算开源方面的工作经验及 LF 社区的未来思考。另外,本演讲还将展示一个边缘计算用例,即 5G 边缘计算 + 区块链,以更好地赋能 5G 垂直行业。
议题:RISC-V:来自源码的 Kubernetes 工具栈 | RISC-V: Kubernetes Toolstack From Source - Xingyou Chen, The Linux Foundation APAC时间:12 月 10 日,13:15-13:50
简介:本演讲将介绍为一个不受官方支持的平台搭建 Golang、docker、Kubernetes 的过程。观众可以学习到如何让自定义平台运行 Kubernetes。
可观察性 | Observability
可观察性(Observability)概念最初诞生于工业领域,随后被引入软件开发领域,尤其是在云原生开发领域尤为重要。无论是在敏捷开发,还是 DevOps 流程中,它可以帮助运维团队在关键事件中尽早发现问题、进行控制并发出警告,更有效地查找出问题的根源,获得实时反馈,更快地采取措施修复事件,避免问题再次出现。本专题将分享可观察性技术在 Kubernetes 系统中的最佳实践。
Arsh Sharma,VMware
议题:更新的 “Hitchhiker "指南对 Kubernetes 的评估依赖性 | The Hitchhiker's Guide to Evaluating Dependency Updates to Kubernetes - Arsh Sharma, VMware
时间:12 月 10 日,11:20-11:55
简介:本次演讲将讨论在 Kubernetes 这样的大型项目中跟踪依赖关系的重要性,以及“depstat”,这是一个为跟踪 Kubernetes 代码库的依赖关系更新而创建的工具。Depstat 是一个上游项目,用于分析 go 模块支持的项目的依赖关系。它目前作为 Kubernetes 代码库中 prow 作业的一部分运行,并提供四个关键的依赖关系相关指标。“depstat”还提供了通过创建图形直观分析依赖关系的能力。
Ethan Gao,Intel
议题:利用智能运维 (AIOps) 对云基础设施进行智能分析 | Intelligent Analysis on Cloud Infrastructure With AIOps - Ethan Gao, Intel & Pang Liye, Inspur
时间:12 月 10 日,12:10-12:45
简介:对云本地基础设施和工作负载进行监视和观测的遥测技术是云服务的必要基础,而收集到的遥测数据大多是时间序列公式。由于海量历史/实时遥测数据的高维度和高容量,以及大规模云基础设施和分布式微服务需要通过传统方法处理,因此其效率通常较低。本课程将回顾管理/操作云基础设施和微服务的传统方式的现状和挑战,并将人工智能与转换和机器学习算法相比较,在这些遥测数据上引入人工智能,以实现云基础设施/工作负载管理和操作的更多智能,如异常检测,资源预测、故障检测、根本原因分析等。具体来说,使用 Chronos 为智能运维接入云基础设施/服务铺平道路。
存储 | Storage
存储能力是计算机软件技术发展各个阶段都要面临的问题。在数据量如此庞大的当下,以 Kubernetes 为核心的云原生基础设施如何处理海量数据存储?本专题将着重探讨这一问题。
Jie Chu,Shanghai Pudong Development Bank
Qingqing Shao,Shanghai Pudong Development Bank
议题:在上海浦东发展银行探索云原生大数据平台 | Exploring Cloud Native Big Data Platform in SPDB - Jie Chu & Qingqing Shao, Shanghai Pudong Development Bank
时间:12 月 10 日,12:10-12:45
简介:在中国,采用金融科技 (FinTech) 已成为金融业的全行业共识。上海浦东发展银行一直在其大数据平台上部署越来越复杂的业务工作负载,其中的数据容量每天都在以拍字节增加。面对这样的挑战,上海浦东发展银行利用云原生技术重组其传统数据分析中台,提升了上下游用户体验,促进了商业银行服务的数字化转型。本议题将基于浦发银行云原生 IT 架构实践介绍:1.在 Kubernetes 上构建金融产业级容器化大数据平台,为用户提供各种计算服务。2.采用 Piraeus 存储技术,为数据应用提供持久卷,高效利用本地存储介质以实现高可用性、动态卷供应和智能调度。3.Hive 和 Impala 的横向扩展计算执行器4.将上海浦东发展银行内部的大数据应用的容器化操作标准化。
Xing Yang, VMware
议题:为有状态工作负载保持持久卷的健康性 | Keep Persistent Volumes Healthy for Stateful Workloads - Xing Yang, VMware & Yuquan Ren, ByteDance
时间:12 月 10 日,13:15-13:50
简介:越来越多的有状态工作负载已被迁移至 Kubernetes 平台。这些工作负载依靠持久卷来储存数据。然而,在有状态工作负载配置卷并予以使用后,底层储存系统可能会发生很多情况。该卷可能会因意外被删除、该卷所在的磁盘可能会发生故障、磁盘可能会持续退化影响其性能等。Kubernetes 如何及早发现这些问题并提醒用户?Kubernetes 引入了卷健康监测功能,以发现这些存储问题,并通过发送事件信息将这些问题公开给用户。虽然这种方式很有用,但是需要用户手动修复这些问题。如果 Kubernetes 侦测到卷异常情况后也有方法进行自动修正呢?在此次讨论中,我们将讨论目前卷健康监测功能有何作用,以及我们正在做哪些努力以将此功能提升至下一层次?
定制和扩展Kubernetes| Customizing+Extending Kubernetes
Kubernetes 快速成为云原生开发领域的基础设施事实标准,离不开其超强的可扩展性。基于原生 Kubernetes 已经衍生出了众多适用于不同特定场景的容器集群管理系统,不断扩展 Kubernetes 生态的边界。本专题将带领开发者们一览那些基于 Kubernetes 扩展的开源项目,并分享它们在跨集群管理、边缘计算、大规模 AI 计算、流媒体工作负载等特定场景下的最佳落地实践。
议题:Apiserver 生成器:通过聚合 Apiserver 扩展 Kubernetes 系统 | Apiserver Builder: Extending Kubernetes via Aggregated Apiserver - Min Kim, Ant Group
时间:12 月 9 日,11:20-11:55
简介:目前有两种可插拔的方式来扩展集群的自定义 Kubernetes 应用程序接口:自定义资源定义(也被称为 CRD)和 Apiserver 聚合(也被称为 AA)。经过多年的发展,自定义资源定义 (CRD) 现在在几个版本的 GA 阶段处于稳定工作状态,但另一方面,我们可能会发现自定义资源定义由于可扩展性有限,并不总是最佳选择——例如,我们将不得不引入多个网络钩子 apiservers,以便在新的资源类型上建立准入/转换。或者,为了保持良好的兼容性,在多个版本之间切换可能在技术上很困难。因此,如果我们希望以编码复杂度为代价实现软件开发工具包框架级的扩展,我们可以将 Apiserver 聚合作为自定义资源定义的替代方案。我作为这个特定的官方 SIG 子项目的维护者已经 3 年多了,我将通过一个名为 apiserver-builder 的强大命令行工具,与观众分享构建您自己的聚合 apiserver 的实用方法。
Shao Qiang,Intel
议题:扩展 OpenYurt 用于视频分析工作负载的端到端部署 | Extending OpenYurt for End-to-End Deployment of Video Analytics Workloads - Shao Qiang & Linda Yu, Intel
时间:12 月 9 日,12:10-12:45
简介:OpenYurt 是一个云边缘解决方案,适合在视频分析、云游戏等边缘环境中部署具有低延迟和大数据特性的工作负载。要以端到端和高度可扩展的方式部署工作负载,应将一些关键组件扩展到 OpenYurt,它们是:1.入口操作符:用于将请求分派到目标工作负载
2.应用程序负载平衡器 (ALB) 操作符:用于将请求分派到正确的普通旧数据 (POD)
3.端到端部署操作符:为了便于用户在本演示文稿中轻松部署用例,Linda 和 Shaoqiang 将描述添加到 OpenYurt 组件的详细信息,包括将 ingress-nginx controller 扩展到 OpenYurt Nodepool(OpenYurt 的边缘),从头开始为 Nodepool 实现应用程序负载平衡器,以及端到端部署操作符,通过提供简单的应用程序接口 (API) 方便部署。视频分析用例被用作示例工作负载。
Hongming Wan, QingCloud
议题:Kubernetes 与基于角色的访问控制 (RBAC) 和 KubeFed 的多集群和隔离 | Kubernetes Multi-Cluster and Multi-Tenancy With RBAC and KubeFed - Hongming Wan, QingCloud
时间:12 月 9 日,13:15-13:50
简介:软隔离是一种没有严格隔离不同用户、工作负载或应用程序的隔离形式。就 Kubernetes 而言,软隔离通常由 RBAC 和命名空间隔离。当集群管理员跨多个 Kubernetes 集群实现隔离时,会遇到许多挑战,如身份验证和授权、资源配额、网络策略、安全策略等。在本次演讲中,KubeSphere 维护人员将分享他们在设计隔离体系结构方面的经验和最佳实践。如何跨多个集群管理用户和身份验证。如何管理不同集群租户的资源配额。资源隔离机制以及如何跨多个集群授权资源。
Fei Xu,Huawei
议题:用 KubeEdge 管理不稳定网络上的大规模边缘集群 | Managing Large-Scale Edge Cluster Over Unstable Network with KubeEdge - Fei Xu, Huawei
时间:12 月 9 日,14:05-14:40
简介:众所周知,Kubernetes 已经成为协调运行在数据中心中的容器化工作负载的事实上的标准,并依赖于数据中心的稳定网络。但在边缘计算场景中,我们将在数据中心运行主节点,在各个分散区域运行边缘节点。此时,K8s 主节点和边缘节点之间没有稳定的网络连接,节点甚至可能长时间处于离线状态。此外,由于边缘节点的数量大于数据中心服务器的数量,如何管理这些大规模的边缘节点是一个巨大的挑战。在这一节中,我们将分享如何使用 KubeEdge 来管理不稳定网络下的大规模边缘集群。它支持向大规模边缘节点发送控制事件,有助于我们在大规模边缘集群的不稳定网络环境下实现可靠的边缘应用管理。
Tiejun Chen,VMware
Dingping Yuan,VMware
议题:在 Kubernetes 边缘集群上运行 wasm 应用 | Run wasm applications on kubernetes edge cluster - Dingping Yuan & Tiejun Chen, VMware
时间:12 月 10 日,11:20-11:55
简介:Wasm 正变得越来越受欢迎,尽管它并没有被视为容器的替代品,但社区确实看到了它的潜力。在 Kubernetes 集群上运行 wasm 应用程序的试验有很多,但很少有团队能够在边缘集群上运行它们。我们一直在基于 krustlet 项目开发边缘产品,并在作为 krustlet 后端提供商支持边缘集群方面取得了一些有趣的进展。在本次会议中,我们将与您分享:
为什么我们需要由 k8s 在边缘上支持的 wasm 应 用程序
用 k8s 构建 wasm 到边缘的差异和挑战
用 krustlet 构建 wasm 到边缘的方法 * 体系结构 * 支持边缘的 krustlet 后端 * 针对边缘的优化 * 使用 k3s 开源边缘项目集成
演示
议题:Kubernetes 上的 Vivo 人工智能计算平台 | Vivo's AI Computing Platform on Kubernetes - Ziyang Wu, Vivo
时间:12 月 10 日,12:10-12:45
简介:Vivo 是世界上最大的智能手机公司之一。人工智能实验室的数百名工程师和研究人员在 NLP、CV、推荐、演讲等各个领域工作,带来了各种各样复杂的模型训练和服务案例。人工智能计算平台的建立是为了解决两大挑战:1.为大规模分布式模型培训和服务提供有效的资源调度。2.实现计算资源的高利用率,特别是昂贵的 GPU 设备。今天,该平台有几个生产集群,数千个 GPU 节点和数百个 GPU 节点。每天会部署数百个服务,运行数百个 ML 作业。这一节将讨论如何使用 Kubernetes、kube-batch、kubeflow 和其他开源软件构建平台。它还将涵盖他们遇到的问题,来之不易的最佳实践和他们对开源社区的贡献。
应用程序+开发|Application+Developmet
容器技术与 Kubernetes 诞生之后,彻底改变了很多行业的应用开发模式。本专题将聚焦云原生时代的应用程序与开发模式,一起来看看云原生对开发者来说究竟改变了什么。
Ju Zhen,Huawei
议题:用 Kubernetes 系统加速机器人应用开发 | Accelerating Robot Application Development with Kubernetes - Chunxu Hu, Jingfeng Micro Control Technology & Ju Zhen, Huawei
时间:12 月 9 日,11:20-11:55
简介:在现实世界中开发机器人应用程序具有挑战性。开发人员必须处理各种各样的传感器和硬件,每个传感器和硬件都有独特的软件开发工具包 (SDK)、数据格式,并在不同的软件环境中运行,这使得机器人系统很脆弱,随时可能出现故障。那是机器人操作系统出现之前的黑暗时代。机器人操作系统统一了编程接口和通信机制,为机器人应用开发人员带来了曙光。而我们相信云原生会使这种曙光更光明。通过容器和 Kubernetes 系统,开发人员可以启动大量资源并行进行机器人仿真,并有效地管理机器人应用程序的整个生命周期。在本次演讲中,演讲者将介绍“云原生之前”的机器人开发情况,以及云原生如何让机器人开发人员的生活更轻松。内容包括:——将机器人应用程序移植到容器中——用 Kubernetes 系统在云端进行多个机器人模拟——在真正的机器人上部署和管理应用程序 ——机器人编队操作,远程操作
Jianbo Sun,Alibaba
Yong Feng,Alibaba
议题:以一致的经验构建和管理多集群应用 | Build and Manage Multi-cluster Application with Consistent Experience - Yong Feng & Jianbo Sun, Alibaba
时间:12 月 9 日,12:10-12:45
简介:与在多集群环境中部署和管理应用程序相比,当前在本地环境中开发应用程序的用户体验存在巨大差距。将经过良好测试的应用程序移到多集群环境时,需要付出大量的努力。在本分享中,我们将演示如何将 KubeVela 和 OCM(开放集群管理)结合起来解决阿里云中的问题。用户只需根据 KubeVela 应用程序规范定义一个应用程序另一种标记语言 (YAML),其余的将由 KubeVela 和开放集群管理处理。KubeVela 将准备一个部署工作流,包括在需要时创建 Kubernetes 集群。开放集群管理将帮助注册集群并在集群之间分配资源。因此,在本地开发和多集群生产部署之间部署和管理应用程序的用户体验是一致的。我们将讨论这些用例、挑战以及相关的工作和经验。
性能 | Performance
当新的业务需求到来时,您是否好奇 Kubernetes 集群是否能够满足性能需求?本专题将聚焦开发者普遍关心的 Kubernetes 在各个场景下的性能问题,看看 Kubernetes 如何帮助企业开发者实现降本增效。
Dongdong Chen,Tencent
议题:基于 Kubernetes 的全场景工作负载混部 | A full-scenario colocation of workloads based on Kubernetes - Dongdong Chen & Lingpeng Chen, Tencent
时间:12 月 9 日,12:10-12:45
简介:对不同的工作负载(在线服务和离线作业)及时交错使用资源,使混部成为可能,可以有效提高资源利用率,降低成本。该讲座介绍了如何通过资源预测、资源隔离、干扰检测、离线逐出等方式,在不中断在线服务 SLO 的情况下最大限度地提高资源利用率。此外,即使用户无法提供在线服务的延迟度量,我们也可以通过 eBPF 收集内核级度量来检测干扰。所有这些技术都是建立在原生 Kubernetes 上的。托管支持多种场景,包括容器化和非容器化在线服务,以及 Kubernetes 和 Hadoop 生态系统中的离线作业。在腾讯,它已经部署了超过 40,000 台机器,拥有 2,000,000 多个核心,包括广告和 Ceph 存储等服务,利用率平均提高 15%,成本节约数亿美元。
议题:一个关于管理具有 15k 节点和各种工作负载的 Kubernetes 集群的故事 | A story of managing kubernetes cluster with 15k nodes and various workloads - Bo Tang & Chongkang Tan, Ant Group
时间:12 月 9 日,13:15-13:50
简介:最近,我们的 Kubernetes 集群已经进化,以满足大规模混合长时间运行的工作负载和离线大数据/机器学习训练工作的需求。这使得我们的 Kubernetes 集群能够达到 15k 个节点,成为社区中最大的集群之一。在本次演讲中,我们将介绍管理超大规模 Kubernetes 集群的方法,以满足业务需求。通过实际流量分析、仿真和性能测试,确定了性能瓶颈。在此基础上,优化 Kubernetes apiserver 性能,减少列表/创建/更新/删除响应时间,以满足 SLO 要求。我们将分享一些我们在 apiserver 端和客户端所做的改进,例如不同的运营商。我们还将介绍 etcd 性能的一些方面。
议题:如何在零停机的情况下迁移 Kubernetes 集群 | How To Migrate Kubernetes Cluster With Zero Downtime - Jing Gu & Yaoyao Xie, Alibaba
时间:12 月 9 日,14:05-14:40
简介:跨多个版本升级 Kuberentes 的风险更大。许多客户选择使用集群迁移(即创建一个新的高版本集群,然后将应用程序从低版本集群迁移到高版本集群)而不是升级集群。然而,如何在零停机的情况下迁移集群已经成为一个重大挑战。这项建议提出了解决问题的办法。
无服务器 | Serverless
Serverless 架构已被业内认为是引领云原生下一个十年的发展潮流。市场调查报告显示,2020 年全球已有 20% 的企业采用 Serverless 技术部署,Serverless 从底层进行技术变革计算资源的形态,为企业的软件架构设计和应用服务部署引入创新的技术设计思路。本专题将为大家介绍 Serverless 技术的发展现状,以及其在生产环境中的落地实践。
Benjamin Huo,QingCloud
议题:用云原生无服务器技术构建现代 FaaS(功能即服务)平台 | Build a modern FaaS platform with Cloud Native Serverless technologies - Benjamin Huo & Wanjun Lei, QingCloud
时间:12 月 10 日,13:15-13:50
简介:作为无服务器的核心,FaaS(功能即服务)越来越受到人们的关注。新兴的云原生无服务器技术可以通过用更强大的云原生替代方案替换 FaaS(功能即服务)平台的关键组件,从而构建一个强大的现代 FaaS(功能即服务)平台。在本次讨论中,OpenFunction 的维护人员将讨论:- 构成 FaaS 平台的关键组成部分,包括功能框架、功能构建、功能服务以及功能事件管理。- 新兴云原生无服务器技术在 FaaS 各个关键领域中的优势,包括 Knative 服务、云原生构建包、Shipwright、Tekton、KEDA 和 Dapr。- 如何以 OpenFunction 为例,利用这些云原生技术构建强大的现代 FaaS 平台。- 事件管理对 FaaS 很重要的原因。- 既然已经有了 Knative eventing 和 Argo Events,为什么 OpenFunction 还要创建自己的事件管理系统“OpenFunction Events”?
Zhao Qingjie,Alibaba
议题:实现 Faas + Dapr + K8S 技术融合,构建全新的阿里巴巴云无服务器研发系统 | Achieving Faas + Dapr + K8S technology integration, and build a new Alibaba Cloud Serverless R&D system - Zhao Qingjie, Alibaba
时间:12 月 10 日,14:05-14:40
简介:随着云原生生态系统的不断发展,Kubernetes 已经成为了一种云操作系统。与此同时,无服务器是云计算下一个十年的发展主题这种声音越来越多,那么 Kubernetes 将如何更好地支持这种无服务器场景呢?如何使用 Kubernetes 生态系统更好地整合二者?尽管诸如 Kubernetes 原生和 Fission 一类基于 Kubernetes 的无服务器解决方案已经在行业内出现,但是其仍无法突破零还原和高密度 + 高频率创建等技术瓶颈。本次讨论主要介绍如何在阿里巴巴内部实现技术突破,以及如何实现现有应用的大规模迁移:
FaaS 在 Kubernetes 上的瓶颈。
如何突破节点瓶颈,实现单节点上 1200 个实例的高密度部署。
如何打破性能瓶颈,实现 1w+/5s 的高频创建和删除。
如何重复使用 Kubernetes 的生态能力,扩展 FaaS 的边界。
如何快速大规模迁移现有应用的无服务器形式?
服务网格 | Service Mesh
服务网格(Service Mesh)被很多人认为是云原生时代继 Kubernetes 之后的下一件“大事”,开源软件创业公司 Buoyant 于 2016 年推出针对微服务架构服务间通讯的解决方案 Linkerd,并首次提出了 Service Mesh 的概念。Service Mesh 的定位非常明确,就是用来处理服务与服务之间的通讯的云原生基础设施。 经过这些年的发展,Service Mesh 的成熟度如何了呢?
Xu Liu,Tencent
议题:Envoy 网格加速从 iptables 到完全 BPF | Envoy Mesh Acceleration: From Iptables to Fully BPF - Xiyao Zhang & Xu Liu, Tencent
时间:12 月 9 日,13:15-13:50
简介:eBPF sockmap 已经成为一种为服务网格加速 Envoy 和容器之间本地进程通信的理想方法。然而,这一方法依赖于 iptables 来实现透明的流量劫持。这已经成为了系统性能的主要瓶颈。本次讨论将从针对当前解决方案、来自社区的 Cilium 以及我们去年在 KubeCon China 中引入的轻量级方法开始进行详细调查。我们将解释 iptables 重定向如何影响入站和出站流量上的 sockmap 匹配结果。然后我们将展示我们的第一个类决方案,此类方案根本不使用 iptables。此类解决方案:1. 通过挂钩绑定调用,使用 eBPF 定向入站流量到 envoy。2. 使用 eBPF 执行透明出站流量重定向。3. 为 Daemonset 部署和维护提供集成的控制面,并通过注释和配置地图进行完全控制。
议题:在线视频将弹性从 SC 熔断器升级到服务网格 | Online Video upgrades resilience from SC Circuit Breaker to Service Mesh - Xu Shiyu, RR Video & Zhang Chaomeng, Huawei
时间:12 月 9 日,14:05-14:40
简介:作为中国领先的在线视频共享平台,人人视频业务的快速发展给其 IT 基础设施带来了巨大挑战。日益增长的复杂性、容量和弹性要求给当前基于 Spring Cloud 熔断器的微服务带来了新的问题。在此演示中,Chaomeng 和 Shiyu 将重点介绍大规模生产环境中的服务网格弹性实践,包括不健康实例的透明自动隔离、自动恢复和自我修复、连接池管理、重连服务器、精细增进速率限制和分布式跟踪、延迟指标。通过分析熔断器模式和比较 Spring Cloud 熔断器和服务网格在各自生产实践中不同的实现方式,结果表明优化不只是改善了系统的可靠性和可用性,还使得开发和操作工作更简单便捷。
议题:解决服务网格应用者的困境 | Solving the Service Mesh Adopter’s Dilemma - Anita Ihuman, Layer5
时间:12 月 10 日,11:20-11:55
简介:我该使用哪种服务网格,如何开始?有哪些不同的服务网格,它们的对比情况如何?了解不同服务网格的功能性,并直观地操作网格配置。本次闪电式演讲介绍了一种开源多服务网格管理平面,Meshery,其提供(五种并且未来还会持续增长)不同的服务网格,还介绍了其示例应用程序,并对服务网格部署的性能进行基准测试。Meshery 促使对 Istio 的各种配置场景进行基准测试,比较网格内外以及不同网格之间的服务(应用程序)的性能。其根据部署最佳实践检查网格和服务配置。部分服务网格项目使用 Meshery 作为每个版本的性能基准工具。
运行时 | Runtimes
容器运行时,是执行集装箱化(或“约束”)的应用程序。运行时将在容器中启动应用程序,并为其提供所需的资源。它以标准化方式在所有环境中启动应用程序,并设置安全边界以及容器的资源限制。没有它,该应用程序可能会根据需要消耗资源,从而有可能占用其他应用程序的资源。当 Kubernetes 的场景边界被不断拓展时,相应的容器运行时又会如何发展?
Siyu Wang,Alibaba
议题:在 OpenKruise 中扩展容器运行时的操作 | Extend the operations for container runtime in OpenKruise - Siyu Wang, Alibaba
时间:12 月 10 日,13:15-13:50
简介:通常情况下,人们只能使用普通旧数据作为 Kubernetes 中最小的操作单元。他们可以创建一个普通旧数据,但不能控制普通旧数据中的容器,也不能通过 Kubernetes 应用程序接口在某些节点上提取图像。这是因为 Kubernetes 没有提供操作运行时的应用程序接口,比如 Containerd 或 Docker。据我所知,一些公司在他们的集群中入侵了 Kubelet 的代码,以便他们可以对容器做更多的事情。然而,为运行时扩展操作确实是一种错误的方法,因为它不利于开源和社区的合作。现在,云原生计算基金会沙箱项目之一 OpenKruise 提供了高级功能,可以在每个原始 Kubernetes 集群中操作容器运行时。它支持通过 CRD 进行大规模图像预下载和容器重启,因此用户只需应用 CR 另一种标记语言即可完成这些工作。在本次演讲中,我们将介绍 OpenKruise 中功能的用法,以及它如何与 Kubelet 和 CRI 合作。
Pengfei Jiang,Huawei
议题:KubeEdge 驱动的下一代云原生运行时边缘设备 | KubeEdge Powered Edge-Devices With Next Generation Cloud Native Runtime - Pengfei Jiang, Huawei
时间:12 月 10 日,14:05-14:40
简介:随着云本地边缘计算的实现,越来越多的边缘设备需要与云协作。此外,随着各种专业芯片、硬件加速卡和微机器学习技术的发展,许多通用资源较低的专用设备也需要边缘云协同。因此,轻量级容器沙箱技术需要满足低服务开销、快速启动和服务隔离的要求。为了解决边缘设备的多体系结构系统迁移问题,实现统一的应用运行时,降低开发和维护成本,需要一种统一的跨体系结构运行时技术。
运营 | Operations
大规模集群的管理是云原生时代的运维工作者需要面临的巨大挑战。本专题将与大家共同探讨在管理 Kubernetes 集群的过程中可能遇到的问题和解决方案。
Chaofan Wang,Tencent
Cong Tang,Tencent
议题:如何有效管理数以万计的 etcd 集群?| How to Efficiently Manage Tens of Thousands of etcd Clusters? - Cong Tang & Chaofan Wang, Tencent
时间:12 月 9 日,11:20-11:55
简介:在管理 k8s 群集的过程中,您可能会遇到许多 etcd 管理和稳定性问题。例如,如何通过可视化平台管理大量 etcd 集群?如何自动发现 etcd 集群的潜在危害,及时报警,甚至实现自愈?如何顺利地将 k8s etcd 迁移到无停机时间的高性能 etcd 群集?腾讯是一家大型互联网公司和云服务提供商。腾讯 Kubernetes 引擎拥有丰富的大规模 k8s 集群管理经验,在腾讯云上管理数万个 k8s 集群。腾讯 Kubernetes 引擎已经实现了开源的可视化 etcd 管理平台 kstone,提供 etcd 集群注册和管理、检查、优化建议、备份、迁移、数据可视化等。基于 kstone 项目,腾讯 Kubernetes 引擎有效地管理了数万个 etcd 集群,这大大降低了运营和维护成本。
议题:阿里巴巴如何在用户面前发现和定位 k8s 集群问题 | How We Discover and Locate k8s Cluster Problems Before Users at Alibaba - Peng Nanguang, Alibaba
时间:12 月 9 日,12:10-12:45
简介:快速发现和定位问题的能力是快速恢复系统的基石。只有首先快速发现和定位问题,我们才能讨论如何解决问题并最大限度地减少用户损失。那么,在复杂的大规模场景中,我们如何在用户面前发现和定位问题呢?我将介绍一些我们在管理大型 K8S 集群过程中快速发现和定位问题的经验和实践——我们如何通过创建通用链接检测 + 定向检测工具 KubeProbe 来解决我们遇到的问题,以应对大规模集群的稳定性挑战。链接检测:模拟广义用户行为,检测链接和进程是否异常:检查集群的异常指标,找出未来系统增强中存在或可能存在的风险点:问题发现的效率和速度、问题发现后的根本原因分析,以及聊天操作。
Benjamin Wang,VMware
Wenli Wei,VMware
议题:Kubernetes 中 Windows 工作负载管理的最佳实践 | Best Practice on Windows Workload Management In Kubernetes - Benjamin Wang & Wenli Wei, VMware
时间:12 月 10 日,14:05-14:40
简介:随着 Windows 容器的成熟,大部分 Windows 应用程序和服务正在迁移到 Kubernetes。即使拥有 Linux 工作负载管理的成功经验,大规模管理 Windows 工作负载也是一项挑战。您知道 Windows 工作负载的暂存空间吗?您是否曾经因过度配置的暂存空间而导致节点崩溃?我们如何避免孤立磁盘?它怎么可能在滚动更新时陷入困境?如何优雅地关闭守护程序?组托管服务帐户 (GMSA) 作为在 Windows 上运行任务和应用程序的更安全的方式,您知道组托管服务帐户是如何集成到 Windows 群集中的吗?你还在纠结于 Kubernetes 上的组托管服务帐户与动态目录的集成吗?
CI/CD
CI/CD 是一种通过在应用开发阶段引入自动化来频繁向客户交付应用的开发方法,其核心概念是持续集成、持续交付和持续部署。在云原生时代,CI/CD 如何更好地落地?本专题将带你走进云原生时代的 CI/CD 系统。
Jinming Yue,ByteDance
议题:基于 Tekton 构建大规模云原生 CI/CD 系统 | Build a Large Scale Cloud Native CI/CD System Based on Tekton - Jinming Yue & Deyuan Deng, ByteDance
时间:12 月 10 日,11:20-11:55
简介:随着基于 Kubernetes 的生态系统的广泛采用,社区和企业对微服务架构有着越来越大的兴趣。伴随着这一趋势,需要云原生的 CI/CD 系统来支持微服务应用的快速迭代开发周期。Tekton 是基于 Kubernetes 的开源云原生 CI/CD 项目;但是,其主要设计用于单集群环境,不能解决跨不同区域在多个集群上同时运行多个线路的挑战。在本次讨论中,我们将介绍一种构建于 Tekton 之上的大规模云原生 CI/CD 系统,用于解决上述问题。该系统为字节跳动数以千计的应用程序交付提供动力。我们将分享设计该系统时的实际经验和需要注意的陷阱,以及我们如何解决多区域部署带来的性能和安全问题。
Jenny Chen,Qunar
Sheng Zou,Qunar
议题:去哪儿网规模下 Kubernetes 多集群和 Canary 的部署 | Kubernetes Multi-cluster and Canary Deployment at the Scale of Qunar - Sheng Zou & Jenny Chen, Qunar
时间:12 月 10 日,12:10-12:45
简介:去哪儿网是中国领先的在线旅游平台,成立于 2005 年 5 月,总部位于北京。去哪儿网基础设施团队在 2020 年底开始研究和应用 k8s,其计划在 2021 年底前将在生产中将所有应用程序迁移到 Kubernetes 中。随着云原生时代的到来,学习和拥抱云原生不可避免,因为其可以使业务运营更加敏捷。容器化是将应用转移到 Kubernetes 之前的第一步。如何将数以千计的应用程序高效、顺畅地从基于内核的虚拟机 (KVM) 迁移到容器已成为去哪儿网基础设施团队面临的一个巨大挑战。在此次讨论中,去哪儿网基础设施团队将讨论:- 如何将 CI/CD 模式从 KVM 发展到云原生时代——如何运用多集群和基于批量的 Canary 部署帮助应用程序、sdk 顺利进行升级——从 CI/CD 演化路径中吸取的教训。
网络 | Networking
与云原生技术带来的高效与便利共生的,是网络技术的挑战。如何在多云跨集群、云边端协同等复杂场景下构建稳定、安全、可靠的网络解决方案?敬请关注本专题中由来自各大厂商的资深云原生技术专家带来的精彩网络技术分享。
Hongjun Ni,Intel
议题:支持零信任服务网络的零信任网络整体解决方案 | Zero Trust Network Turnkey Solution to Support Zero Trust Service Mesh - Hongjun Ni & Pan Zhang, Intel
时间:12 月 9 日,11:20-11:55
简介:随着越来越多的员工在远程工作,大多数数据/用户/设备/应用程序都在传统企业范围之外移动。成功的数字转型需要零信任安全模型。本演示将介绍一种具有高性能和可扩展性的零信任网络整体解决方案。此解决方案包含 VPP 上的安全网关和 DPDK 上的负载平衡器,支持零信任安全模型。可用于 K8s 入口/出口网关和边缘云网关,支持零信任云服务网格。本主题将涵盖以下要点:
1)介绍零信任网络整体解决方案的总体架构。
2)在 VPP 和 WireGuard 上实现零信任安全网关。
3)在 DPDK 和 WireGuard 上实现零信任云网关。
4)使用 IPsec MB 库和 AVX512 加速基于 VPP 的 WireGuard 协议。5)实现基于 DPDK 的 WireGuard 协议,具有高性能和可扩展性。
6)利用 SGX 构建用于机密管理的 T 形三通。
Yuning Xie, Alibaba
议题:最佳实践:Kubernetes 集群中 DNS 故障的可观测性与根因诊断 | Best Practice: DNS Failure Observability and Diagnosis in Kubernetes - Yuning Xie, Alibaba
时间:12 月 10 日,11:20-11:55
简介:在阿里云数万个 Kubernetes 集群中,DNS 域名解析故障是最常见的问题之一。DNS 解析故障的现象也千奇百怪,有些是间歇性的,有些是持续性的,有些影响了所有类型的域名查询,有些只影响了小部分。其根因也不尽相同,大部分是容器网络问题,有时候是配置错误。Yuning Xie 将介绍在 Kubernetes 中 DNS 解析故障的可观测性与根因诊断,本主题将包括以下内容:
1. 介绍 Kubernetes 中常见的 DNS 解析故障场景
2.介绍 CoreDNS 内置的可观测性插件,例如 log/errors/trace/dump/metrics
3. 如何通过 dnstap 协议诊断 CoreDNS 异常,以替代 tcpdump 等传统高开销的方法
4. 如何基于 BPF 完成客户端侧 DNS 异常的根因诊断
议题:用 Kube-OVN 创建一个跨 Kubernetes 的统一网络平面 | Creating a Unified Network Plane across Kubernetes with Kube-OVN - Cheng Chen, PingCAP
时间:12 月 10 日,12:10-12:45
简介:Kubernetes 的网络组件一直是运营人员非常重要的一部分。Kube OVN 作为一个新的网络组件加入云原生计算基金会组织,这丰富了 Kubernetes 网络组件生态系统。Kube-OVN 具有许多特性,其中集成多个 Kubernetes 网络以开放和创建一个共同的网络平面的特性是其中最吸引人的特性之一。通过集成多个 Kubernetes 网络,并允许应用程序在多个 Kubernetes 集群上运行而无需感知。可以提高节点的使用效率;降低应用程序和体系结构的复杂性;更重要的是,支持数据中心级别的灾难恢复。本次演讲将介绍如何使用 Kube-OVN 构建一个跨 Kubernetes 网络平面。它还将通过在跨 Kubernetes 网络平面上部署 TiDB 来解释类似部署场景的重要性和概念。
Wang Jiezhang,Huawei
议题:边缘计算场景下 Service Mesh 的延伸和扩展 | Extension and expansion of Service Mesh in edge computing scenarios - Wang Jiezhang, Huawei
时间:12 月 10 日,13:15-13:50
简介:EdgeMesh 是 KubeEdge 的一部分,为边缘场景中服务之间的交互通信提供了一个简单的网络解决方案。KubeEdge 基于 Kubernetes 构建,将云本地容器化应用程序编排功能扩展到边缘。然而,在边缘计算机场景下,网络拓扑结构更加复杂。不同区域中的边缘节点通常不相互连接,应用程序之间的流量交互通信是业务的主要需求。对于这个场景,EdgeMesh 提供了一个解决方案。作为 KubeEdge 群集上数据面板的组件,EdgeMesh 为 KubeEdge 群集上运行的应用程序提供样本容量(例如,服务发现、流量代理等),从而屏蔽边缘场景的复杂网络拓扑。
议题:异构多集群全网格通信实践 | Heterogeneous multi-cluster full mesh communication practice - Li Yang, Transwarp; Liu Wenfeng, VMware
时间:12 月 10 日,14:05-14:40
简介:许多大数据业务都在 Kubernetes 集群上运行。为了使运行在不同 Kubernetes 集群上的大数据业务能够高效地访问彼此的数据,需要一种新的方式在异构多 Kubernetes 集群之间建立高性能、简单的网络通信。在第二层网络中,我们选择主机路由进行通信,以保证网络性能。主流容器网络接口 (CNI) 支持此功能。在第三层网络中,我们选择主流容器网络接口支持的 vxlan 隧道技术连接网络。对于异构容器网络接口,在第二层网络中,它们可以直接通信。在第三层网络中,它们的 VNI 可能不同,因此无法在集群之间创建 vxlan 隧道,因此至少可以通过编程扩展一个容器网络接口以适应另一个容器网络接口,确保使用相同的 VNI 在两个容器网络接口之间建立 vxlan 隧道,我们选择 antrea 作为核心容器网络接口以支持可配置的 VNI。
社区 | Community
对于开源软件来说,社区的活力是项目前进的动力和发展的源泉。如何从一个开源爱好者变成开源贡献者,再逐步进入社区,加入开源项目的维护与管理之中?本专题将与各位分享开源社区的点点滴滴。
Guo Xudong, JiHu GitLab
议题:如何参与云原生计算基金会 (CNCF) 开源项目并成为维护者 | How to Participate in CNCF Open Source Projects and Become a Maintainer - Guo Xudong, GitLab
时间:12 月 9 日,13:15-13:50
简介:如何参与开源项目?如果我不知道如何编写代码,我能参与开源项目吗?如何从一个普通的贡献者一步一步地成为维护者?这次演讲可能会帮助你找到答案。
Kubernetes 企业最终用户可以免费申请大会门票,获得全程免费参会资格,仅限 500 个名额。
另外,符合多样化计划的高校大学生、女性开发者、开源爱好者、开源社区领袖、开源社区创业者、新兴技术社区共建者也可以免费申请大会门票,共享云原生开源技术盛宴。
KubeCon + CloudNativeCon + Open Source Summit China 2021 由云原生计算基金会 CNCF 主办。本届大会的议程安排已全面上线,报名通道限时开放。更多详情请查看大会官网。
审核编辑:符乾江
评论
查看更多