0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当前机器学习面临的落地挑战

华为开发者社区 来源:华为云社区 作者:华为云社区 2021-06-17 11:14 次阅读

●当前机器学习落地挑战●

近二十年来,机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。

在实际业务落地过程中,大部分大型云平台提供商均已提供机器学习算力等资源服务,同时支持多种机器学习框架等以提供开放灵活的部署环境。但是,机器学习模型所需的数据往往并非从云平台中产生,而是从传感器手机、网关等边缘设备中产生。数据从边侧产生,而云端需从边侧采集数据以训练和不断完善机器学习模型。

在实际落地时,当前机器学习需面对以下问题:

1、海量设备数据导致延迟和成本问题

假设即使有100 Mbps的专网连接,将10TB的数据运送到云端也需要10天。面对大量边缘连接设备每天生成数百兆字节甚至TB数据,带来的延迟和成本对客户和服务提供方来说往往是难以承受的;

2、数据压缩导致的延迟和精度问题

正因迁移所有数据通常不切实际,往往需要对数据进行“压缩”(如特征工程、难例识别等)并传输到云端,而数据压缩过程容易引入新的延迟。压缩数据不一定能完全代表完整数据集信息,容易导致精度损失。

3、边侧数据隐私和计算实时性问题

边侧数据与资源等具备地理分布性。隐私和网络瓶颈导致数据集天然分割, 传统集中式机器学习在边缘情况下性能将显著下降;单个边侧资源受限且异构(算力、供电、场地等均受限),相对云上资源建设与维护成本更高。

上述问题的本质来源是数据在边缘产生,而算力却在云端更为充足。也就是说,机器学习服务将边缘产生的数据转换为知识的过程中,一方面需要在边缘快速响应并处理本地产生的数据,另一方面需要云上算力与开发环境的支持。随着边缘设备数量指数级增长以及设备性能的提升,边云协同机器学习应运而生,以期打通机器学习的最后一公里。

●边云协同机器学习落地有哪些挑战●

目前边云协同机器学习的经典模式是:在云上给定一个数据集运行机器学习算法构建一个模型,然后将这个模型不作更改应用在多个边侧的多次推理任务上。这种学习范式称为封闭学习(也称孤立学习 [1]),因为它并未考虑其他情景学习到的知识和过去学习到的历史知识。虽然边云协同机器学习技术的相关研究和应用都有着显著的进展,然而在成本、性能、安全方面仍有诸多挑战:数据孤岛/小样本/数据异构/资源受限[2]。

在边缘云背景下:(1)不同边侧数据分布总是不断变化,(2)而边侧标注样本也往往由于成本较高导致数量稀少。因而封闭学习需不停标注样本并重新训练,这显然给服务落地带来巨大挑战。这种数据分布和数据量上的挑战分配称为数据异构和小样本,属于边云协同机器学习的四大挑战。

本文以一个热舒适预测服务例子介绍相应挑战,如图1所示。该服务输入外界温度等环境特征,预测不同人员的热舒适程度(热、舒适、冷)。由于边缘节点部署位置从室外变动到室内,对于相同室外温度特征值x=30,可以看到实际标注的热舒适标注发生了较大变动。这原有室外模型上线预测值整体偏低,要匹配到室内模型,则需要训练样本重新调整。也就是说,面对分布动态变化的边缘侧数据,由于没有记忆历史和不同情景任务知识,封闭学习需要频繁重新训练。

●边云协同机器学习挑战如何解决●

从上面的讨论可以了解到,当前的封闭学习范式可被用于提供数据同构和大数据的服务,但难以处理数据异构和小样本的问题,所以并不合适用于建立通用的机器学习系统。伊利诺伊大学芝加哥分校的刘兵教授也在Frontiers of Computer Science中总结,封闭学习范式一系列局限性的根本在于没有记忆,这导致它通常需要大量的训练样本。

对应的范式改进可以从人类的学习过程中得到启发。可以看到,人类之所以能够越学越聪明,是由于每个人并非自我封闭地学习,而是不断地积累过去学习的知识,并利用其他人的知识,学习更多知识 [1]。借鉴人类这种学习机制,终身学习结合边云协同可以发展出边云协同终身学习。

边云协同终身学习

在边侧同时结合了多任务学习和增量学习特性来处理新情景下数据异构和小样本的问题;

借助云侧知识库来记忆新情景知识;

从根本上解决上述边云协同机器学习的挑战。

●边云协同终身学习概念●

基于1995年提出的终身学习概念[3],Sedna进一步定义边云协同终身学习为边云协同的多机器学习任务持续学习。其中机器学习任务是指在特定情境下运用的模型,如中译英(给定汉语翻译为英语)、亚洲植物分类等。

正式定义如下:

边云协同终身学习:

给定云侧知识库中N个历史训练任务,推理持续到来的当前任务和未来M个边侧任务,并持续更新云侧知识库。其中,M趋向于无穷大,同时边侧M个推理任务不一定在云侧知识库N个历史训练任务当中。

具体来说,边云协同终身学习的一般流程如图2所示:

初始化知识库:在云侧知识库中存储和维护过去N个任务(记为第T-N到T-1个任务)中训练并累积的知识。

学习当前任务:在边侧设备面对当前任务(记为第T个任务)时,基于云侧知识库先验知识训练第T个任务。注意,第T个任务并不一定在历史的N个任务当中。

更新知识库:将学习到的边侧第T个任务知识反馈到云侧知识库并更新。

学习未来任务:持续学习未来M个任务(记为第T+1到T+M个任务)。与上面第T个任务利用过去N个任务知识(从T-N到T-1)类似,第T+1个任务的边侧任务知识则利用过去N+1个云侧任务知识(从T-N到T)。以此类推,直到完成第T+M个任务,结束整个流程。

边云协同终身学习具备以下三大特点:

边云协同持续学习:能够基于云侧算力和边侧数据合作完成持续推理与训练,能够在推理运行时变得越来越擅长模型训练。

以云侧知识库为中心的边侧知识共享:以云侧知识库作为中心,实现跨边的知识共享并处理边侧任务,同时持久化与维护云端知识。

边侧处理云侧未知任务:需要边侧能够发现和处理云端知识库未知任务。其中未知任务是指运行或测试过程中发现的新任务,比如其应用情景或模型在知识库当前知识之外。

●Sedna边云协同终身学习特性●

KubeEdge 是一个开源的边缘计算平台,它在Kubernetes原生的容器编排和调度能力之上,扩展实现了边云协同、计算下沉、海量边缘设备管理、边缘自治等能力。KubeEdge还将通过插件的形式支持5G MEC、AI云边协同等场景,目前在很多领域都已落地应用[3]。

KubeEdge AI SIG于20年12月发布KubeEdge子项目开源平台Sedna,架构如图3所示。Sedna基于KubeEdge提供的边云协同能力,实现AI的跨边云协同训练和协同推理能力。支持现有AI类应用无缝下沉到边缘,快速实现跨边云的增量学习,联邦学习,协同推理等能力,最终降低边云协同机器学习服务构建与部署成本、提升模型性能、保护数据隐私等[2]。

在本次0.3版本更新中,Sedna提供了边云协同终身学习的特性支持。Sedna终身学习特性将基于边侧数据和云侧算力,逐步实现适应边侧业务与模型异构的高可信自动化人工智能

Sedna的边云协同终身学习作业分为三个阶段:训练、评估和部署,维护一个全局可用的知识库(KB)服务于每个终身学习任务。架构如图4所示:

启动训练worker基于开发者的AI基模型和训练数据集进行多任务迁移学习,实现任务的知识归纳,包括:样本属性、AI模型、模型超参等。

训练完成对知识库的更新后启动对评估数据集的评估worker,基于部署者定义的评估策略判断符合下发部署的任务模型。

GM捕获评估任务的完成状态后通知Edge初始化启动InferenceService进行推理服务。应用调用模型推理接口进行推理,并进行未知任务上云判别。

通过对接第三方打标系统和基于知识库的迁移学习,LC基于预配置规则监听新数据变化并按配置的策略触发训练worker进行增量学习,重训练完成后重新下发边缘侧。

其中,当前Sedna选用的模块化方案和样本迁移方案使得开源的边云协同终身学习特性能够实现模型无关:

同一个特性能够同时支持结构化和非结构化不同模型,在特性中模型可插拔;

同一个特性能够同时支持分类、回归、目标检测、异常检测等。

●基于Sedna终身学习实现楼宇热舒适预测控制●

背景

智能楼宇是智慧城市的重要组成部分

楼宇是大量先进工业产品的“使用方”,引领其制造、运行和维护,在这一波能源革命和工业革命占据重要地位。

现今楼宇都有自控系统,通常它们都在边缘,这使得很多关于楼宇的应用更倾向于部署在边缘侧,其中一类应用是热舒适度预测。由于人们80%的工作和生活都在楼宇中度过,提高工作效率和生活舒适度(如通过楼宇智能化等方式)就显得尤为重要[6]。

热舒适度预测服务于智能楼宇

热舒适度被定义为楼宇中的人对环境冷热的满意程度。它提供了一种定量的评估,把室内冷热环境参数的设定与人的主观评估联系起来。而提高楼宇中办公或者居住人员的热舒适程度是建筑及其系统设计方案中的一个重要考量。在空调系统运作时,一旦热舒适度被预测出来,那么就能将其用于调整楼宇内空调的控制策略。比方说,一种基于热舒适度的控制策略,是基于假定的空调参数设定以及温湿度等环境特征下,给出预计的人体热舒适程度。然后搜索寻优出舒适度最高的空调设定。所以,这种情况下要实现舒适度最大的空调控制就依赖于较高精度的舒适度预测。

原有热舒适度的预测要么需要房间中安装额外设备,要么需要人工反馈。部署环境复杂、人工操作频繁使得这种情况下热舒适度的采集准确度非常低。据此,基于机器学习的热舒适度预测方法被提出,它能降低部署要求、不需要人工反馈,因而更具备实用价值。

热舒适度预测服务实际部署时数据异构和小样本问题较为突出

由于人员个体差异、房间与城市差异等,不同个体、不同地点对于热舒适的感受是不一样的,那么就会导致相同的环境温度和空调设定下对应的人员的热舒适度标签值不一样,从而导致较为突出的数据异构问题。

热舒适度预测主要针对楼宇中的房间人员个体,具有个性化的特点。在环境因素变化较多的情况下,边侧房间人员个体的热舒适度样本通常有限,往往不足以支撑对单个人员进行个性化模型的训练,从而导致较为突出的小样本问题。

除了小样本问题之外,增量学习也能够一定程度解决历史与当前情景的数据异构(时间上的数据异构)。但这种边云协同增量学习范式通常不具备用于记忆的知识库,导致很难处理非时间上的数据异构。比方说,对于有多个人员的房间,在同一时刻会存在不同人员上的数据异构。由于这种情况就不仅仅是同一个人不同时间上的数据异构了,增量学习变得不太足够。此时就需要使用边云协同终身学习了。

方案

边云协同终身学习的热舒适预测方案主要有如下两个步骤:

1、创建舒适度预测终身学习任务

舒适度预测终身学习任务被创建后,Sedna知识库中会生成舒适度预测的知识库实例,知识库会利用多地点多人员的历史数据集进行初始化,并提供推理和更新接口给边侧应用。

2、部署边云协同舒适度预测应用

舒适度预测应用被部署后,应用会通过边侧的设备数据采集接口获取到多联机空调系统的设定参数和当前温湿度等环境特征信息。应用通过调用Sedna Lib库终身学习接口,从知识库中寻找对应的任务信息:

如果被判定为已知任务,比如说是已经出现过的人员在已知的温湿度条件下,则直接获取对应模型进行推理;

如果被判定为未知任务,比如说是新来的人员,则通过知识库来获取针对未知任务的模型进行推理。并且会将这些模型和模型之间关系写入到知识库中,以完成知识库的更新操作,使得知识库得到积累。

效果

本案例中的方案在开源AshraeThermal Comfort II数据集上可取得非常好的效果。在这个开源数据集中,收录了全球28个国家99个城市1995~2015年之间楼宇内人员热舒适真实数据,目标是构建一个机器学习分类模型,给定环境特征,预测人群的热倾向(Thermal Preference)。热倾向分为三类,希望更冷(觉得热)、不希望变更(觉得舒适)、希望更热(觉得冷)。

整体分类精度与单任务增量学习对比,相对提升5.12%(其中多任务提升1.16%)。其中,在Kota Kinabalu和Athens两个任务,在使用终身学习前后预测效果在Kota Kinabalu数据中预测率相对提升24.04%,在Athens数据中预测率相对提升13.73%。

原文标题:产品动态| 支持边云协同终身学习特性,KubeEdge子项目Sedna 0.3.0版本发布!

文章出处:【微信公众号:华为开发者社区】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8377

    浏览量

    132410
  • 智慧城市
    +关注

    关注

    21

    文章

    4247

    浏览量

    97128

原文标题:产品动态| 支持边云协同终身学习特性,KubeEdge子项目Sedna 0.3.0版本发布!

文章出处:【微信号:Huawei_Developer,微信公众号:华为开发者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 230次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    深度学习中RNN的优势与挑战

    循环神经网络(RNN)是深度学习领域中处理序列数据的基石。它们通过在每个时间步长上循环传递信息,使得网络能够捕捉时间序列数据中的长期依赖关系。然而,尽管RNN在某些任务上表现出色,它们也面临着一些
    的头像 发表于 11-15 09:55 165次阅读

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 308次阅读

    机器视觉要面临挑战及其解决方法

    机器视觉是指使用计算机和图像处理技术从图像中提取信息,并将其转换为机器可理解的格式。这种方法已经被广泛应用于自动化生产、质量控制、测量和检测等领域。然而,机器视觉仍然面临着一些
    的头像 发表于 11-11 01:03 139次阅读

    灌区信息化面临挑战分析

    层面,还涵盖了管理、经济、社会及环境等多个维度。 技术融合与创新挑战 首先,技术的快速迭代对灌区信息化提出了高要求。当前,物联网、大数据、云计算、人工智能等先进技术为灌区管理提供了前所未有的机遇,但同时也带
    的头像 发表于 09-12 17:45 318次阅读
    灌区信息化<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>分析

    云天励飞加速推动大模型行业落地

    陈宁博士受邀发表主题演讲,首次展示云天励飞边缘AI的战略全貌。   大模型落地的多重挑战 边缘AI提供解法  今年WAIC上,“大模型+行业”的应用落地成为关注热点。 当前,云端大模型
    的头像 发表于 07-08 17:16 587次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1193次阅读

    德国机器人面临中国竞争与国内经济下滑的双重压力

    在6月18日的一则消息中,德国机械工程行业协会(VDMA)揭示了其国内机器人产业正面临的双重挑战:来自中国的激烈竞争和国内经济形势的疲软。
    的头像 发表于 06-18 15:59 413次阅读

    全光网应用面临挑战

    尽管全光网络具有诸多优势和广阔的应用前景,但在实际应用中仍然面临一些挑战,例如: 成本挑战:全光网络的建设和维护成本相对较高,包括光纤敷设、光交换设备和光传输设备等硬件设备的采购和维护成本。特别是在
    的头像 发表于 05-09 11:03 478次阅读

    机器视觉行业就率将迎来一轮“洗牌赛”

    尽管当前机器视觉领域的相关企业普遍面临挑战,但长远来看,随着技术的进步和市场需求的增长,机器视觉在工业自动化、智能制造乃至其他领域将有巨大的应用潜力。
    发表于 03-26 11:10 774次阅读

    AI大模型落地学习机,大模型应用成学习机创新方向

    电子发烧友网报道(文/李弯弯)大模型在终端产品上的落地,除了智能手机、PC之外,还有学习机。过去一段时间,随着大模型的火热,互联网、教育公司都已经纷纷披露大模型在教育领域的最新动态,并发布搭载AI
    的头像 发表于 02-23 01:19 3792次阅读

    O-RAN技术面临的的挑战

    Open RAN全球论坛是由RCR Wireless News主办的一年一度的盛会,吸引了行业领导者齐聚一堂,共同讨论该领域的进展和面临的最大挑战。LitePoint 的 Adam Smith
    的头像 发表于 01-22 10:20 599次阅读

    大语言模型在机器人上的应用及面临挑战

    电子发烧友网报道(文/李弯弯)现在的机器人已经具备了相当高的智能化水平,这主要得益于人工智能技术的快速发展。这些机器人不仅可以执行重复性的任务,还可以处理复杂的操作,甚至具备学习和适应环境变化的能力
    的头像 发表于 01-09 00:05 1696次阅读

    面临挑战 硅以外的半导体材料选择

    随着技术的快速发展,硅作为传统半导体材料的局限性逐渐显现。探索硅的替代材料,成为了科研领域的重要任务。在本文中,我们将探讨硅面临挑战以及可能的替代材料。
    的头像 发表于 01-08 09:38 946次阅读

    微波GaN HEMT 技术面临挑战

    报告内容包含: 微带WBG MMIC工艺 GaN HEMT 结构的生长 GaN HEMT 技术面临挑战
    发表于 12-14 11:06 377次阅读
    微波GaN HEMT 技术<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>