模型开发
人工智能取得令人瞩目的进步的主要因素之一是出现了更好的技术,如GPU:可以实现更快速的数据处理。物联网的机器学习带来了一个有趣的难题:最好的模型需要接受大量数据的训练,而大多数物联网设备仍然受限于存储空间和处理能力。因此,安全高效地将大量数据从物联网设备传送到服务器或云端,并提高数据输出的能力是AI应用程序开发的关键。 在云计算时代,一种较好的解决方案是将数据导出到开发模型的云中,并在模型能够投入使用后将模型导回到设备上。这非常具有吸引力,特别是因为预计到2021年所有生成的数据中有94%将在云中处理,这意味着可以利用其他数据源,无论是历史数据还是源于其他物联网设备的数据。然而,将复杂模型存储回内存受限的设备本身可能是一个挑战,因为具有大量参数的复杂模型(如深度学习模型)本身通常非常大。另一方面,包括从设备向云上的模型发送数据以进行推理步骤的解决方案也可能不是最优方案,尤其是在需要延迟非常低的情况下进行。
另一个挑战是物联网设备可能无法连续连接到云,因此可能需要一些本地参考数据用于脱机处理,并具有独立运行的功能。这是边缘计算架构变得有趣的地方,因为它使数据能够在边缘设备级别进行初始处理。在安全性方面,这种方法特别有吸引力;而且这种方法非常有利,因为这样的边缘设备能够过滤数据,减少噪声并且当场改善数据质量。
不出所料,人工智能工程师一直试图获得两全其美的方案,并最终开发了雾计算,这是一个去中心化的计算基础设施。在这种方法中,数据,计算能力,存储和应用程序以最合理的方式在设备和云之间分布,最终将它们更紧密地结合在一起来发挥它们各自的优势。
转移学习
事实证明,物联网设备能够生成大数据,但,使用外部历史数据集开发物联网智能应用程序并不罕见。这意味着可以依靠多个物联网设备(通常是多个用户的相同类型的设备)或完全不同的数据源生成的数据。应用程序越具体和独特,现有数据集可供使用的可能性就越小,例如,当设备捕获Imagenet中特定类型的图像而与开放源图像数据集没有相似性时。但物联网应用程序实际上是几种现有的现成模型的巧妙结合,这使得转换学习很好地适应了物联网背景下智能应用的发展。
转移学习范式包括在数据集上训练模型(通常是黄金标准),并用它来推断另一个数据集。或者,可以将在生成此模型期间计算的参数用作在实际数据集上训练模型时的起点,而不是将模型初始化为随机值。在这种情况下,我们将原始模型称为“预先训练好的”模型,我们对应用程序特定的数据进行微调。这种方法可以将训练阶段加速几个数量级。 使用相同的范例,可以训练一个通用模型,最终用户可以直接使用这些数据。
安全和隐私问题
由于互联网连接设备技术通过提供物理和网络世界之间的连接来扩展当前的互联网,因此它生成的数据是通用的,但也是导致严重隐私问题的原因。事实上,参与物联网的大约50%的组织认为安全性是物联网部署的最大障碍。考虑到大约三分之二的物联网设备处于消费领域,以及一些共享数据的私密性,也就不难理解安全性问题为什么会是一个难题了。 这些顾虑以及与云频繁数据传输相关的预期风险,解释了用户为何提出保护其数据的要求。
然而,当这些物联网应用程序由“联合”数据(即由多个用户生成的数据)驱动时,事情会变得更加隐伏:不仅可能直接泄露用户数据,当恶意代理对机器学习算法的输出进行逆向工程以推断私人信息时,就可能间接暴露用户数据,。因此,很有必要在发展物联网的同时建立起完整的数据保护法。
物联网机器学习是以人为中心的机器学习
由于物联网设备使互联网更贴近用户并触及人类生活的各个方面,因此它们通常允许收集相关数据。物联网数据描述了用户生活的方方面面,并使其比以往更容易理解用户的需求,愿望,历史和偏好。这使得物联网数据成为完善的数据,可以根据用户的个性创建个性化的应用程序。
而且由于物联网通过收集高度个性化的数据以及提供高度个性化的应用和服务来亲密接触我们的生活,因此物联网机器学习有真正成为以人为本的机器学习的资格。
-
物联网
+关注
关注
2909文章
44608浏览量
373108 -
机器学习
+关注
关注
66文章
8414浏览量
132612
原文标题:物联网中机器学习面临的挑战和机遇(二)
文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论