Google开源了一款名为TensorFlow Federated的框架-电子发烧友网

【导语】据了解，全球有 30 亿台智能手机和 70 亿台边缘设备。每天，这些电话与设备之间的交互不断产生新的数据。传统的数据分析和机器学习模式，都需要在处理数据之前集中收集数据至服务器，然后进行机器学习训练并得到模型参数，最终获得更好的产品。

但如果这些需要聚合的数据敏感且昂贵的话，那么这种中心化的数据收集手段可能就不太适用了。

去掉这一步骤，直接在生成数据的边缘设备上进行数据分析和机器学习训练呢？

近日，Google 开源了一款名为 TensorFlow Federated （TFF）的框架，可用于去中心化（decentralized）数据的机器学习及运算实验。它实现了一种称为联邦学习（Federated Learning，FL）的方法，将为开发者提供分布式机器学习，以便在没有数据离开设备的情况下，便可在多种设备上训练共享的 ML 模型。其中，通过加密方式提供多一层的隐私保护，并且设备上模型训练的权重与用于连续学习的中心模型共享。

传送门：https://www.tensorflow.org/federated/

实际上，早在 2017 年 4 月，Google AI 团队就推出了联邦学习的概念。这种被称为联邦学习的框架目前已应用在 Google 内部用于训练神经网络模型，例如智能手机中虚拟键盘的下一词预测和音乐识别搜索功能。

图注：每台手机都在本地训练模型（A）；将用户更新信息聚合（B）；然后形成改进的共享模型（C）。

DeepMind 研究员Andrew Trask 随后发推称赞：“Google 已经开源了Federated Learning……可在数以百万计的智能手机上共享模型训练！”

让我们一起来看看使用教程：

从一个著名的图像数据集 MNIST 开始。MNIST 的原始数据集为 NIST，其中包含 81 万张手写的数字，由 3600 个志愿者提供，目标是建立一个识别数字的 ML 模型。

传统手段是立即将 ML 算法应用于整个数据集。但实际上，如果数据提供者不愿意将原始数据上传到中央服务器，就无法将所有数据聚合在一起。

TFF 的优势就在于，可以先选择一个 ML 模型架构，然后输入数据进行训练，同时保持每个数据提供者的数据是独立且保存在本地。

下面显示的是通过调用 TFF 的 FL API，使用已由 GitHub 上的“Leaf”项目处理的 NIST 数据集版本来分隔每个数据提供者所写的数字：

GitHub 传送链接：https://github.com/TalwalkarLab/leaf

#Load simulationdata.source,_=tff.simulation.datasets.emnist.load_data()defclient_data(n):dataset=source.create_tf_dataset_for_client(source.client_ids[n])returnmnist.keras_dataset_from_emnist(dataset).repeat(10).batch(20)#WrapaKerasmodelforusewithTFF.defmodel_fn():returntff.learning.from_compiled_keras_model(mnist.create_simple_keras_model(),sample_batch)#Simulateafewroundsoftrainingwiththeselectedclientdevices.trainer=tff.learning.build_federated_averaging_process(model_fn)state=trainer.initialize()for_inrange(5):state,metrics=trainer.next(state,train_data)print(metrics.loss)

除了可调用 FL API 外，TFF 还带有一组较低级的原语（primitive），称之为 Federated Core (FC) API。这个 API 支持在去中心化的数据集上表达各种计算。

使用 FL 进行机器学习模型训练仅是第一步；其次，我们还需要对这些数据进行评估，这时就需要 FC API 了。

假设我们有一系列传感器可用于捕获温度读数，并希望无需上传数据便可计算除这些传感器上的平均温度。调用 FC 的 API，就可以表达一种新的数据类型，例如指出 tf.float32，该数据位于分布式的客户端上。

READINGS_TYPE=tff.FederatedType(tf.float32,tff.CLIENTS)

然后在该类型的数据上定义联邦平均数。

@tff.federated_computation(READINGS_TYPE)defget_average_temperature(sensor_readings):returntff.federated_average(sensor_readings)

之后，TFF 就可以在去中心化的数据环境中运行。从开发者的角度来讲，FL 算法可以看做是一个普通的函数，它恰好具有驻留在不同位置（分别在各个客户端和协调服务中的）输入和输出。

例如，使用了 TFF 之后，联邦平均算法的一种变体：

参考链接：https://arxiv.org/abs/1602.05629

@tff.federated_computation(tff.FederatedType(DATASET_TYPE,tff.CLIENTS),tff.FederatedType(MODEL_TYPE,tff.SERVER,all_equal=True),tff.FederatedType(tf.float32,tff.SERVER,all_equal=True))deffederated_train(client_data,server_model,learning_rate):returntff.federated_average(tff.federated_map(local_train,[client_data,tff.federated_broadcast(server_model),tff.federated_broadcast(learning_rate)]))

目前已开放教程，可以先在模型上试验现有的 FL 算法，也可以为 TFF 库提供新的联邦数据集和模型，还可以添加新的 FL 算法实现，或者扩展现有 FL 算法的新功能。

据了解，在 FL 推出之前，Google 还推出了 TensorFlow Privacy，一个机器学习框架库，旨在让开发者更容易训练具有强大隐私保障的 AI 模型。目前二者可以集成，在差异性保护用户隐私的基础上，还能通过联邦学习（FL）技术快速训练模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Google

Google

+关注

关注
5

文章
1772

浏览量
57883
机器学习

机器学习

+关注

关注
66

文章
8454

浏览量
133170
数据集

数据集

+关注

关注
4

文章
1210

浏览量
24865

原文标题：让数百万台手机训练同一个模型？Google把这套框架开源了

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

卷积神经网络的实现工具与框架

： TensorFlow是由Google Brain团队开发的开源机器学习框架，它支持多种深度学习模型的构建和训练，包括卷积神经网络。TensorF

发表于 11-15 15:20 •343次阅读

Google AI Edge Torch的特性详解

已经支持 Jax、Keras 和 TensorFlow 编写的模型，现在我们加入了对 PyTorch 的支持，进一步丰富了框架选择。

发表于 11-06 10:48 •495次阅读

分享一款GUI开发神器

GT-HMI（Human Machine Interface）国产开源 GUI 框架及永久免费设计软件。

发表于 11-06 09:29 •516次阅读

介绍一款Java开发的开源MES系统

介绍一款Java开发的开源MES系统，万界星空科技开源的MES系统。该系统基于Java开发，具有广泛的适用性和高度的可定制性，能够满足不同行业、不同规模企业的智能制造需求。

发表于 09-05 17:39 •800次阅读

TensorFlow是什么？TensorFlow怎么用？

TensorFlow是由Google开发的一个开源深度学习框架，它允许开发者方便地构建、训练和部署各种复杂的机器学习模型。

发表于 07-12 16:38 •871次阅读

tensorflow和pytorch哪个更简单?

： TensorFlow和PyTorch都是用于深度学习和机器学习的开源框架。TensorFlow由Google Brain团队开发，而Py

发表于 07-05 09:45 •1057次阅读

tensorflow和pytorch哪个好

tensorflow和pytorch都是非常不错的强大的框架，TensorFlow还是PyTorch哪个更好取决于您的具体需求，以下是关于这两个框架的

发表于 07-05 09:42 •797次阅读

tensorflow简单的模型训练

在本文中，我们将详细介绍如何使用TensorFlow进行简单的模型训练。TensorFlow是一个开源的机器学习库，广泛用于各种机器学习任务，包括图像识别、自然语言处理等。我们将从安装

发表于 07-05 09:38 •810次阅读

keras模型转tensorflow session

和训练深度学习模型。Keras是基于TensorFlow、Theano或CNTK等底层计算框架构建的。TensorFlow是一个开源的机器学

发表于 07-05 09:36 •612次阅读

TensorFlow的定义和使用方法

TensorFlow是一个由谷歌人工智能团队谷歌大脑（Google Brain）开发和维护的开源机器学习库。它基于数据流编程（dataflow programming）的概念，将复杂的

发表于 07-02 14:14 •961次阅读

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习作为人工智能领域的一个重要分支，在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中，深度学习框架扮演着至关重要的角色。TensorFlow和PyTorch是目前最受欢迎的两大深度

发表于 07-02 14:04 •1139次阅读

一文探讨一款名为H6-C111B2W的LED

在探索现代电子元件的微观世界中，我们经常会遇到一些令人费解的技术参数，它们如同星空中的星座，既复杂又神秘。今天，我们将深入探讨一款名为H6-C111B2W的LED产品，它的参数如同一幅

发表于 03-22 18:03 •1145次阅读

谷歌模型框架是什么软件？谷歌模型框架怎么用？

谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架，其中最著名的是TensorFlow。TensorFlow是一个

发表于 03-01 16:25 •1012次阅读

三星显示展出一款名为Cling Band的卷曲腕戴概念机

WitDisplay消息，在折叠之后，卷曲是许多人预想中的下一个手机新型态。而在此次 MWC 上，柔性 OLED 面板龙头三星显示便带来了一款名为 Cling Band 的卷曲腕戴概念机。

发表于 02-29 11:07 •874次阅读

AURIX TC397是否可以搭配Google TensorFlow的演算法去运算?

请问各位大神，AURIX TC397 是否可以搭配 Google TensorFlow 的演算法去运算??

发表于 02-18 06:05

搜索历史

Google开源了一款名为TensorFlow Federated的框架

评论

卷积神经网络的实现工具与框架

Google AI Edge Torch的特性详解

分享一款GUI开发神器

介绍一款Java开发的开源MES系统

TensorFlow是什么？TensorFlow怎么用？

tensorflow和pytorch哪个更简单?

tensorflow和pytorch哪个好

tensorflow简单的模型训练

keras模型转tensorflow session

TensorFlow的定义和使用方法

TensorFlow与PyTorch深度学习框架的比较与选择

一文探讨一款名为H6-C111B2W的LED

谷歌模型框架是什么软件？谷歌模型框架怎么用？

三星显示展出一款名为Cling Band的卷曲腕戴概念机

AURIX TC397是否可以搭配Google TensorFlow的演算法去运算?