基于Intel Analytics Zoo上分布式TensorFlow的美的/KUKA工业检测平台-电子发烧友网

背景

工业检查（用于产品缺陷检测）是现代制造业的重要组成部分。随着人工智能，计算机视觉和大数据技术的发展，我们可以建立先进的工业检测系统以实现和人类水平媲美的准确性，并具有更高的效率和更低的成本。在本文中，我们将分享我们在美的/ KUKA，使用英特尔Analytics Zoo（一个基于Apache Spark、TensorFlow和BigDL的开源数据分析+ AI平台），来建立基于深度学习的工业检测平台的经验。

基于Analytics Zoo的端到端的解决方案

为了便于构建和生成大数据的深度学习应用程序，AnalyticsZoo（https://github.com/intel-analytics/analytics-zoo）提供了统一的数据分析+AI平台，可将Spark，TensorFlow和BigDL程序无缝集成到一个统一的数据分析流水线中；然后，整个流水线可以透明地扩展到（运行在标准的Intel至强服务器上的）Hadoop/Spark集群，以进行分布式训练或推理。

如上图所示，美的 / KUKA的工业检测平台是一个建立在Analytics Zoo之上的端到端数据分析流水线，包括

（1）使用Spark以分布式方式处理从制造流水线获取的大量图像。

（2）使用Tensorflow Object Detection API直接构建对象检测（例如，SSDLite + MobileNet V2）模型

（3）直接使用在第一步中预处理的图像RDD，以分布式方式在Spark集群上训练（或微调）对象检测模型。

（4）直接使用评估图像集的RDD，以分布式方式在Spark集群上评估（或推断）训练模型。

（5）使用Analytics-Zoo中POJO模式的API, 将整个Pipeline 部署在低延迟的、在线Web 服务中。

在检测时间期间，具有相机的工业机器人可以自动拍摄产品的照片，并通过HTTP将图像发送到网络服务以检测各种缺陷（例如，缺失标签或螺栓等），如下所示。

Spark，TensorFlow和BigDL的统一集成

如前所述，Analytics Zoo提供了“集成数据分析”的深度学习编程模型，因此用户可以轻松开发端到端的数据分析+ AI 流水线（使用Spark，TensorFlow，Keras等），然后透明地运行在大型Hadoop / Spark集群上、使用BigDL和Spark进行分布式训练和推理。此外，用户还可以轻松部署端到端的流水线，以实现低延迟的在线服务（使用Analytics Zoo提供的POJO风格的模型服务API）。

例如，为了以分布式方式处理缺陷检测流水线的训练数据，我们可以使用PySpark将原始图像数据读取到RDD中，然后应用一些变换来解码图像，并提取边界框和类标签，如下所示。

<<<<

train_rdd = sc.parallelize(examples_list)

.map(lambda x: read_image_and_label(x))

.map(lambda image: decode_to_ndarrays(image))

<<<<

返回的RDD（train_rdd）中的每条记录都包含一个NumPy ndarray的列表（即图像，边界框，类和检测到的框的数量），它可以直接用于创建TensorFlow模型，并在Analytics Zoo上进行分布式训练。我们可以通过创建TFDataset （如下所示）来实现这一功能。

<<<<

dataset = TFDataset.from_rdd(train_rdd,

names=["images", "bbox", "classes", "num_detections"],

shapes=[[300, 300, 3],[None, 4], [None], [1)]],

types=[tf.float32, tf.float32, tf.int32, tf.int32],

batch_size=BATCH_SIZE,

hard_code_batch_size=True)

<<<<

在Analytics Zoo中，TFDataset表示一个分布式存储的记录集合，其中每条记录包含一个或多个Tensorflow Tensor对象。然后我们可以直接将这些Tensor作为输入构建Tensorflow模型。例如，我们使用

了Tensorflow Object Detection API构建了SSDLite + MobileNet V2模型（如下图所示）：

<<<<

# using tensorflow object detection api to construct model

# https://github.com/tensorflow/models/tree/master/research/object_detection

from object_detection.builders import model_builder

images, bbox, classes, num_detections = dataset.tensors

detection_model = model_builder.build(model_config, is_training=True)

resized_images, true_image_shapes = detection_model.preprocess(images)

detection_model.provide_groundtruth(bbox, classes)

prediction_dict = detection_model.predict(resized_images, true_image_shapes)

losses = detection_model.loss(prediction_dict, true_image_shapes)

total_loss = tf.add_n(losses.values())

>>>>

在模型构建之后，我们首先加载预先训练的Tensoflow模型，然后使用Analytics Zoo中的TFOptimizer（如下所示）对模型进行微调训练；最终我们在验证数据集上达到0.97 mAP@0.5。

>>>>

with tf.Session() as sess:

init_from_checkpoint(sess, CHECKPOINT_PATH)

optimizer = TFOptimizer(total_loss, RMSprop(LR), sess)

optimizer.optimize(end_trigger=MaxEpoch(20))

save_to_new_checkpoint(sess, NEW_CHEKCPOINT_PATH)

>>>>

在运行过程中，Analytics-Zoo使用PySpark从磁盘中读取了输入数据并进行预处理，并构造了一个Tensorflow Tensor的RDD。然后，基于BigDL和Spark 对Tensorflow 模型进行分布式训练（如BigDL技术报告所述）。无需修改代码或手动配置，整个训练流程就可以自动从单个节点扩展到基于Intel至强服务器的大型Hadoop / Spark集群。

模型训练结束后，我们还可以基于与训练流程类似的流水线，使用PySpark，TensorFlow和BigDL在Analytics Zoo上执行大规模的分布式评估/推断。

低延迟的在线服务

如下所示，我们也可以使用Analytics Zoo提供的POJO风格的模型服务API轻松部署推理流水线，以实现低延迟的在线服务（例如，Web服务，Apache Storm，Apache Flink等等）。有关详细信息，请参阅 https://analytics-zoo.github.io/master/#ProgrammingGuide/inference/

<<<<

AbstractInferenceModel model = new AbstractInferenceModel(){};

model.loadTF(modelPath, 0, 0, false);

List<List<JTensor>> output = model.predict(inputs);

<<<<

结论

Midea / KUKA通过结合人工智能，计算机视觉和大数据技术，在Analytics Zoo（https://github.com/intel-analytics/analytics-zoo）上成功构建了先进的工业检测系统。它使用了工业机器人，相机和英特尔至强服务器等工具对产品的缺陷进行自动检测。尤其是Analytics Zoo提供统一的数据分析 + AI平台，可将Spark，BigDL和TensorFlow程序无缝集成到一个数据分析流水线中，从而可以轻松构建和生产化部署基于大数据的深度学习应用程序（包括分布式训练和推理，以及低延迟在线服务）。您可以参考Github上的示例了解更多详细信息。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
9960

浏览量
171736
Web服务

Web服务

+关注

关注
0

文章
26

浏览量
18458
SPARK

SPARK

+关注

关注
1

文章
105

浏览量
19903

分布式IO工业自动化数据采集与分析的核心

随着工业自动化技术的不断发展，分布式IO在工业自动化领域的应用越来越广泛。作为一种先进的控制技术，分布式IO能够实现设备的分布式控制和监测，

发表于 12-28 14:47

分布式入侵检测系统的设计

分布式入侵检测系统的设计入侵检测是网络安全的一个新方向，其重点是有效地提取特征数据并准确地分析出非正常网络行为。该文在深入研究分析公共入侵检测框架理论和现有入侵

发表于 03-10 09:55

分布式软件系统

分布式软件系统分布式软件系统(Distributed Software Systems)是支持分布式处理的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。它包括

发表于 07-22 14:53

LED分布式恒流原理

分布式恒流源节点设置分布式恒流技术就是在需要恒流的节点上串接，低压差线性恒流驱动器。低压差很重要，关系到产品驱动效率。做到恒流驱动有很多种，其中低压差线性恒流就可以实现一切LED应用设计，即稳定又简单

发表于 03-09 16:47

如何设计分布式干扰系统？

什么是分布式干扰系统？分布式干扰系统是一种综合化、一体化、小型化、网络化和智能化系统，是将众多体积小，重量轻，廉价的小功率侦察干扰机装置在易于投放的小型平台上，撒布在接近***扰目标空域地，通过指令

发表于 08-08 06:57

分布式系统的优势是什么？

当讨论分布式系统时，我们面临许多以下这些形容词所描述的同类型： 分布式的、删络的、并行的、并发的和分散的。分布式处理是一个相对较新的领域，所以还没有‘致的定义。与顺序计算相比、并行的、并发的和

发表于 03-31 09:01

分布式恒流的优缺点是什么？

　分布式恒流技术就是在需要恒流的节点上串接，低压差线性恒流驱动器。低压差很重要，关系到产品驱动效率。做到恒流驱动有很多种，其中低压差线性恒流就可以实现一切LED应用设计，即稳定又简单，结合开关电源，有着完美的恒流驱动架构。

发表于 04-01 09:03

TensorFlow的特点和基本的操作方式

Tensorflow是Google开源的深度学习框架，来自于Google Brain研究项目，在Google第一代分布式机器学习框架DistBelief的基础上发展起来。Tensorflow

发表于 11-23 09:56

如何高效完成HarmonyOS分布式应用测试？

2.0发布以来，开发者在测试和上架HarmonyOS分布式应用过程中遇到很多挑战和困难。总体可归纳为以下三点：分布式应用上架测试通过率低：开发者提交上架的分布式应用基础质量较差。如图

发表于 12-13 18:07

用Intel Analytics Zoo/BigDL为客服平台添加AI的实践（一）

本系列博客主要分享了微软 Azure 的团队使用 Intel Analytics Zoo 在 Azure 的平台上为客户支持服务平台添加 A

发表于 10-17 10:30 •4674次阅读

分布式工业物联网云平台是怎样的

分布式工业物联网云平台是基于智能传感器、无线传输技术、大规模数据处理与远程控制等物联网核心技术与互联网、无线通信、云计算大数据技术高度融合开发的一套物联网云服务平台。

发表于 06-25 10:35 •1738次阅读

Analytics Zoo: 统一的大数据分析+AI 平台

怎么应用 Analytics Zoo ？比如在阿里云上面部署 EMR，使用 Analytics Zoo。

发表于 07-02 11:18 •4798次阅读

Intel制造行业AI案例分享：美的工业视觉检测云平台

Intel制造行业AI案例分享：美的工业视觉检测云平台 [项目背景] 作为白色家电行业领军企业，美的

发表于 12-26 10:43 •4141次阅读

如何使用TensorFlow进行大规模和分布式的QML模拟

中，我们将逐步带您了解如何使用 TensorFlow 和 TensorFlow Quantum 进行大规模和分布式的

发表于 08-10 17:31 •2631次阅读

分布式工业物联网平台：引领智能制造的新篇章

随着全球化和信息化进程的加速，分布式工业物联网平台作为智能制造的重要基石，正逐步展现出其强大的潜力和广泛的应用前景。这一平台通过整合不同地区的人力物力资源，实现产品生产的最低消耗，并借

发表于 09-27 17:09 •232次阅读

搜索历史

基于Intel Analytics Zoo上分布式TensorFlow的美的/KUKA工业检测平台

评论

分布式IO工业自动化数据采集与分析的核心

分布式入侵检测系统的设计

分布式软件系统

LED分布式恒流原理

如何设计分布式干扰系统？

分布式系统的优势是什么？

分布式恒流的优缺点是什么？

TensorFlow的特点和基本的操作方式

如何高效完成HarmonyOS分布式应用测试？

用Intel Analytics Zoo/BigDL为客服平台添加AI的实践（一）

分布式工业物联网云平台是怎样的

Analytics Zoo: 统一的大数据分析+AI 平台

Intel制造行业AI案例分享：美的工业视觉检测云平台

如何使用TensorFlow进行大规模和分布式的QML模拟

分布式工业物联网平台：引领智能制造的新篇章