使用更“时尚”的数据开启机器学习的 Hello World 之门-电子发烧友网

本期 AI Adventure 中，Yufeng 会带领我们会按照之前分享的最佳实践来试着完整走一遍机器学习的整个流程。工作量有点大，但是聪明的你应该没问题。

使用 MNIST 数据* 来训练模型常常被看作是机器学习界的「Hello World」例子（使用标准的 MNIST 数据训练手写字符的识别模型），今天我们跟着 Yufeng 一起，使用更“时尚”的数据开启机器学习的 Hello World 之门。

* 段注：MNIST 是一个手写数字图像的数据集，每幅图像都由一个整数标记。它主要用于机器学习算法的性能对标。

“潮”起来的 Machine Learning

Zalando（来自德国的电子商务公司）决意要让 MNIST 再“火”一把，前段时间 Zalando 旗下的研究部门发布了叫做 Fashion-MNIST 的一个数据集。这是一个和 MNIST 具有相同格式的数据集，唯一的不同在于手写字符被替换成了服饰、鞋子、挎包等等内容。它仍然有 10 个种类，图像也仍然是 28x28 像素。

在 GitHub 查看更多对Fashion-MNIST数据集的介绍（中文）：

https://github.com/zalandoresearch/fashion-mnist/blob/master/README.zh-CN.md

我们一起训练一个模型，然后用它来甄别所属的服饰品类吧！

线性 Classifier

我们先从构建一个线性的 classifier 开始，来看看怎么操作。同以往一样，我们用 TensorFlow 的评估器框架（链接参见段后）来简化编程和维护。回忆一下，我们会经历加载数据、创建 classifier，然后运行训练和评估等操作。另外还会用本地模型直接做一些预测，官方文档参考：

https://tensorflow.google.cn/get_started/get_started_for_beginners?hl=zh-CN

下面从创建模型开始，我们首先把数据集中的图像从 28x28 的像素排布转为 1x784 的形式，然后将之称为特征列 pixels。此操作类似于 AIA 第三期：无需数学知识，轻松搞定鸢尾花辨识模型中出现的 flower_features。

feature_columns = [ tf.feature_column.numeric_column( "pixels", shape=784)]classifier = tf.estimator.LinearClassifier( feature_columns=feature_columns, n_classes=10, model_dir=logdir)

下一步创建线性的 classifier。我们有 10 种品类需要做标记，而不是之前鸢尾花案例中的三种。

要开始训练，我们需要配置数据集和输入函数。TensorFlow 有内置的函数接受一个 NumPy 型的数组用于生成输入函数，此处我们就用它来简化一下。

tf.estimator.inputs.numpy_input_fn( x={'pixels': X}, y=Y, batch_size=batch_size, num_epochs=epochs, shuffle=shuffle)DATA_SETS = input_data.read_data_sets( "/tmp/fashion-mnist")

接着用 input_data 模块把数据集载入，将函数参数指向数据集下载的位置。

然后通过调用 classifier.train() 把 classifier、输入函数和数据集都结合起来。

classifier.train( input_fn=train_input_fn, steps=num_steps)accuracy_score = classifier.evaluate( input_fn=eval_input_fn)['accuracy']

最终，我们进行一次评估来看看模型表现如何。使用经典 MNIST 数据集时，此模型常常得到 91% 左右的准确度。然后，由于时尚版 MNIST 有更复杂的数据集，所以只得到了略高于 80% 的精确度，甚至有时更低一些。

怎样才能改善呢？如 AIA第六期：通过深度神经网络再识 Estimator 中提到的那样进行就好了。

转为深度模型

切换到 DNNClassifier 就是换一行代码的功夫，现在重新开始训练，然后评估看看是否深度模型会比线性的好一些。

classifier = tf.estimator.DNNClassifier( feature_columns=feature_columns, n_classes=10, hidden_units=[100, 75, 50], model_dir=logdir )

正如第五期：通过 TensorBoard 将模型可视化中讨论的那样，我们应当用 TensorBoard 来横向并且比较一下两个模型。

tensorboard --logdir=models/fashion_mnist/

浏览器打开 http://localhost:6006

TensorBoard

看看 Tensorboard，似乎深度模型并没有比线性模型好到哪里去！这很可能是对超参数的微调不到位导致的，参见 AIA 第二期：机器学习常见的七个步骤。

看起来好像是要一路飙到底…

也许是我们的模型需要更大一些来容纳如此搞复杂度的模型？抑或训练应该更少一些？我们来试试看。经过屡次调试微参数，模型的失真度突破性降低了，并且比线性模型得到的精度更高。

深度模型（蓝色对比线性的红色线）的失真度保持较低状态

达到这一精度之前在训练中多了些步骤，但是最终得到更高精度又使得这些付出非常值得。

由图可见线性模型的平缓期来得比深度网络要早。这是由于深度模型复杂度更高，它们需要的训练时间更长。

此时，模型差不多满足我们的要求了。我们可以将其导出，然后产生一个可伸缩的时尚版 MNIST classifier API。至于如何导出，可以参照第四期中给出的详细步骤。

预测

我们快速回顾一下用评估器做预测的方法。很大程度上，它就像是我们训练和评估的方式；这也是评估器（框架）的极大优势——通用一致的函数接口。

X = DATA_SETS.test.images[5000:5005]predict_input_fn = tf.estimator.inputs.numpy_input_fn( x={'pixels': X}, batch_size=1, num_epochs=1, shuffle=False)predictions = classifier.predict( input_fn=predict_input_fn)

注意我们这次把 batch_size 指定为 1，num_epochs 指定为 1，shuffle 值为 false。这是因为我们想要按着顺序一个一个的预测，一次在所有数据上进行预测。我从评估所用数据集中间挑选了 5 幅图像用于预测。

我选择这 5 幅的原因不仅仅是因为它们在正中间，还因为这些模型中有两个是不正确的。两个都应该是衬衫，但却被模型认为第三个是包而第五个是大衣。由此，仅仅考虑图像的纹理变化这个因素，你能看到这些样本比起手写数字来说是多么有挑战性。

后续步骤

你可以在这个 Gist（链接在段后）上看到本次分享中所用来训练和生成图像的代码。你的模型表现如何？你所最终采用的参数又是什么样的？在评论当中分享一下吧！

https://gist.github.com/yufengg/2b2fd4b81b72f0f9c7b710fa87077145

精彩提要

后续的几期将会着眼于机器学习生态的工具，从而帮助你创建自己的操作流程和工具链。与此同时也会展示更多可以用来解决机器学习问题的模型体系结构。我非常期待能在后面的分享中继续为你分析解答！在那之前，不要忘了多使用机器学习！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

线性

线性

+关注

关注
0

文章
196

浏览量
25121
机器学习

机器学习

+关注

关注
66

文章
8357

浏览量
132336
数据集

数据集

+关注

关注
4

文章
1202

浏览量
24626

原文标题：AIA 系列实战篇 | 机器学习的「时尚版」Hello World

文章出处：【微信号：tensorflowers，微信公众号：Tensorflowers】欢迎添加关注！文章转载请注明出处。

微雪Arduino系列教程五：Hello World

某程序员退休后决定练习书法，于是重金购买文房四宝。一日，饭后突生雅兴，一番研墨拟纸，并点上上好檀香。定神片刻，泼墨挥毫，郑重地写下一行字：hello world！在我们学习C语言是，经典的入门程序

发表于 04-27 19:51

让机器向“时尚达人”学习的技巧概述

如何让机器向“时尚达人”学习？阿里做了个“实用”的图像数据集

发表于 09-16 13:41

Android开发之“hello World”的实现

按照惯例，同时也是为了更好地引导读者进入精彩的Android世界，我们接下来要实现一个简单的“hello World”例子。

发表于 08-24 11:20 •5553次阅读

Android开发之“<b class='flag-5'>hello</b> <b class='flag-5'>World</b>”的实现

NB3000_Hello_World

NB3000 Hello World，好东西，喜欢的朋友可以下载来学习。

发表于 02-18 16:38 •0次下载

Hello_World.Constraint

Hello World，好东西，喜欢的朋友可以下载来学习。

发表于 02-22 15:52 •0次下载

MICROCHIP MINUTES 4 - HELLO WORLD

欢迎观看MICROCHIP MINUTES之MPLAB® X IDE系列短片。在本视频中，我们将编译HELLO WORLD应用程序。本视频使用PICDEM™ Curiosity开发板及开发板上的PIC16F1619单片机。

发表于 06-07 05:46 •2863次阅读

【从零开始走进FPGA】 LCD1602 Hello World

关键词：FPGA , LCD1602 前面说过，在C,C++等语言学习中，“Hello World”将会是第一个学习的代码，但是在FPGA中由于电路驱动的复杂性，与单片机雷同，我们无法

发表于 10-01 15:40 •805次阅读

米尔科技Linux简单Hello World应用程序的教程

以下为米尔科技工程师在使用DS-5过程中总结的经验步骤，一个简单的实用Hello World工程。

发表于 11-21 17:02 •1356次阅读

米尔科技Linux简单<b class='flag-5'>Hello</b> <b class='flag-5'>World</b>应用程序的教程

如何用多种编程语言写“Hello,World!”程序

用 50 种编程语言写“Hello,World!”程序

发表于 01-09 13:49 •3915次阅读

教你如何搭建浅层神经网络"Hello world"

作为图像识别与机器视觉界的 "hello world!" ，MNIST ("Modified National Institute of Standards and Technology")

发表于 12-10 18:35 •891次阅读

基于Nios 的 hello world

基于Nios || 的 hello world一、Qsys二、Nios ||介绍三、利用Niso ||实现hello world（一）硬件设计（二）软件设计（三）下载硬件和软件一、Qs

发表于 11-30 17:36 •9次下载

HELLO WORLD!

HELLO WORLD！

发表于 12-03 16:21 •8次下载

STM32开发入门（二）——Hello World

STM32开发入门（二）——Hello World

发表于 12-07 18:51 •11次下载

ZYNQ学习笔记_ZYNQ简介和Hello World

ZYNQ学习笔记_ZYNQ简介和Hello WorldZYNQ介绍PS和PL的连接ZYNQ开发工具链在PS端编写Hello World程序ZYNQ介绍ZYNQ-7000系列是基于Xil

发表于 12-22 19:11 •10次下载

Zynq上使用Vitis的双ARM Hello World

电子发烧友网站提供《Zynq上使用Vitis的双ARM Hello World.zip》资料免费下载

发表于 12-14 10:15 •1次下载

搜索历史

使用更“时尚”的数据开启机器学习的 Hello World 之门

评论

微雪Arduino系列教程五：Hello World

让机器向“时尚达人”学习的技巧概述

Android开发之“hello World”的实现

NB3000_Hello_World

Hello_World.Constraint

MICROCHIP MINUTES 4 - HELLO WORLD

【从零开始走进FPGA】 LCD1602 Hello World

米尔科技Linux简单Hello World应用程序的教程

如何用多种编程语言写“Hello,World!”程序

教你如何搭建浅层神经网络"Hello world"

基于Nios 的 hello world

HELLO WORLD!

STM32开发入门（二）——Hello World

ZYNQ学习笔记_ZYNQ简介和Hello World

Zynq上使用Vitis的双ARM Hello World