0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习:三张拉面图,就能识别出每碗拉面在哪家出品

DPVg_AI_era 来源:未知 作者:伍文辉 2018-03-30 16:01 次阅读

只要三张拉面图,就能识别出每碗拉面是在41家不同拉面店中的哪家制作出来。数据科学家Kenji Doi开发了一种拉面专家AI分类器,它能辨别出不同拉面之间的细微差异。这背后,是谷歌AutoML Vision提供的ML模型。

看下面的三碗拉面。你能相信机器学习(ML)模型能以95%的准确率识别出每碗拉面是在41家拉面店中的哪家制作的么?数据科学家Kenji Doi开发了一种拉面专家AI分类器,它能辨别出不同拉面之间的细微差异。

拉面Jiro是日本最受欢迎的连锁餐厅之一,因为它的配料、面条和汤的价格都很便宜。这个连锁餐厅在东京有41家分店,每家店都有基本相同的菜单。

正如你在照片中所看到的,对于一个刚刚接触拉面的人来说,几乎不可能知道每碗面的制作材料是什么,因为它们看起来几乎是一样的。你不相信自己可以通过看这些照片来辨别这些面到底属于41家餐馆的哪一家。

Kenji想知道深度学习是否能帮助解决这个问题。他从网络上收集了48,244张Jiro做的拉面的图片。在删除了不适合进行模型训练的照片之后(比如重复照片或没有拉面的照片),他为每个餐馆准备了大约1,170张照片,也就是48000张带有商店标签的照片。

AutoML Vision达到了94.5%的准确率

当Kenji正在研究这个问题时,他了解到Google刚刚发布了AutoML Vision的alpha版本。

AutoML Vision允许用户在不具备设计ML模型的专业知识的情况下使用自己的图像定制ML模型。首先,你要做的就是上传图像文件进行模型训练,并确保上传数据具有正确的标签。一旦完成了定制模型的训练,您就可以轻松地将其应用到到可扩展的服务平台上,以便通过自动扩展拥有的资源来满足实际需求。整个过程是为那些不具备专业ML知识的非数据科学家设计的。

AutoML Vision训练、部署和服务自定义ML模型的过程

当Kenji获得了AutoML Vision的alpha版本后,他试了一下。他发现用带有商店标签的拉面照片作为数据集训练模型时,F值可以达到94.5%,其中精确率未94.8%,召回率为94.5%。

使用AutoML Vision(高级模式)的拉面店分类器的混淆矩阵(行=实际店铺,栏=预测店铺)

通过观察上图的混淆矩阵,您可以看到AutoML Vision在每个测试样例中,仅仅对几个样本做出了错误的分类。

这怎么可能?每个照片使用AutoML检测区别是什么?Kenji想知道ML模型如何能准确地识别出拉面对应的商店。起初,他认为模型是在看碗,或桌子的颜色或形状。但是,正如你在上面的照片中所看到的,即使每个商店在他们的照片中使用了相同的碗和桌子设计,这个模型也非常准确。Kenji的新理论是,该模型精确地能够区分肉块和浇头的细微差别。他计划继续在AutoML上做实验,看看他的理论是否正确。

数据科学的自动化技术

在尝试AutoML Vision之前,Kenji花了相当多的时间来为他的拉面分类项目建立自己的ML模型。他仔细地选择了一个通过Inception,ResNetSE-ResNeXt获得的一个集合模型,构建了一个数据增强设置,在超参数调优上耗费了很长的时间,如改变学习率等,并引入他积累的知识作为一个专家知识。

但是,通过AutoML Vision,Kenji发现他唯一需要做的就是上传图片并点击“训练”按钮,仅此而已。通过AutoML Vision,他不费吹灰之力就能够训练一个ML模型。

标记图像集的示例。借助AutoML Vision,您只需上传带有标签的图像即可开始使用

当使用AutoML Vision训练一个模型时,有两种模式任你选择:基本模式或高级模式。在基本模式下,AutoML Vision可以在18分钟之内完成Kenji的训练数据。在高级模式下用了将近24个小时。在这两种情况下,他都没有执行任何超参数调优、数据扩充或尝试不同的ML模型类型。一切都是自动化处理,不需要拥有相关的专业知识。

据Kenji说,“在基本模式下无法获得最优的准确性,但是可以在很短的时间内得到一个粗略的结果。而高级模式可以在用户不进行任何优化或具备任何学习技能的情况下获得最优的精度。这样看来,这个工具肯定会提高数据科学家的生产力。数据科学家们已经为我们的客户进行了太多的人工智能解答,因此,我们必须尽快将深度学习应用到PoCs上。有了AutoML Vision,数据科学家就不需要为了获得最优的模型结果花很长时间来培训和优化模型获。这意味着即使只有拥有限数量的数据科学家,企业也可以扩大他们的人工智能产业。”

他喜欢AutoML Vision还有因为其另外一个特点:“AutoML Vision太酷了,你可以在训练后使用它的在线预测功能。而这项任务对于数据科学家来说通常是特别耗时的,因为必须要将模型部署到生产服务环境中后,再对其进行管理。”

以90%的准确率将商品进行品牌分类

AutoML Vision在另一个不同的用例中也证明了它的能力:对产品进行品牌分类。Mercari是日本最受欢迎的销售APP之一,它在美国也受到越来越多人的青睐,它一直在尝试通过闪频的图片自动识别其品牌。

Mercari官网

在日本,Mercari推出了一款名为Mercari MAISONZ的新App,用于销售品牌商品。Mercari在这款应用中开发了自己的ML模型,在用户的图片上传界面中,该模型可以对12个主要品牌的商品进行分类。该模型使用了VGG16在TensorFlow上的迁移学习,准确率达到75%。

正如ML模型预测的那样,用户上传图片界面显示了品牌名称

而当Mercari在AutoML Vision的高级模式下尝试用5000个训练来进行训练,它达到了91.3%的准确率。这比他们现有的模型高出了15%。

Mercari的AutoML Vision模型(高级模式)的准确性分数(精确度/召回率)

Mercari的AutoML Vision模型的混淆矩阵(高级模式)

对AutoML Vision的近距离观察

Mercari的数据科学家Shuhei Fujiwara对这个结果感到非常惊讶,他说:“我无法想象谷歌是如何做到如此高精度的!”

用于大规模图像分类和对象检测的AutoML

高级模式里面,除了转移学习还有什么呢?实际上,其中还包括谷歌的学习技术,特别是NASNet。

NASNet使用ML来优化ML:元级ML模型试图为特定的训练数据集获得最佳的深度学习模型。这才是高级模式的秘密,它代表了谷歌的“人工智能”哲学。这项技术可以让用户在不用长时间学习人工智能的情况下,充分地利用最先进的深度学习能力。

Shuhei还很喜欢这项服务的用户界面。“它很容易使用,你不需要对超参数优化做任何的人工处理,而且在UI上的一个混淆矩阵也为用户来带了方便,因为它可以帮助用户快速检查模型的准确性。该服务还允许你将最耗时的人工标记工作交给谷歌。因此,我们正在等待公测版本取代现有的自动化版本,这样就可以将其部署到生产环境中了。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105110
  • 人工智能
    +关注

    关注

    1791

    文章

    46872

    浏览量

    237600
  • 机器学习
    +关注

    关注

    66

    文章

    8378

    浏览量

    132424

原文标题:【谷歌云AutoML Vision官方教程】手把手教会训练模型解决计算机视觉问题,准确率达94.5%

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ASR和机器学习的关系

    自动语音识别(ASR)技术的发展一直是人工智能领域的一个重要分支,它使得机器能够理解和处理人类语言。随着机器学习(ML)技术的迅猛发展,ASR系统的性能和准确性得到了显著提升。 ASR
    的头像 发表于 11-18 15:16 220次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 244次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    用EDA做了一校园卡但是发现学校大门刷不进去,学校内充当饭卡时能正常识别,不知道哪里出问题了

    但是还是没弄明白原因。 用手机带的NFC功能和学校的付款机器都能识别出焊上去的芯片,唯独有一些门禁,尤其是大门门禁闸机识别不出来 恳请大佬们帮忙解答一下,比较急,不胜感激
    发表于 10-27 20:51

    如何理解机器学习中的训练集、验证集和测试集

    理解机器学习中的训练集、验证集和测试集,是掌握机器学习核心概念和流程的重要一步。这者不仅构成了模型学习
    的头像 发表于 07-10 15:45 3239次阅读

    人工智能、机器学习和深度学习是什么

    在科技日新月异的今天,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)已成为
    的头像 发表于 07-03 18:22 1117次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1200次阅读

    特斯拉面临库存危机

    车市内卷严重;车企之间竞争激烈,似乎特斯拉的日子也不太好过了,不仅仅是大刀阔斧的裁员10%,而且库存积压问题开始越加凸显。 据外媒报道,特斯拉官方公布的统计数据显示:特斯拉在2024年的第一季度,共生产新车433371辆,销售了386810辆,还有46561辆新车成了库存积压。 在特斯拉的得克萨斯超级工厂周围停车场已经停得满满当当;根据SkyFi提供的卫星图像显示:特斯拉停车场停放着大量库存成品车。 网友评论称即使在太空中也能通过感受到特斯
    的头像 发表于 06-12 17:38 805次阅读

    机器学习入门:基本概念介绍

    机器学习(GraphMachineLearning,简称GraphML)是机器学习的一个分支,专注于利用图形结构的数据。在图形结构中,数据
    的头像 发表于 05-16 08:27 477次阅读
    <b class='flag-5'>图</b><b class='flag-5'>机器</b><b class='flag-5'>学习</b>入门:基本概念介绍

    国内哪家的FPGA适合初学者

    如题,想着手学习FPGA的话,国内哪家的比较好,更适合初学者学习?这方面的经验,是一点都没。
    发表于 04-14 19:17

    机器学习怎么进入人工智能

    ,人工智能已成为一个热门领域,涉及到多个行业和领域,例如语音识别机器翻译、图像识别等。 在编程中进行人工智能的关键是使用机器学习算法,这是
    的头像 发表于 04-04 08:41 266次阅读

    基于CYUSB3014做了一块USB3.0的开发板,怎么样能让FX3被识别出USB3.0呢?

    运行,但是不能使用USB3.0功能了。请问我应该怎么样能让FX3被识别出USB3.0呢?谢谢!麻烦了。​
    发表于 02-28 08:14

    特斯拉面临4680电池生产挑战

     针对这一现象,笔者特意了解到,自2023年下半年开始,特斯拉已经引进了两家来自中国二线电池制造商生产的正极极片,这些电池还将送往其位于美国得克萨斯州的工厂进行后续加工处理。
    的头像 发表于 01-23 14:31 566次阅读

    什么是机器学习?它的重要性体现在哪

    机器学习是一种人工智能(AI)的子领域,旨在使计算机系统通过经验自动学习和改进,而无需明确地进行编程。它侧重于开发算法和模型,使计算机能够从数据中提取模式、进行预测和做出决策,而无需显式地指示特定
    的头像 发表于 01-05 08:27 1441次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?它的重要性体现<b class='flag-5'>在哪</b>

    adxl345得到个轴的数据后该怎么处理识别出左右上下前后几个方向呢?

    请问得到个轴的数据后该怎么处理然后识别出左右上下前后几个方向呢? 了好久都识别不出来~~~
    发表于 01-02 08:05

    ADIS16460配置imu后直接读取传感器的数据,debug看数据的话明显不对是什么问题?

    配置imu,后直接读取传感器的数据,debug看数据的话,数据明显不对,这个是什么问题;tips:在配置的时候进行了恢复工厂校准。第一是配置imu,第二是读取数据,第三张是实时显
    发表于 12-28 08:09