AI为什么这么聪明？揭秘看看“猜画小歌”背后的AI秘密-电子发烧友网

今天，谷歌推出首款微信小程序“猜画小歌”，迅速走红朋友圈。玩家中除了资深“你画我猜”爱好者，还有AI爱好者和围观“稀有生物”的吃瓜群众。毕竟隔着一层纱多少让谷歌平添了神秘感，再加上“人工智能”“首款”的噱头，这个小程序的火爆并不令人意外。

小程序发布后，不少网友在社交平台抱怨“猜画小歌”的命题太广了，芦笋、萨克斯、黑莓……这些题让灵魂画手们无处下笔。但大多数网友还是对AI表现出了一致好评，毕竟画个不规则方形就能猜出是水桶，这样的AI还真是懂我们的心。

除此之外，一些人也对AI的真实性和目的提出了质疑，可以理解，毕竟质疑是了解新事物的第一步嘛，下面我们就来看看“猜画小歌”背后的秘密。

AI为什么这么聪明？

确切来说，“猜画小歌”在国外已经火了一年多了，它的前身是AI涂鸦页游“快画”（Quick, Draw!）。

根据去年谷歌发布的数据，自2016年上线以来，玩家已经为“快画”绘制了超过10亿幅简笔画，其中包括290万只猫、290万个热狗、290万朵雪花和比夜空中可见的星星加起来还多的星形图案……

而根据小程序下的文字介绍，“猜画小歌”使用的数据集包含5000万张手绘素描，鉴于它的任务和“快画”一样是分类，这个庞大数据集足以支撑它的性能。简而言之，玩家的画在AI看来就是把苹果归类为苹果的过程，命题标签就是AI的检索字典。

至于它为什么能识别灵魂画手们“扭曲”的草图，这里隐藏着一个“伤人”的事实。一般情况下，每个人都认为自己是独一无二的，但当一百个、一千个、一万个人聚在一起，他的独特性就没这么明显了。

比如画人脸：

如果是一一对比，这三幅画很不同，圆脸的、长脸的，大眼睛、小眼睛。除了画上眉毛，一些人也喜欢画头发、画耳朵，总之，只要不是刻意，没有两个人能画出一模一样的画。

那么，把它们放进一千多张图里呢？

朋友们，请眯起眼纵览全局，除了个别几幅图，所有脸都表现出了同样的特征：一个圆，两个点，一段弧线。而且这条弧线有大概率是两端向上的，也就是一张微笑的脸。虽然AI捕捉的未必是这些特征，但这是不是解释了它为什么能看懂你的画——因为大部分人对事物外形的认知是很相近的。

至于这个圆为什么是蓝莓而不是篮球，下图也许能帮你答疑：

这是“快画”的分类机制。玩家画了一个灯泡，但这个灯泡既像灯，又像海龟，还像太阳。对于这样有类似特征的图像，AI就要根据从数据中学到的经验预测它属于某一类的概率，如果灯泡概率更高，那就猜灯，反之亦然。

数据越多，AI学到的经验就越靠谱。所以如果你觉得自己明明画虎类犬，但它还是说对了，那可能意味着把老虎化成狗的同志不在少数，让AI觉得老虎也能一幅狗样。

玩家在给谷歌贡献数据？

虽然在这个问题下聊隐私比较奇怪，但考虑到大家比较关注，还是提一下为好。谷歌是不是在用“猜画小歌”收集数据？不出意外的话，是，但这无伤大雅。

作为官方制作的页游，“快画”的定位比较明确——一个模型训练平台，AI模型利用神经网络对玩家的涂鸦进行评估，并以此作为训练数据不断自我学习，以提高对图像和光学字符的辨识能力。“猜画小歌”只是个小程序，应该还没上升到自我训练的地步，所以我们可以直接把它看作娱乐工具。

之前提到了，“快画”上线一年已经贡献了超过10亿幅简笔画，所以为什么要吝惜自己的这两三幅画呢？这些数据的作用是辅助艺术家进行创意工作、教授学生绘画基本技巧。

AI从不完整图形开始，绘制不同图像

幼儿对世界认知有限，但他们通过寥寥几笔就能描绘物体，甚至概括情感。这意味着视觉的功能是更新我们头脑中的世界内部模型，而我们画在纸上的东西概括了这个内部模型。虽然简笔画并不真实，但它能反映人类重建和表示周围环境图像的方式。

此前谷歌曾发表过一份基于简笔画的研究，他们训练了一个可以画简笔画神经网络模型，试图让它理解人类创意思维过程。研究取得了一定成果，但距离实现还很遥远。这是计算机所能做到的最接近做梦的事，如果能成功解构创意，人类可以加深对自己的理解，艺术家能拓宽思维，而幼儿也能以更直接的方式观察世界、了解世界。

小结

综上所述，这真的只是一个“让用户了解、体验人工智能的乐趣”的小游戏，没有必要怀疑，也没有必要紧张。当然，谷歌版“你画我猜”带来的乐趣可不止游戏，按照玩家地域分类，它还得出了一些有趣的结论。

夏天到了，西瓜、冷饮、电视剧是三大乐事，那么各国网友眼里的冰激凌是什么样的呢？

AI堆叠了简笔画告诉我们：意大利的甜筒有三个冰激凌球！！！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉