0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习的最新研究成果很少转化成商业产品,是真的吗?

jmiy_worldofai 来源:lq 2019-01-22 10:05 次阅读

我们都知道最新的科研成果和实际商业应用中使用的技术会有一定的距离。一面是高复杂度、特定(较简单一致)的输入和直接量化的性能指标,另一面是资源成本的限制、为各种各样情况考虑预案,以及评价标准要变成更高阶、更综合性的用户满意度、营收等等。

所以实际上,即便整个计算机科学界、互联网商业中大家一直对AI抱有热情,我们能看到的使用了机器学习的商业化产品也并不多,高度集中在图像处理、文本翻译和语音识别几类任务中,具体使用的算法也往往并不是学术界内认为先进的算法。

有网友观察到了这样的现象,在 Hacker News的问答板块提问道:「学术界一直在不停地做出新的科研进展,但是工业界好像并没有选择使用这些新鲜成果,包括胶囊网络或者自动网络搜索方面的成果。所以说前沿的科学技术研究和技术商业化之间就是注定有深深的鸿沟吗?这些新研究出的模型都没有什么可能快速商业化、变成产品吗?」

曾在斯坦福大学与 UC伯克利大学学习计算机科学、在谷歌大脑团队实习,如今身为全栈开发工程师DennyBritz给出了一些自己的想法:

大多数科研成果带来的提升比较有限,而新的技术要有能力带来足够大的提升才会被产业界吸收。99.9%的科研论文提出的技术都是带来优化指标(评价指标,比如准确率、ROCAUC、BLEU分数等等)的小幅提升。然而表现提升的同时一般都伴随着计算复杂度的提升、更高的训练成本、更低的模型稳定性、代码可维护性的挑战等等。对于谷歌广告词搜索、谷歌翻译之外的绝大多数企业的业务来说,只为了把某项优化指标的数字提升一点点就增加许多成本是根本划不来的。使用一个现成的、经过时间考验的简单、成熟、稳定的模型要好得多,训练很快、维护简单。即便它们的跑分会低 1%。

学术研究一般都关心的是如何改进模型,那么在研究中就不可以改变训练/测试数据。对于科研来说这是理所当然的,毕竟在同样的数据上跑出来的结果才有可比性。但是在真实世界中,你可以自由地收集更多的训练数据、清理数据、选择更有针对性的验证和测试数据,等等。在大多数情况下,有更准确的、更多的数据、更干净的数据,都要比换一个更强的模型效果更好。而且处理数据的事情也更好做,更有迹可循。所以对于产业界来说,他们把精力花在数据上通常更合适。

科研论文里使用的优化指标没有什么能直接迁移到真实世界的商业指标中的,而且同时有很多科研中的想法会过拟合到这些指标和/或数据集上。比如,研究机器翻译的论文都会优化一个叫做「BLEU 分数」的指标,但是真实的翻译应用中需要考虑的用户满意度和「用户评分分数」。这可就是学术科研很难优化的了。类似地,商业产品并不能直接把「ImageNet 图像分类准确率」拿出来卖,不仅模型在应用场景中面对的图像会与 ImageNet 数据集不同,用户满意度也并不直接对等于识别准确率。科研论文会关心特定数据集上的特定指标(因为论文就是这样评审的),但是一个模型在这个数据集上的这个指标表现好,不一定它在别的数据集、别的指标也有好的表现(即便数据集和指标可能是类似的)。实际上,即便是含有已知的错误的数据集也会在科研研究中一直用下去,因为不同的技术以前就是在这些数据集上比较的(雷锋网 AI 科技评论有篇旧文解析过ImageNet中错误分类的图像)。而商业应用里就不会发生这样的事情。

对于这个问题,你认同提问者的观察吗?你对这样的现象有别的见解吗?欢迎留言与我们讨论。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    11163

    浏览量

    103427
  • 计算机科学
    +关注

    关注

    1

    文章

    144

    浏览量

    11377
  • 机器学习
    +关注

    关注

    66

    文章

    8423

    浏览量

    132746

原文标题:机器学习的最新研究成果很少转化成商业产品,是真的吗?

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一个正弦波信号转化成直流信号,在通过压频转换器转化成频率,这个频率怎么采集?

    一个正弦波信号转化成直流信号,在通过压频转换器转化成频率,那么这个频率怎么采集,需要什么芯片采集?
    发表于 12-17 06:45

    SynSense时识科技与海南大学联合研究成果发布

    近日,SynSense时识科技与海南大学联合在影响因子高达7.7的国际知名期刊《Computers in Biology and Medicine》上发表了最新研究成果,展示了如何用低维信号通用类脑
    的头像 发表于 10-23 14:40 321次阅读
    SynSense时识科技与海南大学联合<b class='flag-5'>研究成果</b>发布

    中移芯昇发布智能可信城市蜂窝物联网基础设施研究成果

    8月23日,雄安新区RISC-V产业发展交流促进会顺利召开,芯昇科技有限公司(以下简称“中移芯昇”)总经理肖青发布智能可信城市蜂窝物联网基础设施研究成果,为雄安新区建设新型智慧城市赋能增效。该成果
    的头像 发表于 08-31 08:03 644次阅读
    中移芯昇发布智能可信城市蜂窝物联网基础设施<b class='flag-5'>研究成果</b>

    输入文字转化语音

    一、介绍 基于鸿蒙Next模拟一个输入用户文字,转化成语音播报效果二、场景需求 辅助功能:为视障人士提供帮助:将文字内容转化为语音,使视觉障碍用户能够获取信息。 教育与学习:语言学习
    发表于 08-28 10:54

    如何将小电流信号转化成高压信号?

    因为是高速信号。脉宽在30ns。 电流小到26uA,想转化成电压信号再进行放大。有什么好的方法吗
    发表于 08-21 08:30

    OPA615把输出的信号接一个小电阻转化成电压信号直接送入STM32的ADC采集口是否可以?

    如果想把输出的信号接一个小电阻转化成电压信号直接送入STM32的ADC采集口是否可以?还是输出级要加入缓冲级?
    发表于 08-13 06:37

    用yolov5的best.pt导出成onnx转化成fp32 bmodel后在Airbox上跑,报维度不匹配怎么处理?

    用官方的模型不出错,用自己的yolov5训练出来的best.pt导出成onnx转化成fp32 bmodel后在Airbox上跑,出现报错: linaro@bm1684:~/yolov5/python
    发表于 05-31 08:10

    FPGA设计中 Verilog HDL实现基本的图像滤波处理仿真

    今天给大侠带来FPGA设计中用Verilog HDL实现基本的图像滤波处理仿真,话不多说,上货。 1、用matlab代码,准备好把图片转化成Vivado Simulator识别的格式,即每行一
    发表于 05-20 16:44

    北航教授团队推出微型机器昆虫BHMbot最新研究成果

    提升微型动力系统的能量转换效率。研究团队利用直线式驱动器将电能转化为机械能,再由柔性铰链传动机构将其转变为仿生腿的周期振动及机器昆虫的高频弹跳运动,从而实现电能至动能的高效转换。
    的头像 发表于 05-16 17:23 775次阅读

    聚焦产业发展 加速成果转化——沈阳市IPv6/IPv6+中试基地

    沈阳市把科技成果转化中试基地作为“创新链”和“产业链”之间的关键纽带,以市场需求为导向,聚焦产业发展,加速提升科技成果应用转化效能,大力推进沈阳市科技
    的头像 发表于 05-11 08:36 916次阅读
    聚焦产业发展 加速<b class='flag-5'>成果</b><b class='flag-5'>转化</b>——沈阳市IPv6/IPv6+中试基地

    量子计算+光伏!本源研究成果入选2023年度“中国地理科学十大研究进展”

    近日中国地理学会公布了2023年度“中国地理科学十大研究进展”本源量子参与的“量子地理计算技术、软件及应用”研究成果获选系量子计算领域唯一入选单位来源:中国地理学会此次入选的“量子地理计算技术、软件
    的头像 发表于 05-10 08:22 511次阅读
    量子计算+光伏!本源<b class='flag-5'>研究成果</b>入选2023年度“中国地理科学十大<b class='flag-5'>研究</b>进展”

    俄罗斯诺镍在京发布清洁能源创新研究成果

    俄罗斯诺镍(以下简称诺镍)日前于在华举办的一重要能源会议上展示了其在利用钯生产清洁能源(包括氢能)方面的尖端研究成果。诺镍于会后被中国氢能联盟吸纳为成员单位。 为了实现2050年全球碳中和目标,诺镍
    的头像 发表于 04-09 17:27 386次阅读

    研究动态】万物纵横杨帆博士在Applied Soft Computing发表石化生产异常工况预警的人工智能算法研究成果

    近日,计算机科学领域著名期刊《Applied Soft Computing》(SCI一区, Top期刊)刊载了四川万物纵横 杨帆博士 与四川大学合作的最新工业智能研究成果《基于注意力机制的催化裂化装置异常工况预警》
    的头像 发表于 01-23 13:32 626次阅读
    【<b class='flag-5'>研究</b>动态】万物纵横杨帆博士在Applied Soft Computing发表石化生产异常工况预警的人工智能算法<b class='flag-5'>研究成果</b>

    ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗?

    请问,ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗? ADUCM350可以处理惯性传感器收集的运动信号吗? 同时收集和处理生物阻抗、声音、运动信号,除了评估套装(EVAL-ADUCM350EBZ)以外,还需要购买其他配套的评估板吗?
    发表于 01-11 07:10

    怎么用verdi将fsdb格式的波形转化成txt呢?

    和大家分享一个小技巧,你在debug问题的时候,是不是也曾经想过将波形中的某些信号转化成txt,然后用txt的值复现某些波形或者与理论值对比。
    的头像 发表于 01-10 09:19 2926次阅读
    怎么用verdi将fsdb格式的波形<b class='flag-5'>转化成</b>txt呢?