0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习的下一个杀手级应用是什么

jmiy_worldofai 来源:未知 作者:胡薇 2018-11-17 09:34 次阅读

机器学习的研究正进行的如火如荼,各种新方法层出不穷。尽管这样,还有一个问题摆在面前,研究这些算法对于现实有什么用。特别是当讨论起机器学习在手机和其他设备上的应用时,经常会被问到到:「机器学习有什么杀手级应用?」

机器学习工程师 Pete Warden 思考了很多种答案,包括从语音交互到全新的使用传感器数据的方法等,但他认为实际上短期内最激动人性的一个方向是压缩算法。尽管压缩算法在研究领域基本上是人尽皆知的一个方向,还是有很多人还是会对这个看法感到惊讶。在本篇博文中,Pete Warden 分享了他的关于为什么压缩算法如此有前景的看法。雷锋网(公众号:雷锋网)AI 科技评论编译如下。

当我读到一篇名为「神经自适应内容感知的互联网视频分发」(Neural Adaptive Content-aware Internet Video Delivery)的论文的时候,我意识到了这个领域的重要性。这篇文章在总结里说到,通过神经网络,在保证带宽相同的情况下,该方法能够将质量体验指标提高 43%。或者在在保证相同的观看质量下,减少 17% 的带宽使用。实际上还有很多类似研究方向的论文,比如生成式压缩(https://arxiv.org/pdf/1703.01467.pdf)和自适应图像压缩(https://arxiv.org/pdf/1705.05823.pdf ) ,但为什么没有听说到更多的关于压缩算法的机器学习实际应用呢?

目前还没有足够的计算能力

所有这些基于机器学习的压缩方法都需要相对较大的神经网络,并且所需的计算量与像素数量成正比。这意味着高分辨率图像或者高帧率视频需要更多的计算能力,可能远远超过当前移动电话或类似设备能够提供计算量。目前大多数CPU能够处理每秒几百亿次的算术运算,而在高清视频上运行机器学习压缩算法很容易就需要十倍以上的计算量。

好消息是现在有了一些新的硬件解决方案,比如 Edge TPU 等,在未来可能能够提供更多可用的计算资源。我希望我们能够将这些资源应用于各种压缩问题,从视频和图像以及到音频

自然语言是最终极的压缩

我认为机器学习非常适合于压缩算法的另一个原因是,我们最近在自然语言处理中得到了很多有趣的结果。如果你仔细琢磨图片的话,其实是可以将图像描述看作是图片的一种终极压缩方法。我一直以来都希望创建一个项目,一个能够以每秒一帧的速度给照相机拍下的图片配上描述文字,之后将这些描述文字写入到日志文件中。通过这个就能够得到一个非常简单的故事,讲述着相机随着时间的推移看到了什么。我认为这就可以看作一个能够叙事的传感器。

我将这种东西叫做压缩的原因是,我们其实可以使用一个生成神经网络来根据字幕生成图片。这个生成出的图片并不一定要与输入图片完全一样,只要它们具有同样的意思就可以了,这就可以看作是一个解压缩算法。如果想要输出的结果与输入尽可能相似的压缩算法,可以参考图像风格化的算法,将图片压缩为每个场景的轮廓线。这些算法与传统压缩算法的共同之处在于,它们找到了输入中对于我们人类最重要的信息,而忽略了其他的细枝末节。

不仅仅是图像

语言世界也有类似的趋势。语音识别技术正在迅速改进,合成语音的能力也在迅速提高。识别过程可以看作是将音频压缩为自然语言文本的过程,而合成则正好反过来。而人之间的对话可以通过将音频翻译为文字表示而的到极大的压缩。我现在还很难想象是否需要走那么远,但是似乎有可能通过我们对与语言特征的新理解来实现更好的压缩质量以及更低的带宽。

我甚至看到了将机器学习压缩算法应用到文本本身的可能。Andrej Karpathy 的 Char-RNN(https://github.com/karpathy/char-rnn)展示了神经网络可以很好的模拟给定样本的风格,这种学习风格的本质与压缩问题是很相似的。如果考虑一下典型的 HTML 页面有多少冗余,机器学习压缩算法其实有很好的机会去改进 gzip。但这只是我的一个猜想,毕竟我没有机器学习文本压缩的经验。

压缩算法已经是一个有市场的项目

在我创业生涯中,我曾尝试向企业销售产品而最终失败,从中我学到了一件事情,就是如果企业已经有大量的资金分配在你所销售的产品类别上,那么进行销售会更加容易。企业对于某种产品有预算意味着公司已经做出了是否要在该项解决方案上花钱的决定,现在的唯一问题是要购买哪种解决方案。这就是为什么我认为机器学习可以在这个领域取得巨大进展的原因之一,因为制造商已经拥有专门用于视频和音频的压缩工程师,以及对应的资金和芯片制造产业。如果我们能够证明将机器学习添加到现有的解决方案中可以提高某些指标,如质量速度或者功耗,这些方法就能够很快被采用。

带宽成本需要平摊到用户和运营商身上,而质量和续航是产品的一大卖点,因此采用机器学习进行压缩相比于其他应用方向有更直接的动机。现有的研究表明,机器学习算法进行压缩非常的高效,而且我乐观的认为还有很多方法等着被发现,所以我希望压缩算法会成为机器学习的一个重要应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8423

    浏览量

    132756
  • 自然语言
    +关注

    关注

    1

    文章

    288

    浏览量

    13360

原文标题:「压缩」会是机器学习的下一个杀手级应用吗?

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI驱动的人形机器人,成为激光雷达产业的下一个爆发点

    速腾和禾赛最新的财报电话会议上,都提到了不少机器人的应用。禾赛在近期还预告了在明年1月的CES上,将会发布款全新的面向机器人领域的迷你3D激光雷达产品。   从汽车到机器人,激光雷达
    的头像 发表于 12-23 09:07 842次阅读

    给您下一个FPGA项目选择Pluto XZU20五大理由!

    您的下一个FPGA项目从PlutoXZU20开始1.屡获殊荣PlutoXZU20凭借其卓越的设计和性能,在2024年北美嵌入式世界大会上被评为“最佳展品”。2.迷你外形PlutoXZU20外形超紧凑
    的头像 发表于 11-19 01:01 197次阅读
    给您<b class='flag-5'>下一个</b>FPGA项目选择Pluto XZU20五大理由!

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    早就听大佬们说,具身智能是人工智能的下一波浪潮,也是AI未来的趋势! 最近,具身智能的概念更是炙手可热,备受瞩目! 不论是这几天稚晖君开源人形机器人全套图纸+代码,引发圈内热议。 还是各类具身智能
    发表于 11-11 10:20

    人形机器人,连接器和线束线缆的下一个蓝海

    2024年,国内人形机器人行业就已经完成24次融资,总金额约为30亿元。面对这新增长点,连接器和线束线缆企业准备好了吗? 仅Pre-A轮融资就收获仅3亿元,清流资本、元璟资本、阿里巴巴联合领投
    的头像 发表于 11-07 10:31 275次阅读
    人形<b class='flag-5'>机器</b>人,连接器和线束线缆的<b class='flag-5'>下一个</b>蓝海

    使用tSPI协议减少下一个多电机BLDC设计的布线

    电子发烧友网站提供《使用tSPI协议减少下一个多电机BLDC设计的布线.pdf》资料免费下载
    发表于 09-26 10:40 0次下载
    使用tSPI协议减少<b class='flag-5'>下一个</b>多电机BLDC设计的布线

    人形机器人爆火,电机系统的下一个万亿蓝海

    人Unitree H1、四足机器人Go2均参加了Inclusion外滩大会;田螺云厨和支付宝百宝箱合作研发的AI烹饪机器人也参与了Inclusion外滩大会,工作人员称,可以自动识别食材,根据食材推荐菜单供用户选择,只要按照提示步骤操作,就能收获
    的头像 发表于 09-18 00:07 8035次阅读
    人形<b class='flag-5'>机器</b>人爆火,电机系统的<b class='flag-5'>下一个</b>万亿<b class='flag-5'>级</b>蓝海

    为什么OPA847输出端般会串50欧姆电阻,然后又会接50欧姆的负载到下一级了?

    OPA847求解:为什么运放输出端般会串50欧姆电阻,然后又会接50欧姆的负载到下一级
    发表于 08-21 06:04

    能否在ESP结束之前通过串行端口停止传入的UDP数据包的传输以解析下一个UDP数据包?

    丢弃在ESP完成之前不需要的数据包,以便通过串行端口发送它以接收下一个数据包, 如果没有,我必须按顺序读取所有传入的数据包,需要的和不需要的, 而且波特率不足,主机处理器开销大, 我能否在 ESP 结束之前通过串行端口停止传入的 UDP 数据包的传输以解析下一个 UDP
    发表于 07-16 06:18

    一下一个单片机的io口分别控制四灯板该怎么设计电路?

    各位大佬,我想问一下一个单片机的io口分别控制四灯板该怎么设计电路,每个灯板上有四种不同类型的灯,每种类型的灯有两都通过三极管来驱动,那么每种类型的灯都连接到同一个io口,有四块板
    发表于 07-15 19:03

    【重磅消息】机器人激光焊或是下一个汽车制造加工技术的引爆点!

    机器
    壹晨激光
    发布于 :2024年05月09日 16:32:03

    STM32F103如何让ADC1每个通道转换64次后换下一个通道在转换64次?

    F103如何让ADC1每个通道转换64次后换下一个通道再转换64次。 我想让ADC1的每个通道采样交流电压信号做均方根处理。 例如: 通过PWM触发ADC1的第一个通道采样周期的
    发表于 05-06 08:43

    单模光纤:下一个趋势是什么?

    随着对高速、可靠网络的需求不断增长,单模光纤电缆 (OS2) 作为面向未来的解决方案越来越受欢迎。随着这趋势的继续,新的数据中心将发现 OS2 光纤是更有吸引力的选择。在本文中,我们将解释单模
    的头像 发表于 04-10 10:53 376次阅读
    单模光纤:<b class='flag-5'>下一个</b>趋势是什么?

    高速风筒的下一个风口是直发吹风机?【其利天下技术】

    去年12月,戴森公司推出款宣称“在吹干湿发的同时实现头发拉直效果”的吹风直发器,解决了‘先吹发,后造型’的用户痛点,引发了行业内外广泛关注热议。这款吹风直发器在电吹风行业中尚属首例,确实是创新型产品。这款被誉为“新物种”的
    的头像 发表于 03-25 21:13 1209次阅读
    高速风筒的<b class='flag-5'>下一个</b>风口是直发吹风机?【其利天下技术】

    华为正接洽收购高合汽车 目标“打造下一个赛力斯”?

    据中工汽车网获悉,2月27日,在片唱衰高合汽车的舆论浪潮下,网络上又出现了华为正接洽收购高合汽车,并且目标“打造下一个赛力斯”的消息。
    的头像 发表于 02-28 14:14 936次阅读
    华为正接洽收购高合汽车 目标“打造<b class='flag-5'>下一个</b>赛力斯”?

    如何使用TensorFlow构建机器学习模型

    在这篇文章中,我将逐步讲解如何使用 TensorFlow 创建简单的机器学习模型。
    的头像 发表于 01-08 09:25 1015次阅读
    如何使用TensorFlow构建<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型