0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为何我们不把机器学习更广泛地应用在文件压缩方面呢?

MqC7_CAAI_1981 来源:未知 作者:李倩 2018-11-09 15:45 次阅读

移动互联网时代,人类生产的新数据正以指数级别增长,数据中心越来越大,并消耗着地球上难以想象的巨大能耗,但人类依然可能面临着“数据无处存放”的境地。

因此,让文件变小一点,这绝对是个值得投资的点子。

神剧《硅谷》剧组就选中了这个点子。在剧中,几个主角的得以创业成功的核心算法——“魔笛”即是选中了“压缩”这一多数人都能理解但对技术要求颇高的领域:允许用户在线将图片压缩至一半的大小,并依然保持其清晰度。

“魔笛算法”也一度引发了不少跟风打造属于自己的“魔笛手”,此外,包括谷歌等人工智能巨头公司近年来也在这个领域频频发力。

2016年,谷歌相关团队推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的图像压缩技术。希望以人工智能技术作为压缩路径,将图片大小压缩到源文件的1/4, 但基本不会改变图片的清晰度。

尽管引来如此高的关注,但很多人还是不认可它会在未来的发展中取得压倒性的优势。谷歌的RAISR算法也被不好业内认识吐槽说“压缩一张图片耗时久”、“压缩后图片清晰度没有那么高”等等。

谷歌机器学习工程师、Jetpac创始人Pete Warden近期发布了一篇文章,认为在短期内压缩算法可能会成为机器学习应用最可能出现的杀手级应用的领域,他从“压缩”这一技术的起源开始,希望告诉大家问什么压缩技术的前景是如此的广阔。

大数据文摘对这篇文章进行了编译。

OSDI上的一篇文章“神经自适应型内容感知互联网视频传输”激发了我对这一领域的兴趣。

这篇文章告诉我们:通过神经网络,在带宽相同的条件下,用户体验将能提高43%,或者在带宽缩减17%的条件下可以保持体验的质量基本不变。还有其他同类的论文将类似方法运用在了生成压缩或自适应图像压缩等方面。他们都展示出了惊人的成果。那么,为何我们不把机器学习更广泛地应用在文件压缩方面呢?

我们尚未拥有性能配套的计算设备

上文所提到的所有方法都需要相对较大的神经网络,并且所需的计算量与像素数量成正比。这意味着大型图片文件或每秒帧数较高的视频文件可能需要比当前广泛使用的移动设备更强的计算能力。

现行的大多数CPU每秒仅能处理百亿级的运算,而在高清视频上用机器学习进行压缩很轻易便能达到十倍于此的计算量。

当然,好消息是目前我们已经有了一些硬件解决方案,比如Edge TPU等,可以让我们看到未来达到更多计算量的可能性。我期待这种压缩方法能够运用到各种类型文件的压缩转换上,从视频到图像,到音频,乃至更多充满想象力的方式。

自然语言是终极压缩目标

近来机器学习在自然语言处理中取得了大量有趣的成果。这是另一个让我觉得机器学习是较为优越的压缩转换途径的原因。

如果你稍稍观察,便会发现字幕其实是将声音压缩为图像的一种形式。我一直想做一个项目,试图创造出一种相机,每秒生成一帧字幕,并将所有字幕逐一按行输出至一个日志文件中。由此便可简单记录下基于相机的拍摄内容随时间的推移而发生的故事,这可以被定义为一个叙事类的传感器

我将这一技术归类到压缩方法中的原因是你可以通过生成性的神经网络将字幕还原为图像。尽管重新生成的图像不会跟原图像完全一致,但也能够从原图像继承一些信息。如果你希望结果与原图像尽可能接近,你也可以从风格化方面考虑,例如为每个场景生成简图。这些技术的共同特征在于他们提取出了输入文件中对于我们人类重要的部分,并省略了余下的部分。

不仅仅是图像

语言世界也有类似的趋势。语音识别正在迅速改进,合成语音的能力也在迅速提高。识别可以看作是将音频压缩为自然语言文本的过程,而合成则恰好相反。你可以想象将对话高度压缩为自然语言文字而非音频。诚然,我们不需要达到那种要求,但似乎通过扩展我们对于表达的认知类型,我们可以实现在低带宽情况下的更好的结果。

我甚至还发现一些有趣的将机器学习应用在文本本身上的可能性。Andrej Karpathy的CHAR-RNN(递归神经网络)展示了神经网络对某些模板进行模仿的优越性,而对于压缩技术来说,预测也是相同的道理。考虑到普通的HTML页面有不少冗余,这一情况下GZIP压缩方法似乎有很大机率能被机器学习改进,尽管我认为这没有机器学习对文本的处理那么容易。

对于压缩的研究已立项拨款

在我创业期间,营销失败的经历让我学到了一件事:如果已经有一笔预算要购买你所推销的产品,该产品的销售会容易得多。预算的存在意味着公司在是否应该花钱购买解决方案上已经赢得了艰难的斗争,现在唯一的问题是购买哪种解决方案。

这也是我认为机器学习可以在这个领域取得巨大突破的原因之一,因为制造商已经拥有专门用于视频和音频压缩的工程师、资金和芯片。如果我们能够证明将机器学习添加到现有解决方案中能够以一些可度量的方式(例如质量、速度或功耗)改进它们,那么它们将被快速采用。

带宽将会花费用户和运营商的大量的成本,质量和电池寿命将会成为产品的卖点,因此采用机器学习改进压缩的优势将比其他运用更为显而易见。

许多激动人心的研究表明这种方式将会非常高效,而且我乐观地认为还有许多应用尚未被发掘。我希望机器学习在压缩中的应用将发展成为一门核心技术。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6172

    浏览量

    105619
  • 神经网络
    +关注

    关注

    42

    文章

    4773

    浏览量

    100885
  • 机器学习
    +关注

    关注

    66

    文章

    8424

    浏览量

    132761

原文标题:被《硅谷》选中的“压缩算法”,为什么说下一个机器学习杀手应用将由此诞生

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 122次阅读

    Linux文件压缩打包的各种姿势

    1.文件打包与压缩 1.什么是文件压缩? 将多个文件或目录合并成为一个特殊的文件。比如: 搬家…
    的头像 发表于 12-02 09:25 235次阅读

    什么是安川电机?安川电机主要广泛应用在哪些方面

    安川电机(Yaskawa Electric Corporation)是一家日本跨国公司,成立于1915年,总部位于日本北九州市。安川电机是全球领先的工业自动化和控制产品制造商之一,其产品广泛
    的头像 发表于 10-25 09:40 518次阅读

    异步电机主要应用在哪些方面

    异步电机,也称为感应电机,是一种交流电机,其转子(或称为转子)不与定子磁场同步旋转。这种电机因其结构简单、成本低廉、维护方便、运行可靠等优点,在工业和日常生活中得到了广泛的应用。以下是异步电机的一些
    的头像 发表于 10-22 16:13 1169次阅读

    请问PGA2500可以应用在驻极体放大电路中嘛?

    我现在要用驻极体做一个语音录音及回放的电路,不知道pga2500可不可以应用在驻极体的前置放大电路中。
    发表于 09-19 07:24

    差动放大器通常是应用在什么场合?

    请问下差动放大器通常是应用在什么场合?
    发表于 09-19 06:35

    OPA241一般应用在什么场合?OPA241能否放大微小电流信号?

    OPA241一般应用在什么场合? 电路中的传感器输出信号为0-300nA,尝试过很多次,使用OPA241无法放大该信号,输出端无输出,请问有人遇到类似情况吗? 一些说明(请见下图): 1)传感器
    发表于 09-14 07:23

    遥感可以应用在哪些方面

    遥感技术是一种通过卫星、飞机或其他载体上的传感器,从远距离获取地球表面信息的技术。它在多个领域有着广泛的应用,以下是一些主要的应用领域,以及每个领域的简要介绍: 环境监测 :遥感技术可以用来监测森林
    的头像 发表于 09-04 14:36 1348次阅读

    求助,请问TLV2464cpwr通用运放有应用在audio上的典型电路吗?

    TLV2464cpwr通用运放有应用在audio上的典型电路吗?
    发表于 08-08 08:20

    定华雷达知识讲堂:雷达物位计为何广泛应用于水泥厂

    雷达物位计为何广泛应用于水泥厂? 雷达物位计应用在测量颗粒状物料上,在水泥厂原料大多是颗粒状物料,个别是块料,如石灰石、原煤、页岩等,其半成品熟料也是颗粒状物料,储存在库或仓里,都存
    的头像 发表于 07-04 15:43 224次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1425次阅读

    智慧安防综合平台应用在哪些场景

    平台应用在哪些场景?下面我们就一起来看看吧! 首先,在城市安全管理方面,智慧安防综合平台可用于公共区域监测,例如道路交通监控、城市监控中心、公园和广场安全,有效预防和处理交通事故、违规行为、治安事件等。此外,
    的头像 发表于 06-14 15:23 636次阅读

    变频器主要应用在哪些方面

    变频器作为现代工业自动化领域的核心设备之一,其应用广泛,涉及到多个行业和领域。变频器通过调节电机的转速,实现对生产设备的精确控制,从而提高了生产效率、降低了能源消耗,并优化了设备的运行性能。本文将详细探讨变频器在各个方面的主要应用,并结合实际案例和数据进行深入分析。
    的头像 发表于 05-28 17:28 1.1w次阅读

    应用在隔离的IGBT模块中的光电耦合器

    应用在隔离的IGBT模块中的光电耦合器 IGBT(Insulated Gate Bipolar Transistor),绝缘栅双极型晶体管,是由BJT(双极型三极管)和MOS(绝缘栅型场效应管
    的头像 发表于 04-29 11:39 646次阅读
    <b class='flag-5'>应用在</b>隔离的IGBT模块中的光电耦合器

    虚拟现实技术应用在哪些方面

    技术在各个领域都有广泛的应用,包括娱乐、教育、医疗、工业等。在本文中,我们将详细讨论虚拟现实技术在不同领域的应用。 娱乐领域 在娱乐领域,虚拟现实技术的应用非常广泛。通过虚拟现实设备,玩家可以将自己置身于游戏世界中,身临其境地体
    的头像 发表于 01-15 09:31 2429次阅读