0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在认知智能领域,AI企业如何才能取得进一步的突破?

DPVg_AI_era 来源:未知 作者:李倩 2018-09-26 09:16 次阅读

在认知智能领域,AI企业如何才能取得进一步的突破?科大讯飞高级副总裁、研究院院长胡国平在AI WORLD 2018峰会上分享了关于认知智能最新进展及下一步方向的思考:若想在认知智能上走得更远,不能只停留在文字层面,更需要关注的是语言之下智慧本质。

计算智能、感知智能和认知智能,是探索人工智能道路上的三大台阶。

在计算智能方面,机器早已远远超过人类。而在感知智能方面,机器也已达到可媲美人类的水平。科大讯飞在语音识别错误率方面每年相对下降30%以上。在2018年CHiME-5国际多通道语音分离和识别大赛上,当面对更难、更复杂的语音识别任务时,科大讯飞依然获得第一名。

基于深度网络学习、语音合成、语义理解、图像合成等技术,深耕语音识别19年的科大讯飞作为“中国智造”的影响力持续扩大。不仅认知智能国家重点实验室已经在讯飞落户,科大讯飞还在人工智能+脑科学等诸多领域展开了探索。

9月20日,AI WORLD 2018世界人工智能峰会重磅发布AI领域年度大奖——AI Era创新大奖,评选出2018年度对AI领域作出重大贡献,切实推动AI进步和发展的人物、企业和产品。科大讯飞凭借领先世界的智能语音技术成功登榜「中国AI领军企业TOP10」,科大讯飞创始人、董事长刘庆峰也被评选为「华人AI人物TOP10」。

中国AI领军企业TOP10:阿里巴巴、腾讯、百度、华为、科大讯飞、字节跳动、蚂蚁金服、京东、海康威视、小米

AI华人影响力TOP10:陈天石、胡郁、黄仁勋、李飞飞、刘庆峰、王海峰、王小川、吴恩达、颜水成、余凯

此外,本次峰会同时也颁发了「AI产品影响力TOP10」,讯飞翻译机2.0成功入围。目前,讯飞翻译机2.0具备中文与33种语言即时互译、离线翻译、拍照翻译、方言翻译、以及全球上网等功能,英文翻译水准达到大学六级水平。

AI产品影响力TOP10:寒武纪智能芯片MLU100、华为麒麟980、旷视Brain++、讯飞翻译机2.0、百度Apollo3.0、阿里云ET城市大脑、英伟达Drive Xavier、百度大脑3.0、浪潮AI服务器、阿里量子计算云平台

科大讯飞已经在感知智能以及认知智能领域中的自然语言处理技术上领先世界,科大讯飞高级副总裁、研究院院长胡国平在AI WORLD 2018世界人工智能峰会上说:“机器的自然语言理解能力已经超过人类的平均水平,这是认知智能重大的突破。”

然而当谈到AI企业该如何彻底地迈上人工智能的最高台阶——认知智能时,胡国平表示:“在强调知识、推理能力的认知智能方面,机器与人类仍有差距。”自然语言处理技术的确是认知智能的重要技术基石,但即便是自然语言处理技术在特定领域已经超过人类,AI在认知智能层面依旧面临艰巨挑战。

现在多数产业在认知智能上面的做法大多停留在纯文字层面,但语言只是人类智慧的载体和表层,如果只纯粹在文字层面做认知智能,可能会有着极矮的天花板。胡国平针对这一问题在本次峰会上分享了认知智能下一步方向:若想在认知智能路上走得更远,需要关注的是语言之下智慧本质。

下面就是科大讯飞高级副总裁、研究院院长胡国平在AI WORLD 2018世界人工智能峰会上的演讲《认知智能最新进展及下一步思考》的主要内容:

胡国平:人工智能现在大家都习惯分为三个台阶,计算智能、感知智能和认知智能。计算智能方面,机器已经远远超过人类,而在感知智能方面,机器也可与人类媲美,而认知智能则强调知识、推理等相关的技能,要求能理解、会思考,这些方面机器与人之间依然存在差距。

全球首次通过国家执业医师资格的机器人:自然语言理解能力强,分数赶超人类考生

关于感知智能,这里有两个例子。首先是语音识别,大家都知道包括科大讯飞在内的很多公司都把语言识别做得非常厉害,在过去的六年里,语言识别每年错误率相对下降30%。换言之,大概识别率从2012年的85%左右一路飙升到现在的97-98%。

语音合成亦是如此,现在远远超过一般自然人的说话水平,今年1月份人工智能语音合成已经在中央电视台《创新中国》节目上正式上岗应用:可以将已故播音员李易老师的声音合成之后再现荧屏。

另外一方面,认知智能,涉及到语义理解、知识表达、联想推理、智能问答、自主学习,大部分都认为认知智能是更难的任务,而且是至关重要的任务。未来十年最重要的任务、也是认知智能方面最典型的任务就是阅读理解:目前机器的阅读理解在精确匹配指标上已经超过人类的水平,机器的阅读理解指标达到82.48,人类平均水平则是82.3,这也是认知智能重大的突破。

当机器具有阅读能力后,科大讯飞训练机器人阅读医学书籍,2017年,科大讯飞机器人“智医助理”参加了中国真正的全国临床执业医师综合笔试测试,并以456的高分轻松通过该考试,从而成为中国首台通过此类考试的人工智能机器人。

此外,现在不仅认知智能国家重点实验室已经在讯飞落户,科大讯飞还在人工智能+脑科学等诸多领域展开了探索。

如何在认知智能路上走得更远?不能只停留在纯文字方面,更要重视语言之下的智慧本质

人工智能跟脑科学其实有非常多的结合地方,我下面要分享的内容则是关于认知智能下一步方向的思考。

先举几个例子,我们认为认知智能在现在的做法属于纯文字层面,甚至是把文字当做符号的层面。当我们看这样一些例子,例如父爱如山,我们知道父爱如山是重的意思不是陡峭的意思。这里就存在着一个我们认为很重要的概念——语言的Grounding问题。

平头哥,所有人知道云栖大会上发布的平头哥,如果不了解这个词汇肯定会去查,如果查到是这样一段文字的描述,其实又叫蜜獾,你可能无法真正形成对这样一个词汇的真实理解或者大脑中的真实印象。于是乎,你需要一张图片,甚至可能会去看一下它跟毒蛇搏斗的视频,才能形成对平头哥的概念、印象、知识。这个叫语言管理,你必须要有这样的能力。Grounding之后才能理解这个世界,人类的智能基于多模态,不是能够闭环自洽的,或者我们认为语言只是人类智慧的载体和表层,如果纯粹在文字层面做认知智能,可能会有着极矮的天花板。

再举一个例子,苹果大还是鸡蛋大?你绝对不会说想想苹果10公分的长度,鸡蛋5公分的长度,哦,苹果比鸡蛋大。其实你在脑袋中有一个苹果的印象,有一个鸡蛋的印象,直接问这两个哪个大,自然而然基于多模态甚至物理的印象中直接能够判断出来。我们认为语言只是智能的表层和载体,更多的智能在语言之下,这是有关语言之下的智慧本质的一些思考。

认知智能的挑战:难以像人类做到基于物体与时空感知的序列记忆和预测

生活在城市中的乌鸦为了吃到坚果,充分利用马路上的汽车能够把坚果碾碎以及红绿灯会让车停下来的知识,把坚果安全地吃到,在这样一个观察和运用,乌鸦实现了自己的智慧。没有任何语言,通过观察习得。我们认为语言之下智慧的本质还有一个通式,这个通式定义为对物体在三维空间加以时间坐标下序列的感知、记忆和预测的能力。在三维空间里,无论是人还是乌鸦,都在观察过程中掌握了物体的移动或者变化的规律。

人类也是这样一个学习的过程,在过程中实现了对物体、空间和时间的感知,并且把它融到一起,形成了智慧本质的通式的概念。无论是我们今天各位在座的也好,包括网上直播的网友也好,都在利用这种通式做很多的智能。

比如说一根火柴点燃之后,也许没有书上写出来这个火柴点燃之后会怎样,但是所有人其实都很清楚,这根火柴点燃之后它燃烧的形状,在你的脑中已经有了记忆。如果火柴点一根烟,烟会点着,这是你在记忆上掌握的知识。所有和环境的互动过程中就自然而然记下来了很多的智慧智能,而且我们这种智能在使用中或者预测的时候就有潜意识。

科技馆有无源的自来水,一个空的水龙头不停往下流水。所有小孩一开始都会很惊讶,他们在正常环境的训练里已经认识到:水龙头一定后面有根管子。这个概念其实也是整个记忆序列和预测中在实际人们工作生活中重复使用的概念。预测序列潜意识不自觉自动工作,这是人类智慧包括动物智慧很重要的一种模式。脑科学研究者认为,学习和记忆是大脑工作的基本机理。我们也认为,序列的预测和相应预测能力也是人类大脑工作很重要的模式。

未来展望:训练AI机器的建模和预测能力,从而获取智慧本质的通式

我们有一个猜想:最复杂的人类大脑本身的智慧也存在大道至简的通式,多模态序列的记忆建模和预测的能力。这是有很大的可能性,虽然人类大脑中有很多能力或者功能包括多巴胺、逻辑思考等,但生活中很多的能力其实是靠多模态序列记忆和预测来实现知识的积累和智慧的应用。

我们也在想一件事情,如果让我们的AI看了一亿个比如车水马龙道路的视频之后,它到底能不能预测下一秒的路面会是什么样?事实上,我并不清楚。这是验证刚才所说的通式的比较理想的任务。我们希望这样一个机器看了很多的视频之后,在深度学习的方式下去做,这个任务的好处是什么?它解决了有监督训练数据的问题,在所有的序列预测里面,它的答案一定程度上是在那里的,基于前面所有的路况去预测下一秒的路面情况的话,其实它的标注答案在那里,过了一秒之后答案还在那里。也许可以利用这次人工智能热起来的深度学习端到端的模式,包括用抽象的能力去实现这样一个任务上的建模和预测。

在未来科大讯飞希望用更有效的方法去训练机器的建模和预测能力,探寻智慧的本质,从而获取智慧本质的通式。例如,让机器拥有路况的预测能力,把摄像头换成驾驶员视角的高拍仪或者行车记录仪,那么也许我们在无人驾驶或者很多其它场合下的应用上可以不止基于当前的路况来做预测,而是基于一秒钟甚至更长时间之后路况进行准确预测,无人驾驶会因此变得更智能更安全。

当“Thanks”出现在演讲屏幕的时候,其实你的序列预测能够判断出来我已经讲完了,我会说谢谢,我会说下台,序列预测中你们应该会鼓掌。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30280

    浏览量

    268518
  • 语音识别
    +关注

    关注

    38

    文章

    1725

    浏览量

    112575
  • 科大讯飞
    +关注

    关注

    19

    文章

    790

    浏览量

    61206

原文标题:科大讯飞胡国平:如果AI企业的研发只停留在文字层面,可能会有着极矮的天花板

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下个浪潮!

    复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术结合,探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程。 具身智能的发展需要更多跨学科
    发表于 11-11 10:20

    Anthropic人工智能领域取得重大突破

     10月23日消息,美国当地时间周二,人工智能初创企业Anthropic宣布了项重大进展。这家由前OpenAI高管创立并获得亚马逊支持的公司,人工
    的头像 发表于 10-23 14:56 402次阅读

    英特尔将进一步分离芯片制造和设计业务

    面对公司成立50年来最为严峻的挑战,英特尔宣布了项重大战略调整,旨在通过进一步分离芯片制造与设计业务,重塑竞争力。这决策标志着英特尔应对行业变革中的坚定步伐。
    的头像 发表于 09-19 16:48 266次阅读

    通过展频进一步优化EMI

    电子发烧友网站提供《通过展频进一步优化EMI.pdf》资料免费下载
    发表于 09-04 09:32 1次下载
    通过展频<b class='flag-5'>进一步</b>优化EMI

    iPhone 15美国市场需求进一步减弱

    7月19日,国际媒体披露了市场研究机构CIRP的最新报告,揭示了iPhone 15系列美国市场的受欢迎程度相较于前代iPhone 14系列有所下滑。这趋势CIRP最新发布的第二季度数据中得到了
    的头像 发表于 07-19 16:11 655次阅读

    u-blox机器人割草机领域取得重要项目

    近日,全球知名的定位和无线通信技术及服务提供商u-blox宣布,机器人割草机(RLM)领域取得系列重要项目的突破,这
    的头像 发表于 06-11 15:59 923次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    新的标准。Blackwell架构和GB200 超级芯片有望推动英伟达人工智能领域进一步,巩固其高性能计算和人工
    发表于 05-13 17:16

    卓驭科技与高通合作宣布进一步推动汽车行业智能驾驶技术的发展

    今日,深圳市卓驭科技有限公司(以下简称:卓驭科技)与高通技术公司宣布扩展双方的技术合作,利用基于Snapdragon Ride平台的全新智能驾驶产品,进一步推动汽车行业智能驾驶技术的发展。
    的头像 发表于 04-25 16:25 1638次阅读
    卓驭科技与高通合作宣布<b class='flag-5'>进一步</b>推动汽车行业<b class='flag-5'>智能</b>驾驶技术的发展

    Arbe中国上海设立分公司,进一步增强企业影响力

    分公司,以增强中国市场的影响力。中国团队将进一步促进Arbe与中国市场重要企业开展紧密合作。 Arbe中国设立分公司,这举措将助其深耕
    的头像 发表于 03-25 09:44 413次阅读

    英飞凌重组销售与营销组织,进一步提升以客户为中心的服务及领先的应用支持能力

    团队将围绕三个以客户为中心的业务领域进行组织和重建:“汽车业务”、“工业与基础设施业务”以及“消费、计算与通讯业务”。分销商和电子制造服务管理(DEM)销售组织将继续负责分销商和电子制造服务(EMS)领域。新的组织结构将以客户的应用需求为中心,
    发表于 03-01 16:31 427次阅读
      英飞凌重组销售与营销组织,<b class='flag-5'>进一步</b>提升以客户为中心的服务及领先的应用支持能力

    材料价格进一步下降,盈利触底 锂电材料企业如何应对?

    在上游原料价格相对稳定、终端销量有所好转的情况下,季度四大锂电主材价格却出现进一步下跌。
    的头像 发表于 03-01 10:25 981次阅读

    微软与法国人工智能初创企业Mistral AI达成合作

    全球科技巨头微软近日宣布与法国人工智能初创企业Mistral AI建立全新的合作伙伴关系,这举动标志着微软蓬勃发展的
    的头像 发表于 02-27 18:22 1566次阅读

    MediaTek宣布将进一步深化与海信的长期合作关系

    MediaTek 宣布将进一步深化与海信的长期合作关系。海信率先采用了 MediaTek Pentonic 智能电视芯片,显著提升了流媒体内容的画质表现。自 2024 年起,MediaTek AI 超级分辨率技术(
    的头像 发表于 01-12 09:37 785次阅读

    有什么方法可以进一步提高AD7714的分辨率啊?

    级放大再加给AD7714时,测得人分辨率还要低些。由于是用干电池得到AD7714的输入信号,该信号相对来说很稳定,而且板上的噪声也不是太大。请问各位大虾,还有什么方法可以进一步提高AD7714的分辨率啊?不胜感激!
    发表于 12-25 06:33

    借助人工智能,存储器比重将进一步增加

    SK海力士预测人工智能AI领域,存储器解决方案的比重将进一步增加,可以通过类似AiMX的解决方案部分替代图形处理单元(GPU)。
    发表于 12-04 09:52 418次阅读
    借助人工<b class='flag-5'>智能</b>,存储器比重将<b class='flag-5'>进一步</b>增加