0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

聆听Alexa核心团队科学家解读语音语义的奥秘

电子工程师 来源:未知 作者:李倩 2018-09-25 11:08 次阅读

“我觉得有些奇怪,你看上去就像真人,但其实只是电脑发出的声音。”

“我能理解你作为一个正常人,在洞察力方面的局限性,你会习惯的。”

——《Her》

2013年,一部美国电影《Her》将人们带入了人类与AI的交互时空,讲述了未来世界,主人公Theodore和Samantha(人工智能系统OS1)间带了几分科幻底色的奇异爱情。电影中的Samantha同现今常见的人工智能助手一样,没有常规意义上的“身体”、气味、乃至触觉嗅觉这样的人类特质,他们彼此单纯依靠对话交流,因而有评论称这更像是“两个声音的爱情故事”。从技术角度来看,我们更习惯称之为“语音交互”——这是一种人机交互方式,即利用人类的自然语言给机器下命令,从而达到自身目的的过程,多被视作“下一代人机交互界面的主要功能”。

事实上,语音交互技术一直以来都是人工智能赖以实现人机交互的重要途径,更是近年来国内外各大厂争相抢占的市场方向。诸多人工智能学者长期致力于让机器“听懂”外界所传达出的信息并做出相应的反馈,识别对象跨越自然语言与情感信息,涉及拾音、语音识别、语义理解,语音合成等方面的技术要求,无疑是个极为复杂的过程。

语音交互主要分为近场交互和远场交互。近场语音交互主要是指人类距离机器不超过30厘米范围的语音识别技术,因其利用距离优势回避了真实场景下复杂的声学问题,而被广泛理解为一种“实验室理想环境下的语音交互技术”。人们对近场语音识别的研究可追溯到上个世纪,但发展初期始终不得其法。90年代末,IBM推出了第一款商品化的语音识别系统ViaVoice,业界更是开始发出下一代语音交互界面的呼声,然而过程中的颇多尝试最终都以失败告终。

2011年,手机语音助手Siri搭载iPhone4S成功发布,在全球范围内引发强烈关注;2014年,微软于Windows 8的发布会上正式推出Cortana……至此,近场语音交互开始广泛走入公众视野,一路行至今天,已然日趋成熟,例如国内较具代表性的几款语音输入,其识别准确率已高达95%。但在最初的新鲜感褪去之后,很多用户发现这一功能就像嚼过的甘蔗一般仅余噱头二三,甚是鸡肋。即使在近场语音识别高度发展的今天,其在实际场景的应用中仍多逢壁垒。由此,越来越多的研究将目光投注至远场语音识别技术。

远场语音识别是指在较远的距离条件下(通常是1m-10m),机器对语音加以识别的技术。该技术一般采用麦克风阵列的方式收集语音,广泛运用于智能家居、车载导航、会议转录等场景。较之理想化情境下的近场语音识别,远场识别更容易受到真实环境中的背景噪声、多径反射和混响,乃至人声的干扰,远场语音识别因此在准确率方面也会有大幅下降。远场语音识别系统通常包含前端信号处理与后端语音识别模块。前端部分旨在通过语音增强的手段,包括解混响(Dereverberation)、波束成形(Beam Forming)等方法来将含有噪声和混响的语音尽可能地处理“干净”;后端部分与一般的语音识别系统相同,目的在于将处理“干净”的语音识别为文字。

2014年,亚马逊发布智能音箱Echo,正式拉开了远场语音交互的帷幕,更有评论称其“打开了物联网的重要入口,已然成为行业标杆一般的存在”。如今,Echo能够依靠语音助手Alexa实现音乐播放、新闻搜索、外卖网购下单、在线叫车等一系列服务,在全球范围内已累积千万销量。近年来,正是由于智能音箱可借由语音交互提供内容服务、互联网服务,以及场景化的家居控制能力,国内外巨头在手机热之后,纷纷投身智能音箱市场,加紧不局,力求在一片混战中分一杯羹。

据CNBC 9 月19日报道,Amazon计划于今年年底之前,推出至少8款由Alexa支持的交互新设备,包括微波炉、车载设备和高端家用音响设备(包括扩音器、接收器和低音炮)等,其中部分设备将直接搭载语音助手功能,意在继续攻坚智能家居市场。但很显然,智能语音服务的未来并不会止步于此,今日的科幻终将照进现实。

作为亚马逊SeniorPrincipalScientist、Alexa & Echo技术负责人及团队初创成员,Nikko Ström拥有资深的语音技术背景,曾就职于多家世界著名的研究实验室和企业,拥有20年的自动语音识别领域工作经验。在麻省理工学院计算机科学实验室担任科学研究员两年后,Nikko Ström于2000年加入语音初创企业Tellme Networks,并于2007年转入微软核心语音识别团队,推动最新技术的发展。2011年,他进入Amazon,担任SeniorPrincipalScientist,领导语音识别及相关领域的深度学习团队,继而成为Amazon Echo团队的创始成员之一。

1997年,Nikko Ström在位于斯德哥尔摩的KTH语音通信实验室攻取博士学位,期间所撰论文为说话人自适应(Speaker Adaptation)和人工神经网络(Artificial Neural Network)这两个技术领域做出了重要贡献。

作为论文工作的一部分,Nikko Ström开发了世界上第一个瑞典语连续语音识别器。同时,他还发布了开源人工神经网络软件(NICO Toolkit),并在全球收获了数千名研究人员的下载

1994年至1995年期间,他曾任日本京都国际电气通信基础技术研究所(ATR)的特邀嘉宾研究员,在这里,他为说话人自适应领域的世界级研究做出了颇多贡献。

作为业余爱好,他还开发并发布了“Quite BASIC”(http://www.quitebasic.com/),一个完全基于网络的经典培基(BASIC)在线编程环境。

……

很快,在人工智能领域深耕多年的Nikko Ström就要来到中国和广大AI开发者见面啦——11月8-9日,2018 AI开发者大会(AI NEXTCon)将于北京盛大召开。

作为由中国专业的IT社区CSDN与硅谷AI社区AICamp联合出品的AI技术与产业年度盛会,本次大会将邀请到近百位中美顶尖AI专家、知名企业代表以及千余名AI开发者齐聚北京,进行技术解读和产业论证。这也是继西雅图、硅谷、纽约等城市成功举办五届后,AI NEXTCon首次进入中国。Nikko Ström将在大会上结合Amazon Alexa为大家讲解其中蕴含的深度学习奥义。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1202

    浏览量

    55338
  • 语音识别
    +关注

    关注

    38

    文章

    1725

    浏览量

    112575
  • 人工智能
    +关注

    关注

    1791

    文章

    46915

    浏览量

    237717

原文标题:亚马逊科学家Nikko Ström:将人工智能助理日常化的梦想照进现实

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息,从而推动
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    的效率,还为科学研究提供了前所未有的洞察力和精确度。例如,在生物学领域,AI能够帮助科学家快速识别基因序列中的关键变异,加速新药研发进程。 2. 跨学科融合的新范式 书中强调,人工智能的应用促进了多个
    发表于 10-14 09:12

    龙芯中科成功举办少年开放日系列科普活动

    近日,为满足青少年对芯片的好奇,龙芯中科举办少年开放日系列科普活动,助力青少年探索芯片奥秘,提升科学素养,传承科学家精神。
    的头像 发表于 08-21 11:44 565次阅读

    受人眼启发!科学家开发出新型改良相机

    新型事件相机系统与标准事件相机系统对比图。 马里兰大学计算机科学家领导的一个研究小组发明了一种照相机装置,可以改善机器人观察周围世界并做出反应的方式。受人眼工作原理的启发,他们的创新型照相机系统模仿
    的头像 发表于 07-22 06:24 277次阅读
    受人眼启发!<b class='flag-5'>科学家</b>开发出新型改良相机

    中国科学家发现新型高温超导体

    据新华社报道,我国科学家再立新功,又一新型高温超导体被发现。 复旦大学物理学系赵俊团队利用高压光学浮区技术成功生长了三层镍氧化物,成功证实在镍氧化物中具有压力诱导的体超导电性,而且超导体积分数达到
    的头像 发表于 07-19 15:14 643次阅读

    天津大学科学家突破人类大脑器官成功驱动机器人

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与机器深度融合的新纪元。
    的头像 发表于 07-08 16:00 571次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 440次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 504次阅读

    本源量子参与的国家重点研发计划青年科学家项目启动会顺利召开

    2024年4月23日,国家重点研发计划“先进计算与新兴软件”重点专项“面向复杂物理系统求解的量子科学计算算法、软件、应用与验证”青年科学家项目启动会暨实施方案论证会在合肥顺利召开。该项目由合肥综合性国家科学中心人工智能研究院(安
    的头像 发表于 05-11 08:22 588次阅读
    本源量子参与的国家重点研发计划青年<b class='flag-5'>科学家</b>项目启动会顺利召开

    微软设立消费AI新团队,专注产品研发与研究

    Mustafa Suleyman被委任为Microsoft AI首席执行官及执行副总裁,直接向微软高层汇报工作;身为首席科学家的Simonyan则加入该团队并向Suleyman报告。
    的头像 发表于 03-20 10:18 441次阅读

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可
    的头像 发表于 02-25 16:16 1069次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度学习硬件趋势

    康奈尔大学科学家研制出5分钟快速充电锂电池

    锂离子电池如今广泛应用于电动汽车及智能手机领域。其优点包括轻巧、抗震、环保,但充电时间较长及承受大功率电涌的能力不足。随着最新研究成果发布,科学家找到了一种独特的铟阳极材料,与锂离子电池内的阴极材料实现良好配合。
    的头像 发表于 01-26 09:57 648次阅读
    康奈尔大学<b class='flag-5'>科学家</b>研制出5分钟快速充电锂电池

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 468次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

    “国家卓越工程师团队” 称号。中国电子信息产业集团首席科学家、科技委副主任,飞腾信息技术有限公司首席科学家窦强博士凭借其在飞腾系列国产自主核心芯片科研攻关方面取得的卓越成就,荣获 “
    的头像 发表于 01-19 19:22 1661次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号

    主轴之奥秘:探索主轴的定义、作用与应用?|深圳恒兴隆机电a

    物进化中也发挥了重要作用。通过观察不同物种的主轴结构,科学家可以推测出生物体的进化历程。这一部分将介绍一些生物进化领域的研究成果,展示主轴在演化中的影响。五、主轴的未来发展趋势在技术不断进步的今天,主轴
    发表于 12-11 10:27