下一代的人机交互方式是什么？-电子发烧友网

自互联网诞生以来，人与机器的信息交互方式就在不断演进和发展。从早期单一的鼠标、键盘操作方式，再到如今以智能手机为代表的触控交互。我们急切地想知道：下一代的人机交互方式是什么？

智能语音，赋予了机器可以像人类一样“讲话”并与人类“对话”的能力，也让不少人看到了语音技术的巨大潜力。追溯起来，有关语音技术真正意义上的研究可以追溯到 1876 年贝尔电话的发明。

从 2009 年开始，借助机器学习领域深度学习研究的发展及大数据语料的积累，以语音识别为突出代表的语音技术得到了突飞猛进的发展。如将深度学习引入语音识别声学模型训练，使用基于 RBM 预训练的多层神经网络，以提高声学模型的准确性，包括苹果公司的 Siri、谷歌公司的 Google Assistant 的面世曾一时引起了不小轰动。2015 年，亚马逊 Amazon Echo 的诞生正式开启了智能语音技术的竞争局面。从智能音箱到主打语音交互的智能设备，国内外巨头们不惜轮番价格战。

截止到目前，国内外的战场上有阿里、腾讯、百度，也有谷歌、微软、亚马逊、Facebook，它们的介入导致不少创新公司展开了激烈竞争，也对未来十年产生了极其重要的影响。

在众多语音技术中，语音识别、语音合成、声纹识别、语音唤醒、端信号处理等语音技术伴随着算法统计模型的迭代有了新的重大创新，也成为当前最具有挑战性和应用场景的技术。

以声纹识别为例，即通过对一种或多种语音信号的特征分析来判断说话人身份的技术。由于任何两个人的声纹图谱都有所差异，所以声纹同样具有如指纹生物特征一样的唯一性。声音不涉及隐私问题，麦克风和传感器等相关设备成本低廉，传输带宽窄，而语音又是一个形简意丰的信号，口音、语种、情感等各种信息通过一段声音便传输了出来。

清华大学语音和语言技术中心主任、得意音通董事长郑方博士接受 CSDN 采访时表示：“目前在声纹识别这个领域，不同技术或产品提供商参差不齐、差异很大；与此同时，声纹识别不再是单一强调准确性，而是变得更为成熟、完备和可用。”

不过相对来讲，声纹识别仍是一个应用相对较窄的领域。就目前来看，语音识别、语音合成的应用更为广泛。

例如在年初举办的Google I/O 大会上，机器语音助手的一声“嗯哼”震惊了全场，然后微软小冰为知乎写歌又刷了一波屏。我们才意识到，AI 语音正悄然从原来的“机械式语音”变成了“像人类一样说话”的自然语言。

语音产业虽然可以由概念触发，但最终仍由技术驱动，打磨好技术和产品仍是第一要务。

出门问问 CTO 雷欣曾表示，“从技术上来讲，机器学习、人工智能跟其他功能性的东西不太一样，它非常强调学习的过程，训练跟实际使用场景越匹配越好，做得越通用，就代表在某一个垂直领域做不到最优。”

那么，随着语音市场需求的爆发，如何更好地通过智能技术解决声学、语音、语义等各方面的问题，对于任何一位语音技术相关领域的工程师而言，将是未来长期时间内必然面临的挑战。

现在，CSDN 就为大家提供了这样一个机会，让你能够聆听头部 AI 公司的最新技术实践，并有机会与这些公司的资深技术人员面对面交流。

2018 年 11 月 8-9 日，由中国 IT 社区 CSDN 与硅谷 AI 社区 AICamp 联合出品的 2018 AI 开发者大会（AI NEXTCon）将于北京召开。

本次大会设有“语音技术专场”，我们很荣幸邀请到在研究和工业界都极富盛名的一线技术专家们：清华大学语音和语言技术中心主任、得意音通董事长郑方，声智科技创始人、董事长兼 CEO 陈孝良，出门问问 CTO 雷欣、云知声董事长、CTO梁家恩，以及标贝科技联合创始人&CTO 李秀林。

下面重磅介绍语音技术专题的讲师团和他们的议题概要：

陈孝良：声智科技创始人、董事长兼 CEO

演讲议题：远场语音交互技术与实践

陈孝良，2017年度中关村高端领军人才，计算机学会语音对话与听觉专业组常务委员，中国声学学会声频工程分会委员，中国人工智能和大数据专家委员，美国 AES/JASA会员。先后于北京航空航天大学和中国科学院大学(声学研究所)获得管理学学士和工学博士学位。

曾任职于金山软件股份有限公司和中国科学院声学研究所，历任初级工程师、助理研究员、副研究员，兼任首届信息化办公室主任和中国科学院上海高等研究院客座副教授，主要参与海军某重大型号舰艇、863、973、国家自然科学基金、中科院战略先导等国家重要项目，共发表文章36篇，申请专利 35项。

郑方：清华大学语音和语言技术中心主任、得意音通董事长

演讲议题：声纹识别技术及其应用现状

郑方，博士、教授、博士生导师，清华大学语音和语言技术中心主任；北京得意音通技术有限责任公司董事长；亚太区信号与信息处理联合会副主席、中国中文信息学会语音专委会主任、中国计算机学会语音对话与听觉专业组副主任。

郑方博士从事语音语言处理和生物特征识别的研发近 30 年，是全国安防标委会人体生物特征识别应用分委会副主任委员、中文语音交互技术标准工作组声纹识别专题组组长、全国信标委生物特征识别分委会委员等，是许多国家和行业标准的起草者。

梁家恩：云知声董事长、CTO

演讲议题：AIoT 智能交互技术与应用

梁家恩博士毕业于中国科技大学，获中国科学院识别与智能系统专业博士学位，毕业后留校负责语音识别核心技术研发及其产业化，在国家863语音识别核心技术评测中多次获第一名，在广电、安全、教育等领域实现产业化应用。

2012 年，由梁家恩博士主导创立人工智能公司云知声，并率先在国内实现深度学习和5米远讲识别技术的产业化，在业内首次提出的“云端芯”一体化解决方案已经在家居、车载、医疗、教育等领域规模化落地。在他和团队的共同努力下，云知声先后被福布斯评为“中国成长最快科技企业”、科技部评为“中国独角兽企业”。2013 年底，梁家恩博士出任云知声 CTO，负责技术领域。

李秀林：标贝科技联合创始人&CTO

演讲议题：标贝科技的语音超市实践——助力智能产品人性化

李秀林，中国科学院博士，15 年语音相关技术研发和学术研究，申请专利三十余项，在国内外语音界有很高的知名度；曾带领团队获得百度百万美元大奖。2006 年— 2013 年，松下研发中心高级研发经理；2013 年— 2016 年，百度语音合成技术负责人；2016 年—2018 年，滴滴研究院语音团队负责人&首席算法工程师；2018年3月份加盟标贝科技，作为联合创始人兼 CTO。

雷欣：出门问问（Mobvoi）CTO

演讲议题：语音交互的软硬结合

雷欣，人工智能专家，在人工智能尤其是语音识别领域至今已有十多年研究及从业经验。2006 年，雷欣获得美国华盛顿大学电子工程博士后，加入了微软总部任软件设计工程师及 Speech Scientist，负责开发微软语音识别引擎内的说话人自适应模块；后加入斯坦福研究所（SRI）任研究工程师，领导开发了SRI 2008 年大规模中文语音识别系统；随后进入 Google 研究院任 Staff Research Scientist，领导开发 Google 基于深度神经网络的离线语音识别系统。

目前，雷欣所带领的出门问问 AI 团队，正进行人工智能落地在生活场景（可穿戴、车载、家居）上的研究开发。

除了语音技术专题之外，我们还为大家准备了“自然语言处理”、“机器学习工具”、“数据分析”、“机器学习”、“计算机视觉”、“知识图谱”等技术专题，以及“智慧金融”、“智能驾驶”、“智慧医疗”等行业峰会。大会完整日程以及嘉宾议题请查看下方海报。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人机交互

人机交互

+关注

关注
12

文章
1209

浏览量
55427
智能手机

智能手机

+关注

关注
66

文章
18499

浏览量
180397
机器学习

机器学习

+关注

关注
66

文章
8423

浏览量
132746

原文标题：解放双手，人机交互真的只需要一张嘴吗？

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

启英泰伦新推出多意图自然说，重塑离线人机交互新标准！

智能语音识别技术作为人机交互领域的一场革命性突破，正逐步重塑我们与智能设备的交互方式。近期，启英泰伦新推出了多意图自然说技术，进一步增强了

发表于 01-03 16:01 •123次阅读

启英泰伦新推出多意图自然说，重塑离线<b class='flag-5'>人机交互</b>新标准！

新的人机交互入口？大模型加持、AI眼镜赛道开启百镜大战

电子发烧友网报道（文/莫婷婷）随着智能眼镜的出现，加之AI技术的应用，AI智能眼镜被认为是下一代人机交互的入口。在今年，不少品牌厂商都推出了AI智能眼镜新品，包括李未可推出的Meta Lens

发表于 11-21 00:57 •2949次阅读

新<b class='flag-5'>的人机交互</b>入口？大模型加持、AI眼镜赛道开启百镜大战

具身智能对人机交互的影响

在人工智能的发展历程中，人机交互一直是研究的核心领域之一。随着技术的进步，人机交互的方式也在不断演变。从最初的命令行界面，到图形用户界面，再

发表于 10-27 09:58 •363次阅读

聚徽-工控一体机是如何实现人机交互的

工控一体机实现人机交互的方式是多种多样的，结合搜索结果，我们可以归纳出以下几种主要的实现方式：

发表于 09-10 09:31 •371次阅读

基于传感器的人机交互技术

基于传感器的人机交互技术是现代科技发展的重要领域之一，它极大地推动了人机交互的便捷性、自然性和智能性。本文将详细探讨基于传感器的人机交互技术，包括其基本原理、关键技术、应用领域以及未来

发表于 07-17 16:52 •863次阅读

人机界面交互方式的介绍

：图形用户界面（Graphical User Interface, GUI）图形用户界面是最常见的人机交互方式之一。它通过图形元素（如图标、按钮、菜单等）来实现用户与计算机的交互。

发表于 07-01 14:22 •877次阅读

人机交互界面是什么_人机交互界面的功能

人机交互界面（Human-Computer Interaction Interface，简称HCI或HMI），也被称为人机界面（MMI）、操作员界面终端（OIT）、本地操作员界面（LOI）或操作员

发表于 06-22 11:03 •2625次阅读

工业平板电脑在人机交互中的应用

工业平板电脑在人机交互（Human-Machine Interaction，HMI）中扮演着至关重要的角色，它们通过直观的界面和强大的计算能力，极大地提升了工业环境下的操作效率和用户体验。以下是工业平板电脑在人机交互中的具体应用：

发表于 06-18 12:00 •310次阅读

人机交互与人机界面的区别与联系

随着信息技术的飞速发展，人机交互（Human-Computer Interaction，HCI）已成为现代社会不可或缺的一部分。人机交互技术，作为实现人与计算机之间有效通信的桥梁，不仅改变了我们

发表于 06-07 15:29 •1040次阅读

技术干货｜下一代 HMI 的三个关键考虑因素

在日常生活中，我们不断发现与机器相关的接触点越来越多。那么，HMI 的未来如何？除了数据收集、控制和显示外，新一代 HMI 将抛开传统的人机界面，在各种应用中提供人机交互，使机器可以智能地作业并与人类交流。例如，通过无接触

发表于 04-19 12:49 •318次阅读

浅谈下一代HMI的三个考虑因素

步入人机交互的新世界，将需要交互式的智能应用，同时，用于支持实现 HMI 的处理器也面临一系列新的挑战。下面，我们来详细了解下一代 HMI 的三个考虑因素。

发表于 04-19 11:15 •237次阅读

使用NVIDIA Holoscan for Media构建下一代直播媒体应用

NVIDIA Holoscan for Media 现已向所有希望在完全可重复使用的集群上构建下一代直播媒体应用的开发者开放。

发表于 04-16 14:04 •691次阅读

人机交互的三个阶段人机交互的常用方式

机交互经历的三个阶段：命令行界面交互阶段、图形用户界面交互阶段、自然和谐的人机交互阶段。

发表于 03-13 17:25 •3171次阅读

人机交互技术有哪几种人机交互技术的发展趋势

人机交互技术是指人与计算机之间通过各种交互方式进行信息传递、操作和控制的技术。随着科技的进步，人机交互技术也在不断发展创新。以下将介绍人机交互

发表于 01-22 17:47 •3767次阅读

荣耀发布MagicOS 8.0，首次实现意图识别人机交互

在科技圈掀起一股热潮的荣耀正式发布了其自主研发的全新操作系统——MagicOS 8.0，并赋予其一个富有魔法的中文名字：魔法OS 8.0。这款新操作系统凭借其独创的平台级AI使能的意图识别人机交互，重新定义了智能终端的

发表于 01-12 14:50 •912次阅读

搜索历史

下一代的人机交互方式是什么？

评论