0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人机交互的最终目标:声纹识别让机器主动适应人

智能生物识别说 2019-10-16 17:53 次阅读

人机交互的前世今生

自从人类发明了计算机,就持续面临着一个问题:我们到底应该如何与机器交互?

在计算机的发展历史上,随着技术的进步,发生过几次大的交互模式的演进:近年来的转变大致可以概括为以鼠标/键盘为主的交互模式转换为以触摸和语音为主的交互模式。

由此,我们可以预测人机交互的发展趋势,主要体现在:

交互理念方面,机器从被动接受信息到主动理解信息,以及从满足基本功能到强调用户体验;

交互设备方面,机器输入、输出的方式更加自然化、内容多样化。

显然,不管是理念的转变还是设备的升级,我们和机器的交互方式上经历了一个从人适应机器,到机器适应人的过程。

语音交互解决人机交互痛点

语言是什么?是人类最牛逼的发明,是人类进化的产物。

人类通过语言,能够把对世界的理解,想传递的信息,压缩成一串很短的文字输入给对方,对方听完以后,能根据这些文字,还原事件、图像,以及情感。

鼠标/键盘本质上不是一种交互方式,而是一种输入设备,真正的交互方式其实是以语言为载体的“命令”。

正如微软创始人比尔•盖茨如所言:“人类自然形成的与自然界沟通的认知习惯和形式必定是人机交互的发展方向”。

随着人工智能技术的发展,自然语言交互必定是实现“命令自然化”的关键突破口。语言声学技术为人机交互注入了智能属性,交互不再是精确的“指令”。

在上世纪出现Google、百度等搜索引擎的时候,交互还是单向的,但出现智能手机之后我们的交互变成了双向。比如苹果的交互史,在刚开始做出来第一代iPhone的时候并没有语音交互的能力,但经过市场调研之后发现有75%的用户都希望有语音控制。于是,在后面两代iPhone加入了语音控制,但到后面发现实际使用的用户竟然不到5%,苹果经过总结之后发现不仅仅是语音,还必须有自然语言交互。

正如我们对自然语言处理技术的应用场景的想象,关键在于足够自然,人工智能永远都在追赶最高的自然智能。


信息文明走向智能文明 ,机器需适应人类的自然语言体系,然后完成任务。

语音识别+声纹识别:人机交互这么做就对了!

智能音箱为例,需要其不再是基于几个关键词来反馈结果,而是能够理解用户的语言指令,完成一项完整的任务。

一方面,语音交互将使智能音箱跳出了传统的“命令式交互系统”,你可以说“为我播放一首爵士乐”、“为我查一下明天的天气”等这类不再精确的指令。机器拥有理解人类语言、分析语言意图,进行更多的决策的可能。

另一方面,语音技术的进展使得我们可以远距离控制设备。在移动互联网时代,用户需要更为方便自然的人机交互方式。当互联网从个人电脑向移动终端迁移,人们在走路、开车、吃饭时都可以通过互联网获取信息、完成任务,语音交互的非接触性,解放了双手,成为了快捷方便的方式。

“万物互联”时代下的人机交互:以用户为中心,使产品主动为受众的提供服务

随着5G的发展和互联网技术的不断成熟,人类已经进入到了一个万物互联的“大连接”时代,“大连接”的目的是为了让人类的生活更加美好,更加便利。

设备被赋予的大量连接,连接为交互建立了通道。交互通道建立后的下一步,是用人工智能技术为“大连接”时代赋能。

语音交互远距离控制的特性,极大地增加了可交互设备的数量,有利于智能设备的快速普及。

在未来全面智能化、万物互联的生活中,真实使用场景总是有多个声源和环境噪声叠加,比如经常会出现周边噪声干扰和多人同时说话的场景。

想象一下,如果所有的智能设备都在同一时间点被触发,“随意”的为用户展示信息,身处其中的大家可能会立刻疯掉。这时候,用声纹识别技术让智能设备可以识别“主人身份”就显得格外重要(语音识别是识别你说的话,而声纹识别是指识别说话的人是谁)。未来更多的智能设备上面将配有声纹识别,更将大大的提高设备的安全性。

快商通声纹识别:让智能设备认识你,听懂你

以前的语音交互大多是服务为主,以产品为核心,是根据产品找用户。

目前,作为声纹身份认证与智能语音交互解决方案提供商,快商通推出以用户为中心的智能交互解决方案:

通过远场声纹识别技术,让智能设备能够自然快速识别用户身份,从而时刻感知用户需求的本质来源,记忆用户行为习惯和各类偏好。通过自然语言交互,分析用户语言背后的真实意图,并随之快速作出合理的反应,并能在之后的生活中不断地进行调整。

方案集成声纹识别、声学处理、自然语言处理、深度神经网络等核心AI智能技术,以唯一性和安全性为基础,打造“人性化”的人机交互,解决智能设备的误触发及个性化服务痛点:

快商通原创的语音与声学处理技术能够保证机器能够听得准真实环境下人的声音,使智能设备在充满噪声干扰和多人同时说话的场景中,仍然能保持95%以上的识别准确率,同时处理多人声纹身份识别的问题。

智能设备们除了能只被特定成员唤醒外,还能根据不同成员的习惯和喜好进行个性化推荐。唯有你能在你的整个智能生活的中心随心所欲。

快商通是一家以人工智能技术为核心的创新型科技公司,专注于声纹识别与自然语言处理技术的研发与创新,完全自主知识产权的声纹识别技术达到世界领先水平。

目前,快商通已为大量终端设备厂商提供优质的远场声纹识别与语义理解技术支持。用户可在不同场景下通过远场语音交互。进行自然语言交互,享受科技给生活带来的便利。未来,将携手人工智能生态链上下游合作伙伴,持续推进更自然、更智能、更人性化的人机交互发展,让人工智能更好的服务人类。

快商通技术方案优势:

1.复杂场景下的身份识别与唤醒:结合声源定位和前端声学处理技术,解决误触发,交互过程自然高效。

2.深层次理解:结合场景、世界知识和历史交互信息,再对语义、语用和情感进行深层次理解,提升能交互效率和机器决策准确度。

3.拟人式对话:在系统的输出侧,能够以高逼真度、高自然度、和高准确度度的拟人形象、用词、和表达方式来和用户交互,就能大大减小对用户感知能力的要求。

4.个性化交互:与不同人交互时,智能设备提供的交互方式和内容是用户所感兴趣的。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    具身智能对人机交互的影响

    在人工智能的发展历程中,人机交互一直是研究的核心领域之一。随着技术的进步,人机交互的方式也在不断演变。从最初的命令行界面,到图形用户界面,再到现在的自然语言处理和语音识别,每一次技术的突破都极大
    的头像 发表于 10-27 09:58 254次阅读

    聚徽-工控一体机是如何实现人机交互

    工控一体机实现人机交互的方式是多种多样的,结合搜索结果,我们可以归纳出以下几种主要的实现方式:
    的头像 发表于 09-10 09:31 280次阅读

    基于传感器的人机交互技术

    基于传感器的人机交互技术是现代科技发展的重要领域之一,它极大地推动了人机交互的便捷性、自然性和智能性。本文将详细探讨基于传感器的人机交互技术,包括其基本原理、关键技术、应用领域以及未来发展趋势。
    的头像 发表于 07-17 16:52 650次阅读

    目标智能识别系统

    智慧华盛恒辉多目标智能识别系统是一种利用现代计算机视觉技术和人工智能算法,从图像或视频中同时识别和分类多个目标物体的系统。这种系统广泛应用于自动驾驶、智能监控、
    的头像 发表于 07-16 10:42 1.3w次阅读

    人机界面交互方式的介绍

    人机界面(Human-Computer Interaction, HCI)是研究与计算机之间交互方式的学科。随着计算机技术的发展,人机交互方式也在不断地演变和创新。以下是对各种
    的头像 发表于 07-01 14:22 656次阅读

    人机交互界面是什么_人机交互界面的功能

    终端(OT),是指与计算机系统之间的通信媒体或手段,是与计算机之间进行各种符号和动作的双向信息交换的平台。   人机交互界面的主要作用是将人类的意图转化为计算机能够理解和处理的形式,同时将计
    的头像 发表于 06-22 11:03 2154次阅读

    工业平板电脑在人机交互中的应用

    工业平板电脑在人机交互(Human-Machine Interaction,HMI)中扮演着至关重要的角色,它们通过直观的界面和强大的计算能力,极大地提升了工业环境下的操作效率和用户体验。以下是工业平板电脑在人机交互中的具体应用:
    的头像 发表于 06-18 12:00 258次阅读

    人机交互与人机界面的区别与联系

    随着信息技术的飞速发展,人机交互(Human-Computer Interaction,HCI)已成为现代社会不可或缺的一部分。人机交互技术,作为实现与计算机之间有效通信的桥梁,不仅改变了我们
    的头像 发表于 06-07 15:29 809次阅读

    瑞萨与RT-Thread推出基于RT-Thread&OpenMV的RA8人机交互方案

    瑞萨与战略合作伙伴RT-Thread携手于2024年2月底正式发布了全新的硬件产品——基于RT-Thread&OpenMV的RA8人机交互解决方案Vision Board。
    的头像 发表于 04-01 14:10 858次阅读
    瑞萨与RT-Thread推出基于RT-Thread&amp;OpenMV的RA8<b class='flag-5'>人机交互</b>方案

    人机交互的三个阶段 人机交互的常用方式

    交互经历的三个阶段:命令行界面交互阶段、图形用户界面交互阶段、自然和谐的人机交互阶段。
    的头像 发表于 03-13 17:25 2771次阅读

    人机交互系统的发展史及过程步骤

    人机交互系统还包括用户界面(UI),它是用户与系统之间进行信息交流和控制活动的载体。用户界面可以是软件系统界面,通过显示器呈现系统信息,并接收来自用户的视觉、听觉等感官的输入。
    的头像 发表于 03-11 17:15 2156次阅读
    <b class='flag-5'>人机交互</b>系统的发展史及过程步骤

    人机交互技术有哪几种 人机交互技术的发展趋势

    人机交互技术是指与计算机之间通过各种交互方式进行信息传递、操作和控制的技术。随着科技的进步,人机交互技术也在不断发展创新。以下将介绍人机交互
    的头像 发表于 01-22 17:47 3377次阅读

    荣耀发布MagicOS 8.0,首次实现意图识别人机交互

    在科技圈掀起一股热潮的荣耀正式发布了其自主研发的全新操作系统——MagicOS 8.0,并赋予其一个富有魔法的中文名字:魔法OS 8.0。这款新操作系统凭借其独创的平台级AI使能的意图识别人机交互,重新定义了智能终端的交互方式。
    的头像 发表于 01-12 14:50 861次阅读

    交互的艺术:协作机器人如何定义新一代的人机关系?

    。虽然他们的构想因当时的技术局限性未能实现,但这种人机协作的理念将人机交互推向了机器人技术发展的前沿。 经过多年的技术革新,终于在2004年,KUKA发布了全球首个协作机器人——LBR
    的头像 发表于 11-29 08:10 960次阅读
    <b class='flag-5'>交互</b>的艺术:协作<b class='flag-5'>机器人</b>如何定义新一代的<b class='flag-5'>人机</b>关系?

    汽车多模态交互研究:大模型及多模态融合,推进AI Agent上车

    语音交互方面:语音交互在AI大模型的赋能下,功能愈加智能化、情感化。唇动识别声纹识别等技术的上车,使语音交互精准度得到进一步提升,控制范围
    的头像 发表于 11-24 16:12 1465次阅读
    汽车多模态<b class='flag-5'>交互</b>研究:大模型及多模态融合,推进AI Agent上车