0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音助手,赋能多形态终端

lhl545545 来源:移动Labs 作者:刘辉 尹舟洋 徐运 2020-11-03 09:19 次阅读

随着我国人工智能发展规划的出台,以及各项关键技术的日趋成熟,物联网时代逐步成为继移动互联网时代的下一个浪潮,人机交互开启新一轮的需求革新,从鼠标、键盘、触屏的传统交互向语音交互演进,社会正在飞速进入智能语音交互时代。

以“语音+内容+智能”为切入点,打造自主设计、自主整合、自主运营的一站式语音交互共享平台,构建可运营、能变现的语音交互生态,赋能多形态终端产品,打造能听会说的人机交互体验,是未来智慧家庭发展的大趋势,也是中国移动智慧家庭运营中心推进数字家庭生态建设的重点方向。

1 语音交互是智慧家庭生态布局的关键入口

1.1 人机交互需求不断革新

伴随着交互场景的拓展,人们逐渐对交互自由度提出了更大需求,语音交互越来越贴近人类的本能表达。语音交互凭借其输入速度快、场景限制少、技术链条发展成熟等优势,成为智能时代的理想交互途径,并逐步向交互智能、终端多态、服务泛在的方向发展。

1.2 家庭场景服务更加智能

语音交互是将人工智能技术底层产业化的关键,语音助手连接多形态终端和广泛业务,可提供内容服务、互联网服务,以及场景化智能家居控制等服务,为家庭用户提供互动娱乐、互动教育、家庭健康、家庭安防等新型产品体验,其中智能音箱成为首款爆发单品,并逐步向更多产品形态延伸。

2 核心技术攻关提升体验

智能语音交互主要涉及语音识别、语义理解和语音合成等技术。语音识别技术能将语音流转换为文本,语义理解技术可分析语句的含义、剖析用户意图,语音合成技术将解析结果以语音的方式反馈给用户,从而实现与用户的智能语音交互。

2.1 语音识别——听得清

智能语音交互平台现采用基于Transformer算法的端到端模型,具备识别速度快、识别准确率高的特性。该模型采用基于上下文理解的自注意力机制,提升了语义特征提取能力,解决了传统模型中声学模型和语言模型无法联合优化的问题,并且该算法能更好地利用先进硬件实现并行计算,从而提升运算速度。

2.2 语义理解——听得懂

平台采用基于规则+深度+关键词匹配算法的多算法融合模型理解用户意图,规则算法对于较短文本可实现快速准确的匹配,深度学习算法可对词表无法覆盖的新词进行识别,关键词匹配算法对于词表顺序颠倒、文本长尾问题,能快速准确地识别文本意图。

2.3 语音合成——说得明

平台采用端到端合成系统,可直接输入文本或注音字符,直接输出音频波形,该系统降低了对语言学知识的要求,能批量实现几十种甚至更多语种的合成系统,并且它表现出丰富的发音风格和强大的韵律表现力,加快不同声音的合成。

3 语音OS锻造,赋能语音生态

3.1 语音助手,赋能多形态终端

智能语音交互平台面向多形态终端提供语音助手,采用Hook技术分离各个子模块,实现语音点播、通话、听书、对话等功能,协助平台构建声纹、情绪、体感等多模态识别交互和相应反馈、推荐业务,兼容主流操作系统,支持自定义接口扩展,大大缩短接入周期和研发成本,快速赋能生态硬件及应用的语音交互能力。

3.2 语音插件,赋能海量应用

平台面向海量应用提供语音交互插件,制定标准开放协议,基于IPC实现第三方应用与Launcher的跨进程通讯,当用户调用语音控制,由平台下发热词及词槽信息,Launcher进行动态匹配并下发至第三方应用,可进行直播、点播、播控等,从而实现所见即所得。

4 整套场景封装,提供系统解决方案

4.1 全屋智能

基于智能语音交互能力和Andlink智能家居云平台,提供智能音箱、智能面板、智能照明、智能开关等一体化全屋智能解决方案,实现跨厂商设备的接入和语音控制,可与智能门禁、摄像头等结合,实现家庭安防组合等细分场景。

4.2 AI客厅

打造智慧屏,通过语音遥控器、智能音箱与智能电视结合的方式,实现电视播控推荐,将语音能力赋能教育、电商、音乐、游戏、健康等大屏应用,发挥轻量级语音技能,实现一说即得的用户体验。

4.3智能对话服务

提供融合语义推导与语义匹配的对话理解技术,预置涵盖音视频娱乐、设备控制、生活服务等领域的对话能力及词典,高效定制对话能力,在智能助手、在线客服、语音家教等领域可广泛应用。

5 结束语

智能语音交互系统攻关语音识别、语义理解、语音合成等技术,快速赋能多形态终端,应用于 “能听会说”、“能理解会思考”的AI交互体验,实现从概念、技术到商业产品、功能应用的跨越,形成一个以语音交互技术为核心的全新应用生态链,促进人工智能产业的迅猛发展。

5G快速发展的背景下,高带宽和低时延特性促使智能语音交互技术不断攻克新的难题,开启新的篇章。在“理解”层面,重点打造“支持打断和智能纠正”的认知型对话引擎,实现自然交互的本质要求;在“应用”层面,语音交互内容技能生态将渗透各个领域,并进行场景化的封装,真正实现海量服务“开口即得”的交互体验;在“接入”层面,语音助手持续扩大枢纽作用,赋能更多形态终端和交互应用规模起量,实现万物均能说话;在“沉浸式”层面,将融合语音识别、人脸识别、表情分析、唇动状态、眼球跟踪、手势识别、触觉监控等智能人机交互手段,完善“端-端”、“端-云-端”的交互协议,打造沉浸式多模态互动体验。

当人机交互越来越贴近自然表达,中国移动智慧家庭运营中心将持续深化智能语音生态体系建设,引领未来美好生活。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2909

    文章

    44736

    浏览量

    374436
  • 人工智能
    +关注

    关注

    1792

    文章

    47409

    浏览量

    238915
  • 智能语音
    +关注

    关注

    10

    文章

    786

    浏览量

    48810
收藏 人收藏

    评论

    相关推荐

    NV512H语音芯片加湿器方案,集语音播报+平台自定义语音功能

    在秋冬季节,天气逐渐转凉,空气变得干燥,加湿器成为了许多家庭和办公场所不可或缺的电器设备。NV512H语音芯片的加湿器方案,不仅提升了加湿器的智能化水平,更在用户体验上实现了质的飞跃
    的头像 发表于 12-26 13:35 114次阅读
    NV512H<b class='flag-5'>语音</b>芯片<b class='flag-5'>赋</b><b class='flag-5'>能</b>加湿器方案,集<b class='flag-5'>语音</b>播报+平台自定义<b class='flag-5'>语音</b>功能

    顶坚单北斗智能手持终端如何林业资源管理

    过实时监测与数据分析,为制定科学合理的林业保护与发展策略提供了强有力的数据支撑。顶坚单北斗智能手持终端在林业资源管理中的应用,为这一领域带来了显著的效果。以下从
    的头像 发表于 11-29 11:29 447次阅读
    顶坚单北斗智能手持<b class='flag-5'>终端</b>如何<b class='flag-5'>赋</b><b class='flag-5'>能</b>林业资源管理

    高通与智谱推动模态生成式AI体验的终端侧部署

    此前,骁龙峰会首日,智谱与高通技术公司宣布合作将GLM-4V端侧视觉大模型,面向骁龙8至尊版进行深度适配和推理优化,支持丰富的模态交互方式,进一步推动模态生成式AI在终端侧的部署和推广,
    的头像 发表于 11-08 09:55 194次阅读

    单北斗+鸿蒙系统,顶坚北斗手持终端领域行业应用

    在科技日新月异的今天,单北斗高精度定位技术与鸿蒙智能操作系统的深度融合,顶坚北斗手持终端正以其卓越的定位精度、强大的数据处理能力和跨设备协同能力,交通运输、公共安全、精准农业、测绘地理信息
    的头像 发表于 09-23 16:54 445次阅读
    单北斗+鸿蒙系统,顶坚北斗手持<b class='flag-5'>终端</b><b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>多</b>领域行业应用

    科技,顶坚单北斗手持终端引领智能定位新时代

    科技下,顶坚单北斗手持终端正引领智能定位新时代,这一趋势体现在多个方面,包括技术创新、精准定位、多样化应用场景以及对多个行业的深远影响。单北斗手持终端一、技术创新单北斗手持
    的头像 发表于 08-15 11:38 315次阅读
    科技<b class='flag-5'>赋</b><b class='flag-5'>能</b>,顶坚单北斗手持<b class='flag-5'>终端</b>引领智能定位新时代

    SoundHound AI语音助手欧洲汽车,引领智能驾驶新风尚

    近日,全球领先的AI语音技术独角兽企业SoundHound AI宣布了一项重要合作成果:其集成ChatGPT技术的先进语音助手SoundHound Chat AI,即将搭载于阿尔法罗密欧与雪铁龙等欧洲知名汽车品牌的多款车型中,标
    的头像 发表于 08-01 17:49 776次阅读

    OpenAI向部分用户推出ChatGPT语音助手

    据智通财经APP报道,OpenAI正在为其部分尊贵的用户们精心呈现备受瞩目的ChatGPT语音助手,尽管此款助手原定于今年6月底的发布因为可能存在的安全隐患问题而被暂时搁置。
    的头像 发表于 07-31 15:41 488次阅读

    让智能计算无处不在,高通ChinaJoy AIGC大会展望终端侧AI行业

    高通还在引领终端侧AI在物联网领域的应用。一个具体的用例是工厂车间,工厂车间中数据处理的低时延至关重要,因为即使是最微小的错误也需要即刻关注。通过多模态AI助手,我们可以使用视觉、文本和语音处理为工厂车间的工人提供实时帮助。
    的头像 发表于 07-29 09:49 412次阅读
    让智能计算无处不在,高通ChinaJoy AIGC大会展望<b class='flag-5'>终端</b>侧AI行业<b class='flag-5'>赋</b><b class='flag-5'>能</b>

    亚马逊在语音助手的竞赛中上远远落后

    在AI浪潮席卷全球之际,科技巨头们无不争先恐后,力图抢占先机。然而,在语音助手的竞赛中,曾经的领先者亚马逊可能即将获得最后一名。 继苹果在其WWDC 2024大会上发布了一款新的“Apple
    的头像 发表于 06-18 16:54 1344次阅读

    RFID手持终端场景应用——提升工作效能

    RFID手持终端是一种基于RFID技术的便携式设备,具有非常重要的应用价值。它具有小巧轻便、操作简单、读取速度快等特点,通过RFID技术可以实现对物品进行高速扫描、采集、传输数据等操作,大大
    的头像 发表于 04-12 11:16 378次阅读

    智能语音助手在医疗行业的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手在医疗行业的应用越来越广泛。语音数据集在医疗智能语音助手中发挥着重要作用,为系统提供了丰富
    的头像 发表于 01-19 17:37 709次阅读

    智能语音助手在旅游行业的应用与挑战

    一、引言 随着人工智能技术的不断发展和普及,智能语音助手在旅游行业的应用越来越广泛。语音数据集在旅游智能语音助手中发挥着重要作用,为系统提供
    的头像 发表于 01-19 17:30 845次阅读

    智能语音助手在教育行业的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手在教育行业的应用越来越广泛。语音数据集在教育智能语音助手中发挥着重要作用,为系统提供了丰富
    的头像 发表于 01-19 17:21 874次阅读

    智能语音助手在医疗行业的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手在医疗行业的应用越来越广泛。语音数据集在医疗智能语音助手中发挥着重要作用,为系统提供了丰富
    的头像 发表于 01-18 16:41 552次阅读

    语音数据集在智能语音助手中的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手已经成为了人们日常生活中不可或缺的一部分。语音数据集在智能语音助手中发挥着重要作用,为系统
    的头像 发表于 01-18 15:46 413次阅读