0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Alexa耳语模式——AI技术更显人性化

人工智能 2018-10-09 15:20 次阅读

上周,亚马逊在美国西雅图举行的发布会上一口气推出了十余款Alexa设备,大部分设备主要由Alexa语音平台驱动。其中部分设备将增添“耳语模式”功能,使Alexa设备用耳语来回应用户的低声说话。日前,亚马逊Alexa语音系统小组的一位专家Zeynab Raeesy在其博文中揭秘了这一功能的AI基础。

Raeesy在博文中介绍:“如果你在一个有小孩睡觉的房间,当有人走进来时,你会马上低声说话,提醒进来的人你希望房间内能保持安静,而进来的人意识到这一点之后,很可能也会压低声音讲话。”

Raeesy指出,Alexa的耳语模式令人难以理解的地方在于它是清音的,也就是说,它不涉及声带振动,往往比普通的语音在低频段具有更少的能量。她与小组的同事研究了两种能区分正常语音和耳语音的神经网络

两种神经网络主要在结构上有所区别,一个是MLP(多层感知器),另一个是能进行时间递归的LSTM(长短期记忆)网络,这两者用来做训练的数据是一样的,这些数据包括(1)对数滤波器组能量,或者是用来记录不同频率范围信号能量的语音信号表示;(2)能区别耳语音与正常语音之间信号差异的一组特征。

在测试中,他们发现LSTM的表现结果比MLP更好,具备许多优势。Raeesy解释道,Alexa语音识别引擎的其他组件完全依赖对数滤波器组能量,并给不同的组件提供相同的输入数据,进而使整个系统更加紧凑。

Alexa耳语模式的开发并非一帆风顺,至少在最初阶段是这样的。由于Alexa是通过短时间的沉默(一种被称为“结束指向”的技术)来识别指令的结束或者进行回复,LSTM往往在话语即将结束时降低置信度。为解决这个问题,研究人员将LSTM的输出校准成整个话语的平均值,最终,降低最后1.25秒的语音数据成为维持“耳语模式”性能的关键。

美式英语的耳语模式功能将在今年11月份推出,对耳语模式具体工作原理的介绍将以论文的形式在12月份的IEEE语音技术研讨会上发表。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31195

    浏览量

    269564
收藏 人收藏

    评论

    相关推荐

    AI在可穿戴领域狂飙,混合式AI模式加速落地

    并不陌生,它带来了更加个性的推荐和更加人性化的交互方式。   在可穿戴设备上,苹果、三星、360、索尼、XREAL等做智能手表、XR设备的硬件厂商都将生成式AI用到了自己的产品上。在产业链上游,涉及处理器、传感器的芯片厂商在生
    的头像 发表于 08-02 01:09 6641次阅读
     <b class='flag-5'>AI</b>在可穿戴领域狂飙,混合式<b class='flag-5'>AI</b><b class='flag-5'>模式</b>加速落地

    企业AI算力租赁模式的好处

    构建和维护一个高效、可扩展的AI算力基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI算力租赁模式为企业提供了一种灵活、高效且成本可控的解决方案。下面,
    的头像 发表于 12-24 10:49 156次阅读

    雷诺下一代车载语音助手Reno将引入生成式AI技术

    为客户提供更加直观和有趣的驾驶体验。多年来,雷诺与赛轮思一直保持紧密合作,致力于提升Reno的人性化语音交互能力。
    的头像 发表于 11-01 16:39 1150次阅读

    亚马逊基于人工智能的Alexa发布计划延期至明年

    11月1日外媒报道称,亚马逊已将基于人工智能技术全新打造的正版Alexa发布计划延期至明年。   亚马逊最初于去年9月公开了新版Alexa的规划,意在通过集成AI大模型,显著增强
    的头像 发表于 11-01 15:19 596次阅读

    智能照明管理系统,打造人性化照明方案

    基本概念 智能照明管理系统是利用物联网、有线/无线通讯、大数据以及云计算等技术组成的智慧楼宇照明管控系统,将传统人工按时开关的模式,升级为能够远程控制、故障示警、自动调节及节能管理的灯控方案,为
    的头像 发表于 10-22 10:55 584次阅读
    智能照明管理系统,打造<b class='flag-5'>人性化</b>照明方案

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    领域的研究人员的工作模式相融合,也是一个亟待解决的问题。然而,这些挑战也孕育着新的机遇。随着技术的不断进步和应用场景的拓展,AI在生命科学领域的应用将更加广泛和深入,为科学家们提供更多的研究工具和方法
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究中的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析复杂的数据集,从而发现隐藏在数据中的
    发表于 10-14 09:16

    NV080D-S8 高品质otp语音芯片:让漱口水售货机更智能和人性化

    体验与人性化服务。这款芯片凭借其卓越的音质输出与灵活的编程能力,让每一次与售货机的交互都变得生动有趣。当顾客走近漱口水售货机时,该芯片能够即时感知并触发预设的欢迎
    的头像 发表于 10-12 08:02 252次阅读
    NV080D-S8 高品质otp语音芯片:让漱口水售货机更智能和<b class='flag-5'>人性化</b>

    智慧医疗:让医疗更智慧、更高效、更人性化

    一、智慧医疗简介 智慧医疗是指运用人工智能、大数据、云计算、物联网等技术,将医疗机构内外的医疗资源和信息进行整合和共享,实现医疗服务的智能管理和优化。通过智能的设备、系统和算法,智慧医疗能够实现
    的头像 发表于 06-25 11:20 2012次阅读

    业界标杆,用户首选:三星AI电视引领视听体验与智慧生活新纪元

    能够提供极致的视听体验,更通过智能算法深度理解用户需求,并与家居设备无缝连接,实现个性内容推荐和人性化智慧交互。三星AI电视让用户在享受视听盛宴的同时,也能感受到科技带来的便利与舒适,为大众的娱乐生活带来更多可能。
    的头像 发表于 06-17 11:03 338次阅读

    达实智能物联网整体解决方案打造人性化通行空间!

    但是这些问题,在达实大厦都得到了解决!达实基于自主研发的AIoT智能物联网管控平台,运用自主研发的物联网系列终端产品,聚合模块的空间场景应用,实现了自建总部的畅通无阻与人性化通行。
    的头像 发表于 05-30 10:10 887次阅读

    Medium禁止发布AI生成的付费文章,加强机器人生态管理

    Medium 作为一个致力于推动人性化讲故事体验的平台,并非 AI 写作竞技场。尽管 AI 能辅助提高部分人群写作水平或助力创作者用陌生语言创作,但完全依赖 AI 的内容并不受欢迎。
    的头像 发表于 04-22 14:13 370次阅读

    NanoEdge AI技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传输延迟、降低
    发表于 03-12 08:09

    美格智能在MWC 2024展示5G-A和端侧AI解决方案

    2024年世界移动通信大会(MWC)在西班牙巴塞罗那圆满落幕。本届大会以“未来先行”为主题,聚焦“超越5G”、“智联万物”和“AI人性化”等核心议题,吸引了全球2400多家业界领先企业参展。
    的头像 发表于 03-03 15:37 895次阅读

    高通亮相MWC 2024:AI+连接助力创新与协作,让智能计算无处不在

    2月26日,全球最具影响力的移动通信盛会2024世界移动通信大会(MWC)在巴塞罗那拉开帷幕,以“未来先行”为主题,围绕“超越5G”、“智联万物”、“AI人性化”等话题展开。
    的头像 发表于 02-28 15:57 572次阅读