0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于语音识别技术用于录音应用

星星科技指导员 来源:嵌入式计算设计 作者:OpenSystems Media 2022-06-09 09:50 次阅读

在一个痴迷于互联网隐私的世界里,令人惊讶的是,我们很少谈论像 Amazon Echo 这样的始终在听的设备。毕竟,一家想要了解你生活中的私密细节以便向你推销更多东西的公司会在你的厨房里永久打开一个麦克风。

如果您拥有 Echo 并且不知道此功能,请打开您的 Alexa 应用程序,选择“设置”菜单,然后选择“历史记录”。听一听。所有这些录音都是为 Echo 准备的吗?

我想隐私是现代消费主义中便利的代价。事情将变得更加方便。

杂音、鸡尾酒会、便利和圣诞节

XMOS 是一家从布里斯托大学分离出来的无晶圆半导体公司,专注于语音和音乐处理 IC。在这些 IC 中,基于 32 位 xCORE MCU 架构的设备在语音识别市场上取得了显着的成功,提供了 16 个可编程内核(分为 8 个内核的两个区块,每个内核共享一个地址空间),DSP 功能集成在相同的芯片

XMOS 将 xCORE 架构加入到用于亚马逊 Alexa 语音服务 (AVS) 的 VocalFusion 4-Mic 开发套件中。该套件围绕英飞凌的 VocalFusion XVF3000 集成远场语音处理器和四个高信噪比 (SNR) MEMS 麦克风而设计。XMOS 声称该套件是市场上第一个远场线性麦克风阵列解决方案。

在范围之外,在解决“鸡尾酒会”问题或平台需要将单个扬声器的声音与嘈杂环境隔离的情况时,远场语音处理变得非常有趣。在 5 m 或更远的距离处,VocalFusion 4-Mic 开发套件使用声学回声消除 (AEC)、自适应波束形成、动态去混响和自动增益控制 (AGC) 的组合来隔离和提取声音信号主讲者。除此之外,事情开始变得令人毛骨悚然。

今年早些时候,XMOS 收购了马萨诸塞州波士顿的 Setem Technologies, Inc.,该公司开发了用于盲源信号分离的大规模傅立叶变换。这些盲源分离算法在数学上从一组信号中分解源信号的元素,然后单独或作为组重构它们(图 1)。在语音识别中,这可以应用于单个说话者,甚至是对话。

poYBAGKhUguADw9uAACPBFyn28M881.png

图 1.现在隶属于 XMOS 的 Setem Technologies 开发了盲源分离算法,可用于隔离嘈杂环境中的一个或多个扬声器。

现在,在理论上(或许在实践中),盲源分离可用于隔离房间内多个说话者的语音频率,从而为每个说话者建立生物识别身份。正如你可以想象的那样,这种技术的应用可能会很广泛,不仅仅是亚马逊想知道你的每个家庭成员想要什么圣诞节。例如,监视立即浮现在脑海中。

这让我们回到了 VocalFusion 4-Mic Dev Kit 的线性麦克风阵列。虽然 Amazon Echo 和 Google Home 等许多平台使用圆形阵列的全向麦克风来提供 360 度的房间覆盖,但线性阵列设计用于 180 度的弧度。这很有趣,因为语音识别领域的领导者设想了一个未来,今天基于塔的虚拟助手将退居电视、冰箱、沙发、墙壁等日常物品中——你可以说出来。

这个未来被设计为超级方便,通过音节提供服务。但小心点。你可能不知道谁或什么在听。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19316

    浏览量

    230074
  • dsp
    dsp
    +关注

    关注

    553

    文章

    8014

    浏览量

    349177
  • 扬声器
    +关注

    关注

    29

    文章

    1304

    浏览量

    63067
收藏 人收藏

    评论

    相关推荐

    语音识别技术在医疗领域的应用

    语音识别技术在医疗领域的应用已经越来越广泛,为医疗服务带来了诸多便利和效率提升。以下是对语音识别技术
    的头像 发表于 11-26 09:35 373次阅读

    语音识别与自然语言处理的关系

    在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别技术使
    的头像 发表于 11-26 09:21 427次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应
    的头像 发表于 11-26 09:20 516次阅读

    ASR与传统语音识别的区别

    ASR(Automatic Speech Recognition,自动语音识别)与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比: 一、
    的头像 发表于 11-18 15:22 507次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应
    的头像 发表于 11-18 15:12 751次阅读

    基于Arm Neoverse N2实现自动语音识别技术

    自动语音识别 (Automatic Speech Recognition) 技术已经深入到现代生活的方方面面,广泛应用于语音助手、转录服务
    的头像 发表于 11-15 11:35 340次阅读
    基于Arm Neoverse N2实现自动<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b>

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、
    的头像 发表于 07-22 11:33 415次阅读

    人工智能的语音识别技术详解

    随着科技的飞速发展,人工智能(AI)技术已经渗透到我们生活的方方面面,其中语音识别技术作为AI领域的重要分支,更是以其独特的魅力和广泛的应用前景,引起了社会各界的广泛关注。本文将详细介
    的头像 发表于 07-01 11:39 1292次阅读

    标贝语音识别技术在金融领域中的应用实例

    随着语音识别技术与文本挖掘、自然语言处理等技术的不断融合,智能语音交互技术在金融领域中爆发了出巨
    的头像 发表于 05-16 16:55 618次阅读
    标贝<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b>在金融领域中的应用实例

    WTK6900H语音识别芯片用于智能马桶语音控制上

    语音识别芯片
    WT-深圳唯创知音电子有限公司
    发布于 :2024年04月18日 16:48:16

    语音识别技术历程及工作原理

    语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
    的头像 发表于 03-22 16:58 3287次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>的<b class='flag-5'>技术</b>历程及工作原理

    车内语音识别技术在智能驾驶中的应用与前景

    一、引言 随着智能驾驶技术的快速发展,车内语音识别技术逐渐成为智能驾驶领域的研究热点。语音识别
    的头像 发表于 02-19 11:46 833次阅读

    车内语音识别技术:智能驾驶的核心要素

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来出行的趋势。作为智能驾驶的关键技术之一,车内语音识别技术发挥着越来越重要的作用。它不仅提升了驾驶的便捷性和安全性,也为驾驶者提供了更加
    的头像 发表于 02-19 11:42 790次阅读

    车内语音识别技术:智能驾驶的革新之源

    一、引言 随着科技的飞速发展,智能驾驶已经成为现代交通领域的热门话题。作为智能驾驶的关键技术之一,车内语音识别技术正在改变我们对驾驶的认知。它不仅提高了驾驶的便捷性和安全性,也为驾驶者
    的头像 发表于 02-19 10:10 461次阅读

    语音数据集:智能驾驶中车内语音识别技术的基石

    一、引言 在智能驾驶中,车内语音识别技术发挥着越来越重要的作用。语音数据集作为这一技术的基石,其质量和规模对
    的头像 发表于 01-31 16:07 562次阅读