0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员已经开发出一种能够检测“无声语音”的AI模型

倩倩 来源:文财网 作者:文财网 2020-12-17 10:09 次阅读

加州大学伯克利分校的研究人员已经开发出一种能够检测“无声语音”的AI模型。该模型基于数字语音预测单词并生成合成语音。肌电图(EMG)的电极位于脸部和喉咙,用于检测无声语音。

研究人员断言,该模型可以为无法发出可听语音的人们启用许多应用程序,并可以帮助AI工具和其他响应语音命令的设备进行语音检测。

该小组指出,以数字方式为无声语音发声具有广泛的应用。例如,它可以生成类似于蓝牙耳机的工具,该工具可以使个人继续通话,而不会打扰周围的人。当环境声音太大而无法捕获可听见的语音或必须保持安静时,这种设备将非常有用。

口头阅读AI是可以从静音语音中捕获单词的AI的另一个示例。它可以为监视设备供电,并支持聋人的用例。

研究人员使用了一种方法,其中将所需语句的音频输出目标从发声录音转换为无声录音。然后,使用WaveNet解码器生成音频语音预测。

通过比较发声的EMG数据和基线训练的数据,发现发声的EMG方法在从书中转录句子时,单词错误率降低了64%至4%,而基线降低了95%。研究人员开源了约20小时的面部EMG数据集,以鼓励对该领域进行进一步研究。

在其他工作中,中国的研究人员建立了讽刺检测模型,该模型在多模式Twitter数据集上提供SOTA性能。Masakhane开放源代码非洲语言翻译项目的成员已发布了 有关低资源机器翻译的 案例研究。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1143

    浏览量

    40721
  • 蓝牙耳机
    +关注

    关注

    19

    文章

    5660

    浏览量

    59143
  • AI
    AI
    +关注

    关注

    87

    文章

    30763

    浏览量

    268907
收藏 人收藏

    评论

    相关推荐

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的是百度的Picodet模型,它是一种基于深度卷积网络(DNN)的轻量级目标检测模型,具有非常高的检测精度,可以在低算力设备进行实时的端到端
    发表于 12-19 14:33

    AMD发布10亿参数开源AI模型OLMo

    AMD公司近日宣布了项重大进展,推出了首个完全开放的10亿参数语言模型系列——AMD OLMo。这举措为开发者和研究人员提供了强大的
    的头像 发表于 11-12 18:08 437次阅读

    BitEnergy AI公司开发出一种AI处理方法

    BitEnergy AI公司,家专注于人工智能(AI)推理技术的企业,其工程师团队创新性地开发一种名为线性复杂度乘法(L-Mul)的
    的头像 发表于 10-22 15:15 388次阅读

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    偏见、伦理道德等问题。此外,如何更好地将AI与科学研究人员的传统工作模式相融合,也是个亟待解决的问题。未来,随着技术的不断进步和应用场景的拓展,AI for Science有望在更多
    发表于 10-14 09:16

    rup是一种什么模型

    RUP(Rational Unified Process,统建模语言)是一种软件开发过程模型,它是一种迭代和增量的软件
    的头像 发表于 07-09 10:13 1245次阅读

    基于一种AI辅助可穿戴微流控比色传感器系统

    存在的挑战限制了这项技术的实际应用。 据麦姆斯咨询报道,为了克服这些挑战,来自中国石油大学(华东)的研究人员开发一种人工智能(AI)辅助的可穿戴微流控比色传感器系统(
    的头像 发表于 06-29 10:57 1.1w次阅读
    基于<b class='flag-5'>一种</b><b class='flag-5'>AI</b>辅助可穿戴微流控比色传感器系统

    聆思CSK6视觉语音模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    丰富外设配件 配套多模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用 板载 DAPLINK 调试器,外接条USB 线即可实现烧录、调试、串口日志查看 板载网络模组
    发表于 06-18 17:33

    基于助听器开发一种高效的语音增强神经网络

    受限的微控制器单元(microcontroller units,MCU)上,内存和计算能力有限。在这项工作中,我们使用模型压缩技术来弥补这差距。我们在HW上对RNN施加约束,并描述了一种方法来满足它们
    发表于 06-07 11:29

    OpenAI推出专用的AI检测工具

    OpenAI最近推出了款全新的AI检测工具,这款工具专门针对由DALL·E 3模型生成的图片。令人印象深刻的是,该工具能够精准识别出这类图
    的头像 发表于 05-09 10:01 517次阅读

    一种可实现稳定压力传感的新型可拉伸电子皮肤

    现有的电子皮肤会随材料拉伸而降低传感精度。美国得克萨斯大学奥斯汀分校研究人员开发出一种新型可拉伸电子皮肤,解决了这项新兴技术的个主要难题。
    的头像 发表于 05-09 09:07 463次阅读

    研究人员利用定制光控制二维材料的量子特性

    光波控制谷值选择性带隙修正 个科学家团队开发出一种利用光的结构来扭曲和调整量子材料特性的方法。他们的研究成果发表在今天的《自然》(Nature)杂志上,为下
    的头像 发表于 05-06 06:29 243次阅读
    <b class='flag-5'>研究人员</b>利用定制光控制二维材料的量子特性

    研究人员开发出新型AI辅助发音系统,让人没有声带也能说话

    电子发烧友网报道(文/李弯弯)近日,加州大学洛杉矶分校生物工程系助理教授陈俊及其团队,开发一种可以在机器学习辅助下将喉部肌肉运动转化为语音的“柔性贴片”助听装置,这将有望帮助部分嗓音障碍患者实现
    的头像 发表于 03-28 09:11 2356次阅读

    防止AI模型被黑客病毒入侵控制(原创)聆思大模型AI开发套件评测4

    监控 :实时监控模型的输入和输出,检测异常行为或异常数据,及时采取措施防止入侵。对模型进行监控,以便及时发现异常行为。 员工培训 :培训开发和使用
    发表于 03-19 11:18

    研究人员开发出一种新型太赫兹成像系统

    系统使用的辐射探测器。 由加州大学洛杉矶分校Samueli工程学院电气和计算机工程教授Mona Jarrahi和Aydogan Ozcan领导的研究团队发明了一种新的太赫兹焦平面阵列来解决这个问题。 带PSR的等离子体光电导THz-FPA 通过消除逐点捕获和显示图像
    的头像 发表于 01-19 10:05 870次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>开发出</b><b class='flag-5'>一种</b>新型太赫兹成像系统

    语音数据集:推动智能语音技术发展的关键驱动力

    发展方向。 语音数据集的重要性 语音数据集是智能语音技术的基石,它提供了大量的语音样本和对应的标签,用于训练和评估
    的头像 发表于 12-28 13:46 566次阅读