研究人员已经开发出一种能够检测“无声语音”的AI模型-电子发烧友网

加州大学伯克利分校的研究人员已经开发出一种能够检测“无声语音”的AI模型。该模型基于数字语音预测单词并生成合成语音。肌电图（EMG）的电极位于脸部和喉咙，用于检测无声语音。

研究人员断言，该模型可以为无法发出可听语音的人们启用许多应用程序，并可以帮助AI工具和其他响应语音命令的设备进行语音检测。

该小组指出，以数字方式为无声语音发声具有广泛的应用。例如，它可以生成类似于蓝牙耳机的工具，该工具可以使个人继续通话，而不会打扰周围的人。当环境声音太大而无法捕获可听见的语音或必须保持安静时，这种设备将非常有用。

口头阅读AI是可以从静音语音中捕获单词的AI的另一个示例。它可以为监视设备供电，并支持聋人的用例。

研究人员使用了一种方法，其中将所需语句的音频输出目标从发声录音转换为无声录音。然后，使用WaveNet解码器生成音频语音预测。

通过比较发声的EMG数据和基线训练的数据，发现发声的EMG方法在从书中转录句子时，单词错误率降低了64%至4%，而基线降低了95%。研究人员开源了约20小时的面部EMG数据集，以鼓励对该领域进行进一步研究。

在其他工作中，中国的研究人员建立了讽刺检测模型，该模型在多模式Twitter数据集上提供SOTA性能。Masakhane开放源代码非洲语言翻译项目的成员已发布了有关低资源机器翻译的案例研究。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

解码器

解码器

+关注

关注
9

文章
1143

浏览量
40721
蓝牙耳机

蓝牙耳机

+关注

关注
19

文章
5660

浏览量
59143
AI

AI

+关注

关注
87

文章
30763

浏览量
268907

AI模型部署边缘设备的奇妙之旅：目标检测模型

的是百度的Picodet模型，它是一种基于深度卷积网络（DNN）的轻量级目标检测模型，具有非常高的检测精度，可以在低算力设备进行实时的端到端

发表于 12-19 14:33

AMD发布10亿参数开源AI模型OLMo

AMD公司近日宣布了一项重大进展，推出了首个完全开放的10亿参数语言模型系列——AMD OLMo。这一举措为开发者和研究人员提供了强大的

发表于 11-12 18:08 •437次阅读

BitEnergy AI公司开发出一种新AI处理方法

BitEnergy AI公司，一家专注于人工智能（AI）推理技术的企业，其工程师团队创新性地开发了一种名为线性复杂度乘法（L-Mul）的

发表于 10-22 15:15 •388次阅读

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

偏见、伦理道德等问题。此外，如何更好地将AI与科学研究人员的传统工作模式相融合，也是一个亟待解决的问题。未来，随着技术的不断进步和应用场景的拓展，AI for Science有望在更多

发表于 10-14 09:16

rup是一种什么模型

RUP（Rational Unified Process，统一建模语言）是一种软件开发过程模型，它是一种迭代和增量的软件

发表于 07-09 10:13 •1245次阅读

基于一种AI辅助可穿戴微流控比色传感器系统

存在的挑战限制了这项技术的实际应用。据麦姆斯咨询报道，为了克服这些挑战，来自中国石油大学（华东）的研究人员开发了一种人工智能（AI）辅助的可穿戴微流控比色传感器系统（

发表于 06-29 10:57 •1.1w次阅读

基于<b class='flag-5'>一种</b><b class='flag-5'>AI</b>辅助可穿戴微流控比色传感器系统

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

丰富外设配件配套多模态应用示例，支持快速上手体验大模型语音交互、智能视觉等 AI 应用板载 DAPLINK 调试器，外接一条USB 线即可实现烧录、调试、串口日志查看板载网络模组

发表于 06-18 17:33

基于助听器开发的一种高效的语音增强神经网络

受限的微控制器单元(microcontroller units，MCU)上，内存和计算能力有限。在这项工作中，我们使用模型压缩技术来弥补这一差距。我们在HW上对RNN施加约束，并描述了一种方法来满足它们

发表于 06-07 11:29

OpenAI推出专用的AI检测工具

OpenAI最近推出了一款全新的AI检测工具，这款工具专门针对由DALL·E 3模型生成的图片。令人印象深刻的是，该工具能够精准识别出这类图

发表于 05-09 10:01 •517次阅读

一种可实现稳定压力传感的新型可拉伸电子皮肤

现有的电子皮肤会随材料拉伸而降低传感精度。美国得克萨斯大学奥斯汀分校研究人员开发出一种新型可拉伸电子皮肤，解决了这项新兴技术的一个主要难题。

发表于 05-09 09:07 •463次阅读

研究人员利用定制光控制二维材料的量子特性

光波控制谷值选择性带隙修正一个科学家团队开发出了一种利用光的结构来扭曲和调整量子材料特性的方法。他们的研究成果发表在今天的《自然》(Nature)杂志上，为下

发表于 05-06 06:29 •243次阅读

<b class='flag-5'>研究人员</b>利用定制光控制二维材料的量子特性

研究人员开发出新型AI辅助发音系统，让人没有声带也能说话

电子发烧友网报道（文/李弯弯）近日，加州大学洛杉矶分校生物工程系助理教授陈俊及其团队，开发了一种可以在机器学习辅助下将喉部肌肉运动转化为语音的“柔性贴片”助听装置，这将有望帮助部分嗓音障碍患者实现

发表于 03-28 09:11 •2356次阅读

防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

监控：实时监控模型的输入和输出，检测异常行为或异常数据，及时采取措施防止入侵。对模型进行监控，以便及时发现异常行为。员工培训：培训开发和使用模

发表于 03-19 11:18

研究人员开发出一种新型太赫兹成像系统

系统使用的辐射探测器。由加州大学洛杉矶分校Samueli工程学院电气和计算机工程教授Mona Jarrahi和Aydogan Ozcan领导的研究团队发明了一种新的太赫兹焦平面阵列来解决这个问题。带PSR的等离子体光电导THz-FPA 通过消除逐点捕获和显示图像

发表于 01-19 10:05 •870次阅读

语音数据集：推动智能语音技术发展的关键驱动力

发展方向。一、语音数据集的重要性语音数据集是智能语音技术的基石，它提供了大量的语音样本和对应的标签，用于训练和评估

发表于 12-28 13:46 •566次阅读

搜索历史

研究人员已经开发出一种能够检测“无声语音”的AI模型

评论