Mozilla使用开源Common Voice语音识别数据集进行多语言操作-电子发烧友网

Mozilla 宣布它正在使其众包项目 Common Voice 支持更多语言。Common Voice 是一个旨在创建开源语音识别数据集的项目，于去年6月发布，它邀请来自世界各地的志愿者通过网络和移动应用程序，用他们的声音记录文本片段。

业内普遍认为语音将成为下一个重要的技术平台，近年来随着人工智能理论与技术的迅猛发展，语音识别技术在不断突破，通过语音助手如 Alexa、Google Assistant、Siri 和 Cortana，各公司将收集到的用户语音数据归为公司自己所有，这些数据的价值或许目前很难被外界看出来，但是在信息化高度发达，特别是今天这样一个大数据和人工智能时代，为开发机器学习模型提供语音数据集怎么看都是一件有深远意义的事，这些语音数据的意义会慢慢体现。

而最终当它们的价值逐渐显现，人们会发现在这背后亚马逊、谷歌、苹果和微软等公司已经牢牢锁住了语音技术的命门，主导了这场语音市场之争。

Common Voice 项目就是为了避免这样的事情而诞生的，它的目的是将收集到的语音数据集开源给公众，使得任何人都可以自由使用这些数据集来将语音识别技术智能地构建到各种应用程序和服务中。Mozilla 已经在去年11月公布了 Common Voice 英语数据集的第一批成果，其中收录了20000个人录制的40万个录音、大约500小时的演讲。此次 Mozilla 又宣布它正式开始收集法语、德语和威尔士语三种语言的语音数据，同时也在为收集另外40种语言做准备，巴西葡萄牙语、印度尼西亚语、波兰语和荷兰语等已经准备好启动众包语音数据收集。

Mozilla 首席创新官 Katharina Borchert 在他的博客中写到：“我们希望用户使用自己的语言甚至方言的时候是可以被机器理解的，但是我们相信这些技术上的接口不应该由少数几家公司控制，他们不能像守门员一样来完全把控语音服务。”

Common Voice 项目的意义与用于打击私人平台的开放许可证项目类似，OpenStreetMap 就是一个很好的例子。OpenStreetMap 为开发者提供了开放且可自由使用的世界地图，使得开发商不再需要依赖于 Google Maps 这样的竞争对手，不仅降低了成本开销，技术上也不再受到限制。

“使用多种语言标志着 Common Voice 迈出了重要的一步，我们希望它对整体语音技术来说也是一大步”，Mozilla Common Voice 项目的数字策略师 Michael Henretty 补充到：“语音技术的民主化不仅会降低全球创新的障碍，也会让人们获取信息更加便捷。”

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Mozilla

Mozilla

+关注

关注
0

文章
50

浏览量
11274
语音识别

语音识别

+关注

关注
38

文章
1745

浏览量
113015

原文标题：打破语音垄断 Mozilla Common Voice 支持更多语言

文章出处：【微信号：robot-1hjqr，微信公众号：1号机器人网】欢迎添加关注！文章转载请注明出处。

Meta与UNESCO合作推动多语言AI发展

Meta最近宣布了一项与联合国教科文组织(UNESCO)合作的全新计划——语言技术伙伴计划。该计划旨在收集多种语言的语音录音和文字记录，以推动未来开放可用的人工智能(AI)技术的发展，特别关注那些

发表于 02-08 11:04 •295次阅读

微软Copilot Voice升级，积极拓展多语言支持

近日，据报道，微软近期在人工智能领域取得了新的进展，正积极拓展其Copilot Voice的多语言支持功能。这一举措标志着微软在语音识别和自然语言

发表于 02-06 14:10 •116次阅读

语音识别与自然语言处理的关系

在人工智能的快速发展中，语音识别和自然语言处理（NLP）成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的

发表于 11-26 09:21 •655次阅读

ASR与传统语音识别的区别

识别技术。构建更深更复杂的神经网络模型，利用大量数据进行训练。提高了语音识别的准确率和稳定性。传统

发表于 11-18 15:22 •682次阅读

车载空气净化器语音芯片方案

车载空气净化器采用离线语音识别NRK3301芯片，提升便捷性、安全性，高识别率、低误报率，支持多语言、自定义指令，满足用户需求，增强使用体验。

发表于 11-13 10:22 •234次阅读

N9300-S16语音芯片：提升电梯播报体验，实现导航声音播报提示

N9300语音芯片提升电梯播报体验，支持多语言播报，音质纯净，控制灵活，广泛应用于公共场所语音导航，推动智能化发展。

发表于 10-30 13:10 •237次阅读

ChatGPT 的多语言支持特点

）技术迎来了巨大的挑战和机遇。ChatGPT，作为一个领先的语言模型，其多语言支持的特点成为了它在众多应用场景中不可或缺的优势。 1. 多语言理解能力 ChatGPT 的多语言支持首先

发表于 10-25 17:30 •955次阅读

离线语音控制技术特点

离线语音控制通过结合高性能的音频前端处理算法和本地AI模型实现了高效的语音识别和控制能力，不依赖于互联网连接，同时具备灵活的应用扩展性。这种解决方案为各种智能设备提供了稳定、高效和多语言

发表于 06-26 18:12 •624次阅读

有效提升智能会议系统语音识别准确性案例分享

。多语言支持的语音识别技术还可以准确识别不同语言和方言，对于夸全球交流的国际会议必不可缺。语音

发表于 06-21 11:15 •426次阅读

有效提升智能会议系统语音识别准确性案例分享

。多语言支持的语音识别技术还可以准确识别不同语言和方言，对于夸全球交流的国际会议必不可缺。语音

发表于 06-21 11:13 •596次阅读

车载语音识别系统语音数据采集标注案例

的作用。一般来说，车载语音识别系统主要分为前端和后端两个部分，本文将针对前端语音信号数据采集标注进行实例讲解。

发表于 06-19 15:52 •427次阅读

车载语音识别系统语音数据采集标注案例

的作用。一般来说，车载语音识别系统主要分为前端和后端两个部分，本文将针对前端语音信号数据采集标注进行实例讲解。

发表于 06-19 15:49 •597次阅读

这个多语言包怎么搜不到

大家好，这个多语言包怎么搜不到 seven language lib 谁有离线包不感谢分享，

发表于 03-24 10:06

大语言模型（LLMs）如何处理多语言输入问题

研究者们提出了一个框架来描述LLMs在处理多语言输入时的内部处理过程，并探讨了模型中是否存在特定于语言的神经元。

发表于 03-07 14:44 •713次阅读

车内语音识别数据在智能驾驶中的价值与应用

车内语音识别数据在智能驾驶中的价值与应用一、引言随着智能驾驶技术的不断发展，车内语音识别数据在智能驾驶中的应用越来越广泛。车内语音

发表于 02-19 11:47 •696次阅读