阿里开源自主研发AI语音识别模型-电子发烧友网

阿里巴巴达摩院推出AI 语音识别模型：对全球开源

近日，阿里巴巴达摩院机器智能实验室语音识别团队，推出了新一代语音识别模型——DFSMN，不仅被谷歌等国外巨头在论文中重点引用，更将全球语音识别准确率纪录提升至96．04％（基于世界最大的免费语音识别数据库LibriSpeech）。

另外，该团队同时宣布，即日起向全世界企业与个人开源DFSMN模型，使全球开发者都能共享这一成果。

西北工业大学教授谢磊表示：“阿里此次开源的DFSMN模型，在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”

数据云

115科技和阿里云完成互联网史上最大数据迁移

近日，115科技和阿里云宣布完成阿里云史上最大数据迁移上云项目，115科技的全部数据都搬迁至阿里云上，规模超过100PB，整个项目耗时仅45天。有好奇的网友进行了速度计算，就算这45天一刻不停的连续传输，也需要27GB／秒的速度，工程堪称海量。

战略合作

中国联通与中国电子签署战略合作协议

近日，中国联合网络通信有限公司与中国电子信息产业集团有限公司在北京签署战略合作协议。根据合作协议，中国联通与中国电子将建立战略合作关系，发挥各自专业领域特点，整合优势资源，在互联网＋智慧城市、智慧园区、数据中心、国产化替代、网络安全服务、行业信息化、网络服务和信息通信产品等方面展开共赢合作。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30089

浏览量
268350
语音识别

语音识别

+关注

关注
38

文章
1721

浏览量
112534
阿里巴巴

阿里巴巴

+关注

关注
7

文章
1609

浏览量
47102

原文标题：【智能制造日报】阿里巴巴达摩院推出AI语音识别模型：对全球开源

文章出处：【微信号：IMA_MIIC，微信公众号：智能制造发展联盟】欢迎添加关注！文章转载请注明出处。

阿里通义千问代码模型全系列开源

近日，阿里云通义大模型团队宣布了一项重大决策：将通义千问代码模型全系列正式开源。此次开源的模型系

发表于 11-14 15:26 •187次阅读

阿里云开源Qwen2.5-Coder代码模型系列

近日，阿里云通义大模型团队宣布开源其通义千问代码模型全系列，共包含6款Qwen2.5-Coder模型。这一举措展示了

发表于 11-14 11:28 •266次阅读

Llama 3 与开源AI模型的关系

在人工智能（AI）的快速发展中，开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新，还促进了全球开发者社区的合作。Llama 3，作为一个新兴的

发表于 10-27 14:42 •306次阅读

阿里国际发布翻译大模型Marco

近日，阿里国际正式推出了其翻译大模型——Marco。这款模型已在阿里国际AI官网Aidge上线，并向全球用户开放使用。

发表于 10-17 16:07 •230次阅读

摩尔线程正式开源音频理解大模型MooER

近日，国内领先的GPU创新企业摩尔线程宣布了一项重大技术突破——正式开源其自主研发的音频理解大模型MooER（摩耳）。这一举动标志着我国在音频处理与理解领域迈出了坚实的一步，特别是在基

发表于 08-27 15:24 •456次阅读

努比亚发布自主研发的星云大模型,在AI技术领域又一重大突破

7月23日最新资讯，努比亚于今日下午盛大召开“AI+双旗舰”新品发布会，震撼发布了其自主研发的星云大模型，标志着公司在AI技术领域的又一重大

发表于 07-23 16:50 •1001次阅读

Transformer模型在语音识别和语音生成中的应用优势

随着人工智能技术的飞速发展，语音识别和语音生成作为人机交互的重要组成部分，正逐渐渗透到我们生活的各个方面。而Transformer模型，自其诞生以来，凭借其独特的自注意力机制和并行计算

发表于 07-03 18:24 •952次阅读

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

与硬件外设的开发板，采用具备丰富组件生态的 Zephyr RTOS作为操作系统，官方提供了十几种开源SDK，包含大模型语音交互、大模型拍照识图、文生图、人脸

发表于 06-18 17:33

开发者手机 AI - 目标识别 demo

功能简介该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用，旨在从上到下打通Openharmony AI子系统，展示Openharmony系统的AI能力，并为

发表于 04-11 16:14

重塑翻译与识别技术：开源语音识别模型Whisper的编译优化与部署

模型介绍Whisper模型是一个由OpenAI团队开发的通用语音识别模型。它的训练基于大量不同的音频数据集，是一个多任务

发表于 01-06 08:33 •3380次阅读

重塑翻译与<b class='flag-5'>识别</b>技术：<b class='flag-5'>开源</b><b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>模型</b>Whisper的编译优化与部署

【开源项目】基于ESP32的语音识别控制AI小夜灯

一、项目简介使用ESP32-S3N8R8模块作为主控芯片，S3内核增加了用于加速神经网络计算和信号处理等的指令，这使得我们可以使用它来快速解析训练好的语音模型进行语音识别的功能。二

发表于 12-19 14:05

在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用

AI 大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI（Speech

发表于 12-15 15:50 •563次阅读

在线研讨会 | 大<b class='flag-5'>模型</b>时代<b class='flag-5'>语音</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>的训练、优化与应用

语音数据集：AI语音技术的灵魂

提升语音识别和生成能力：语音数据集为AI模型提供了丰富的语音样本，通过训练和学习这些数据，

发表于 12-14 14:33 •973次阅读

语音数据集：推动AI语音技术的核心力量

的发展趋势。二、语音数据集的重要性提高语音识别和生成能力：语音数据集包含大量的语音样本，可以为模型

发表于 12-12 11:32 •674次阅读

阿里云通义千问720亿参数模型宣布开源

12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时，他们还开源了18亿参数模型Qwen-1.8B和音频大

发表于 12-01 17:08 •1311次阅读

搜索历史

阿里开源自主研发AI语音识别模型

评论