云知声进一步夯实AGI技术底座-电子发烧友网

Unisound News

2023年8月20号，最后一届VoxSRC Workshop 在都柏林召开。VoxSRC 2023 国际说话人识别竞赛公布比赛榜单，云知声团队夺得Track1(固定训练集说话人确认)第一名、Track2(开放训练集说话人确认)第二名的优异成绩。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大学)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等组织联合发起的国际说话人识别竞赛，是在说话人识别领域最具影响力和权威性的国际赛事之一。

VoxSRC 2023测试集数据来自访谈、新闻、谈话、辩论等多个场景，包括专业编辑音频和随意的谈话音频，同时混杂着笑声、其他说话人噪声等复杂的背景噪音，涉及跨年龄、跨语种说话人识别，同时今年的测试数据继续加大难度，专注于短语音说话人识别，音频时长大部分在2-3s区间，是VoxSRC有史以来最难的一届。

在此次竞赛中，云知声采用并进一步优化了当前最领先的算法。这些算法包括基于ResNet系列主干网络，MQMHA pooling，以及融合了Sub-center和inter-topK的Large-margin损失函数。此外，云知声还实施了多阶段训练调优策略等技术。

除此之外，基于对比赛任务的深刻理解，云知声团队首次提出了Consistency Measure Factor(CMF) 算法，即建模音频“说话人特征的一致性”，并将其引入说话人相似度决策中，大幅提升了说话人识别的准确率。同时，依托云知声大规模算力中心，采用大规模模型训练框架，训练出ResNet314、ResNet518说话人模型。凭借对“说话人算法”的创新性研发和超强力的“算力”支持，云知声团队在Track1(固定训练集说话人识别)赛道以minDCF(最小检测代价函数)0.085、EER(等错误率)1.588%的卓越表现，一举夺得本次大赛冠军。

Track 1 (Verification fullysupervised, closed)

Track 2 (Verification fullysupervised, open)

Track1 & Track2 榜单

值得注意的是，云知声团队将Track1(官方固定训练数据)赛道的结果，直接提交到Track2(可用任何规模数据)赛道，却依然取得了第二名的优异成绩，这充分证明了其算法的出众性和领先性。

云知声：通过通用人工智能(AGI)创建互联直觉的世界

云知声AI技术体系及U+X战略

作为中国AGI技术产业化的先驱之一，云知声于2016年建立了Atlas人工智能基础设施，并据此开发了具有通用能力的专有大模型山海(UniGPT)，成为公司技术平台云知大脑(UniBrain)的新核心，与多模态感知与生成、知识图谱、物联平台等各类智能组件相结合,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑，推动“U(云知大脑)+X(应用场景)”战略落实，践行公司使命：“通过通用人工智能(AGI)创建互联直觉的世界”。

说话人识别技术，作为云知大脑(UniBrain)的重要组件，已在智能家居、车载、客服等领域广泛应用，包括身份识别、个性化服务、角色分离等。此次夺冠，进一步验证了云知声的AI技术实力，也将进一步通过云知大脑提供业界领先的说话人感知技术能力，以及更好的人机交互体验和分析决策能力，夯实云知声AGI技术底座，推动山海大模型在各领域的广泛应用，为千行百业的智慧化升级注入更强大的AI动力。

未来，云知声将继续坚定走在技术研发的前沿，不断推动其在AGI相关技术的研发突破，为各行各业带来新的增长范式与无限可能。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4633

浏览量
93474
AI

AI

+关注

关注
87

文章
31845

浏览量
270676
Agi

Agi

+关注

关注
0

文章
88

浏览量
10265
云知声

云知声

+关注

关注
0

文章
197

浏览量
8435

原文标题：AGI技术底座再夯实，云知声夺冠VoxSRC 2023

文章出处：【微信号：云知声，微信公众号：云知声】欢迎添加关注！文章转载请注明出处。

云知声兽牙AI与DeepSeek完成深度融合

近日，云知声兽牙AI智能体管理平台与DeepSeek完成深度融合，通过技术融合与生态共建，为企业提供更高效、灵活、低成本的智能服务解决方案，进一步

发表于 02-08 18:00 •465次阅读

云知声与英内物联签署战略合作协议探索基于云知声山海大模型的多元智慧场景

陈吉胜代表双方签约。双方代表签约英内物联董事长李仲卿在致辞中表示，期待双方以此次合作为起点，共同探索多元化的智慧应用场景，进一步深化技术与业务的融合，携手促进科技创新与升级。未来，无论是技术创新、业务拓

发表于 12-06 20:05 •954次阅读

通过展频进一步优化EMI

电子发烧友网站提供《通过展频进一步优化EMI.pdf》资料免费下载

发表于 09-04 09:32 •1次下载

西门子与微软进一步扩展战略合作关系

近日，西门子数字化工业软件与微软宣布进一步扩展双方的战略合作关系。通过微软Azure云服务，西门子正式推出Xcelerator as a Service工业软件解决方案，为客户提供更灵活、高效的服务体验。

发表于 05-21 10:47 •744次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

引入英伟达机密计算技术，在不影响性能的情况下，增强了大规模实时s生成式人工智能推理的安全性。该架构还具有新的解压缩引擎和用于人工智能预防性维护的可靠性引擎，有助于诊断并预测潜在的可靠性问题，进一步巩固

发表于 05-13 17:16

云知声携手耘途教育成立云知学院福建分院

近日，云知声与耘途教育携手，共同成立了云知学院福建分院，此举标志着双方在智慧教育领域展开了深度合作。根据合作协议，

发表于 05-13 10:38 •486次阅读

云知声携手耘途教育成立云知学院福建分院，探索智慧教育新思路

近日，云知声与耘途教育联合成立云知学院福建分院，深入探索智慧教育新模式、新思路。

发表于 05-11 15:52 •617次阅读

卓驭科技与高通合作宣布进一步推动汽车行业智能驾驶技术的发展

今日，深圳市卓驭科技有限公司（以下简称：卓驭科技）与高通技术公司宣布扩展双方的技术合作，利用基于Snapdragon Ride平台的全新智能驾驶产品，进一步推动汽车行业智能驾驶技术的发

发表于 04-25 16:25 •1993次阅读

Cognizant 将延续与 Pon IT 的合作，旨在进一步管理和优化云服务

得以继续为 Pon IT 旗下各家运营公司提供云平台托管服务。在下一阶段的合作中，Cognizant 将继续实施进一步的优化措施，旨在使 Pon IT 从

发表于 03-27 22:49 •354次阅读

携山海大模型云知声再赴港IPO

云知声智能科技股份有限公司（简称“云知声”）于3月15日更新了招股书，继续其在港交所主板上市的步

发表于 03-22 14:51 •784次阅读

云知声推进港交所主板上市进程

近日，云知声智能科技股份有限公司（以下简称“云知声”）再次更新招股书，继续其在港交所主板上市的征

发表于 03-22 14:45 •1144次阅读

云知声再闯港股IPO

近日，备受瞩目的云知声智能科技股份有限公司（以下简称云知声）再次更新了其招股书，继续稳步推进其在

发表于 03-22 14:42 •771次阅读

云知声推进港股IPO！AI解决方案收入排名中国第四，2023年营收破7亿

于2012年，当时国内的AI产业刚刚萌芽，它率先开启AGI技术商业化。在成立仅三个月后，云知声便发布了语音识别公有

发表于 03-22 00:12 •3769次阅读

云知声再闯港股IPO，深耕AI领域

近日，云知声智能科技股份有限公司（简称：云知声）正式向港交所递交了招股书，计划主板IPO上市。这

发表于 03-19 15:36 •907次阅读

材料价格进一步下降，盈利触底锂电材料企业如何应对？

在上游原料价格相对稳定、终端销量有所好转的情况下，一季度四大锂电主材价格却出现进一步下跌。

发表于 03-01 10:25 •1149次阅读