0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声进一步夯实AGI技术底座

云知声 来源:云知声 2023-08-31 16:07 次阅读

Unisound News

2023年8月20号,最后一届VoxSRC Workshop 在都柏林召开。VoxSRC 2023 国际说话人识别竞赛公布比赛榜单,云知声团队夺得Track1(固定训练集说话人确认)第一名、Track2(开放训练集说话人确认)第二名的优异成绩。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大学)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等组织联合发起的国际说话人识别竞赛,是在说话人识别领域最具影响力和权威性的国际赛事之一。

VoxSRC 2023测试集数据来自访谈、新闻、谈话、辩论等多个场景,包括专业编辑音频和随意的谈话音频,同时混杂着笑声、其他说话人噪声等复杂的背景噪音,涉及跨年龄、跨语种说话人识别,同时今年的测试数据继续加大难度,专注于短语音说话人识别,音频时长大部分在2-3s区间,是VoxSRC有史以来最难的一届。

在此次竞赛中,云知声采用并进一步优化了当前最领先的算法。这些算法包括基于ResNet系列主干网络,MQMHA pooling,以及融合了Sub-center和inter-topK的Large-margin损失函数。此外,云知声还实施了多阶段训练调优策略等技术。

除此之外,基于对比赛任务的深刻理解,云知声团队首次提出了Consistency Measure Factor(CMF) 算法,即建模音频“说话人特征的一致性”,并将其引入说话人相似度决策中,大幅提升了说话人识别的准确率。同时,依托云知声大规模算力中心,采用大规模模型训练框架,训练出ResNet314、ResNet518说话人模型。凭借对“说话人算法”的创新性研发和超强力的“算力”支持,云知声团队在Track1(固定训练集说话人识别)赛道以minDCF(最小检测代价函数)0.085、EER(等错误率)1.588%的卓越表现,一举夺得本次大赛冠军。

Track 1 (Verification fullysupervised, closed)

c1ed45ec-419c-11ee-a2ef-92fbcf53809c.png

Track 2 (Verification fullysupervised, open)

c2025630-419c-11ee-a2ef-92fbcf53809c.png

Track1 & Track2 榜单

值得注意的是,云知声团队将Track1(官方固定训练数据)赛道的结果,直接提交到Track2(可用任何规模数据)赛道,却依然取得了第二名的优异成绩,这充分证明了其算法的出众性和领先性。

云知声:通过通用人工智能(AGI)创建互联直觉的世界

c20bd534-419c-11ee-a2ef-92fbcf53809c.png

云知声AI技术体系及U+X战略

作为中国AGI技术产业化的先驱之一,云知声于2016年建立了Atlas人工智能基础设施,并据此开发了具有通用能力的专有大模型山海(UniGPT),成为公司技术平台云知大脑(UniBrain)的新核心,与多模态感知与生成、知识图谱、物联平台等各类智能组件相结合,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,推动“U(云知大脑)+X(应用场景)”战略落实,践行公司使命:“通过通用人工智能(AGI)创建互联直觉的世界”。

说话人识别技术,作为云知大脑(UniBrain)的重要组件,已在智能家居、车载、客服等领域广泛应用,包括身份识别、个性化服务、角色分离等。此次夺冠,进一步验证了云知声的AI技术实力,也将进一步通过云知大脑提供业界领先的说话人感知技术能力,以及更好的人机交互体验和分析决策能力,夯实云知声AGI技术底座,推动山海大模型在各领域的广泛应用,为千行百业的智慧化升级注入更强大的AI动力。

未来,云知声将继续坚定走在技术研发的前沿,不断推动其在AGI相关技术的研发突破,为各行各业带来新的增长范式与无限可能。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4608

    浏览量

    92845
  • AI
    AI
    +关注

    关注

    87

    文章

    30763

    浏览量

    268914
  • Agi
    Agi
    +关注

    关注

    0

    文章

    80

    浏览量

    10205
  • 云知声
    +关注

    关注

    0

    文章

    179

    浏览量

    8388

原文标题:AGI技术底座再夯实,云知声夺冠VoxSRC 2023

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    与英内物联签署战略合作协议 探索基于山海大模型的多元智慧场景

    陈吉胜代表双方签约。     双方代表签约   英内物联董事长李仲卿在致辞中表示,期待双方以此次合作为起点,共同探索多元化的智慧应用场景,进一步深化技术与业务的融合,携手促进科技创新与升级。未来,无论是技术创新、业务拓
    的头像 发表于 12-06 20:05 838次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>与英内物联签署战略合作协议 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>山海大模型的多元智慧场景

    通过展频进一步优化EMI

    电子发烧友网站提供《通过展频进一步优化EMI.pdf》资料免费下载
    发表于 09-04 09:32 1次下载
    通过展频<b class='flag-5'>进一步</b>优化EMI

    西门子与微软进一步扩展战略合作关系

    近日,西门子数字化工业软件与微软宣布进一步扩展双方的战略合作关系。通过微软Azure服务,西门子正式推出Xcelerator as a Service工业软件解决方案,为客户提供更灵活、高效的服务体验。
    的头像 发表于 05-21 10:47 677次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    引入英伟达机密计算技术,在不影响性能的情况下,增强了大规模实时s生成式人工智能推理的安全性。该架构还具有新的解压缩引擎和用于人工智能预防性维护的可靠性引擎,有助于诊断并预测潜在的可靠性问题,进一步巩固
    发表于 05-13 17:16

    携手耘途教育成立学院福建分院

    近日,与耘途教育携手,共同成立了学院福建分院,此举标志着双方在智慧教育领域展开了深度合作。根据合作协议,
    的头像 发表于 05-13 10:38 410次阅读

    卓驭科技与高通合作宣布进一步推动汽车行业智能驾驶技术的发展

    今日,深圳市卓驭科技有限公司(以下简称:卓驭科技)与高通技术公司宣布扩展双方的技术合作,利用基于Snapdragon Ride平台的全新智能驾驶产品,进一步推动汽车行业智能驾驶技术的发
    的头像 发表于 04-25 16:25 1670次阅读
    卓驭科技与高通合作宣布<b class='flag-5'>进一步</b>推动汽车行业智能驾驶<b class='flag-5'>技术</b>的发展

    Cognizant 将延续与 Pon IT 的合作,旨在进一步管理和优化服务

    得以继续为 Pon IT 旗下各家运营公司提供平台托管服务。在下阶段的合作中,Cognizant 将继续实施进一步的优化措施,旨在使 Pon IT 从
    的头像 发表于 03-27 22:49 312次阅读

    携山海大模型再赴港IPO

    智能科技股份有限公司(简称“”)于3月15日更新了招股书,继续其在港交所主板上市的步
    的头像 发表于 03-22 14:51 711次阅读

    推进港交所主板上市进程

    近日,智能科技股份有限公司(以下简称“”)再次更新招股书,继续其在港交所主板上市的征
    的头像 发表于 03-22 14:45 1021次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 699次阅读

    推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    于2012年,当时国内的AI产业刚刚萌芽,它率先开启AGI技术商业化。在成立仅三个月后,便发布了语音识别公有
    的头像 发表于 03-22 00:12 3524次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    再闯港股IPO,深耕AI领域

    近日,智能科技股份有限公司(简称:)正式向港交所递交了招股书,计划主板IPO上市。这
    的头像 发表于 03-19 15:36 817次阅读

    材料价格进一步下降,盈利触底 锂电材料企业如何应对?

    在上游原料价格相对稳定、终端销量有所好转的情况下,季度四大锂电主材价格却出现进一步下跌。
    的头像 发表于 03-01 10:25 1043次阅读

    MediaTek宣布将进一步深化与海信的长期合作关系

    MediaTek 宣布将进一步深化与海信的长期合作关系。海信率先采用了 MediaTek Pentonic 智能电视芯片,显著提升了流媒体内容的画质表现。自 2024 年起,MediaTek AI 超级分辨率技术(AI-SR)将应用于海信全系列智能电视产品。
    的头像 发表于 01-12 09:37 801次阅读

    有什么方法可以进一步提高AD7714的分辨率啊?

    级放大再加给AD7714时,测得人分辨率还要低些。由于是用干电池得到AD7714的输入信号,该信号相对来说很稳定,而且板上的噪声也不是太大。请问各位大虾,还有什么方法可以进一步提高AD7714的分辨率啊?不胜感激!
    发表于 12-25 06:33