0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声进一步夯实AGI技术底座

云知声 来源:云知声 2023-08-31 16:07 次阅读

Unisound News

2023年8月20号,最后一届VoxSRC Workshop 在都柏林召开。VoxSRC 2023 国际说话人识别竞赛公布比赛榜单,云知声团队夺得Track1(固定训练集说话人确认)第一名、Track2(开放训练集说话人确认)第二名的优异成绩。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大学)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等组织联合发起的国际说话人识别竞赛,是在说话人识别领域最具影响力和权威性的国际赛事之一。

VoxSRC 2023测试集数据来自访谈、新闻、谈话、辩论等多个场景,包括专业编辑音频和随意的谈话音频,同时混杂着笑声、其他说话人噪声等复杂的背景噪音,涉及跨年龄、跨语种说话人识别,同时今年的测试数据继续加大难度,专注于短语音说话人识别,音频时长大部分在2-3s区间,是VoxSRC有史以来最难的一届。

在此次竞赛中,云知声采用并进一步优化了当前最领先的算法。这些算法包括基于ResNet系列主干网络,MQMHA pooling,以及融合了Sub-center和inter-topK的Large-margin损失函数。此外,云知声还实施了多阶段训练调优策略等技术。

除此之外,基于对比赛任务的深刻理解,云知声团队首次提出了Consistency Measure Factor(CMF) 算法,即建模音频“说话人特征的一致性”,并将其引入说话人相似度决策中,大幅提升了说话人识别的准确率。同时,依托云知声大规模算力中心,采用大规模模型训练框架,训练出ResNet314、ResNet518说话人模型。凭借对“说话人算法”的创新性研发和超强力的“算力”支持,云知声团队在Track1(固定训练集说话人识别)赛道以minDCF(最小检测代价函数)0.085、EER(等错误率)1.588%的卓越表现,一举夺得本次大赛冠军。

Track 1 (Verification fullysupervised, closed)

c1ed45ec-419c-11ee-a2ef-92fbcf53809c.png

Track 2 (Verification fullysupervised, open)

c2025630-419c-11ee-a2ef-92fbcf53809c.png

Track1 & Track2 榜单

值得注意的是,云知声团队将Track1(官方固定训练数据)赛道的结果,直接提交到Track2(可用任何规模数据)赛道,却依然取得了第二名的优异成绩,这充分证明了其算法的出众性和领先性。

云知声:通过通用人工智能(AGI)创建互联直觉的世界

c20bd534-419c-11ee-a2ef-92fbcf53809c.png

云知声AI技术体系及U+X战略

作为中国AGI技术产业化的先驱之一,云知声于2016年建立了Atlas人工智能基础设施,并据此开发了具有通用能力的专有大模型山海(UniGPT),成为公司技术平台云知大脑(UniBrain)的新核心,与多模态感知与生成、知识图谱、物联平台等各类智能组件相结合,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,推动“U(云知大脑)+X(应用场景)”战略落实,践行公司使命:“通过通用人工智能(AGI)创建互联直觉的世界”。

说话人识别技术,作为云知大脑(UniBrain)的重要组件,已在智能家居、车载、客服等领域广泛应用,包括身份识别、个性化服务、角色分离等。此次夺冠,进一步验证了云知声的AI技术实力,也将进一步通过云知大脑提供业界领先的说话人感知技术能力,以及更好的人机交互体验和分析决策能力,夯实云知声AGI技术底座,推动山海大模型在各领域的广泛应用,为千行百业的智慧化升级注入更强大的AI动力。

未来,云知声将继续坚定走在技术研发的前沿,不断推动其在AGI相关技术的研发突破,为各行各业带来新的增长范式与无限可能。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4484

    浏览量

    91335
  • AI
    AI
    +关注

    关注

    87

    文章

    27561

    浏览量

    265185
  • Agi
    Agi
    +关注

    关注

    0

    文章

    67

    浏览量

    10143
  • 云知声
    +关注

    关注

    0

    文章

    130

    浏览量

    8299

原文标题:AGI技术底座再夯实,云知声夺冠VoxSRC 2023

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    西门子与微软进一步扩展战略合作关系

    近日,西门子数字化工业软件与微软宣布进一步扩展双方的战略合作关系。通过微软Azure服务,西门子正式推出Xcelerator as a Service工业软件解决方案,为客户提供更灵活、高效的服务体验。
    的头像 发表于 05-21 10:47 372次阅读

    携手耘途教育成立学院福建分院

    近日,与耘途教育携手,共同成立了学院福建分院,此举标志着双方在智慧教育领域展开了深度合作。根据合作协议,
    的头像 发表于 05-13 10:38 180次阅读

    推进港交所主板上市进程

    近日,智能科技股份有限公司(以下简称“”)再次更新招股书,继续其在港交所主板上市的征
    的头像 发表于 03-22 14:45 539次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 383次阅读

    推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    于2012年,当时国内的AI产业刚刚萌芽,它率先开启AGI技术商业化。在成立仅三个月后,便发布了语音识别公有
    的头像 发表于 03-22 00:12 2754次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    再闯港股IPO,深耕AI领域

    近日,智能科技股份有限公司(简称:)正式向港交所递交了招股书,计划主板IPO上市。这
    的头像 发表于 03-19 15:36 530次阅读

    材料价格进一步下降,盈利触底 锂电材料企业如何应对?

    在上游原料价格相对稳定、终端销量有所好转的情况下,季度四大锂电主材价格却出现进一步下跌。
    的头像 发表于 03-01 10:25 547次阅读

    有什么方法可以进一步提高AD7714的分辨率啊?

    级放大再加给AD7714时,测得人分辨率还要低些。由于是用干电池得到AD7714的输入信号,该信号相对来说很稳定,而且板上的噪声也不是太大。请问各位大虾,还有什么方法可以进一步提高AD7714的分辨率啊?不胜感激!
    发表于 12-25 06:33

    借助人工智能,存储器比重将进一步增加

    SK海力士预测在人工智能(AI)领域,存储器解决方案的比重将进一步增加,可以通过类似AiMX的解决方案部分替代图形处理单元(GPU)。
    发表于 12-04 09:52 248次阅读
    借助人工智能,存储器比重将<b class='flag-5'>进一步</b>增加

    ad9106如何将波形频率设置为进一步降低到10Hz?

    你好,我有个小问题。我使用100m时钟芯片。每个时钟只有10ns,ad9106寄存器的最小输出波形只有100Hz。如何将波形频率设置为进一步降低到10Hz?我已将配置设置为相关寄存器的最大值。拍
    发表于 12-01 06:12

    智慧交通方案开启2.0版本

    核心问题,探索智能交通前沿科技,分享创新理念与实践。 作为智慧交通赛道的“老玩家”,受邀出席大会,通过主题论坛与展会活动,充分展示其在城市交通管理、智慧交通出行等多个领域的全方位解决方案,
    的头像 发表于 11-21 09:40 812次阅读

    请问如何进一步减小DTC控制系统的转矩脉动?

    如何进一步减小DTC控制系统的转矩脉动?
    发表于 10-18 06:53

    STM8在待机模式如何进一步降低功耗?

    有什么方法可以进一步降低待机模式的功耗
    发表于 10-12 07:23

    复合集流体产业化进程进一步提速

    复合集流体产业化进程进一步提速。
    的头像 发表于 09-21 09:52 987次阅读
    复合集流体产业化进程<b class='flag-5'>进一步</b>提速

    AGI技术实力在2023年再次获得国际顶会认可

    ACM MM 2023后,AGI技术实力在2023年再次获得国际顶会认可。         INTERSPEECH在国际上享有极高盛誉
    的头像 发表于 09-07 10:27 631次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>AGI</b><b class='flag-5'>技术</b>实力在2023年再次获得国际顶会认可