0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声进一步夯实AGI技术底座

云知声 来源:云知声 2023-08-31 16:07 次阅读

Unisound News

2023年8月20号,最后一届VoxSRC Workshop 在都柏林召开。VoxSRC 2023 国际说话人识别竞赛公布比赛榜单,云知声团队夺得Track1(固定训练集说话人确认)第一名、Track2(开放训练集说话人确认)第二名的优异成绩。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大学)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等组织联合发起的国际说话人识别竞赛,是在说话人识别领域最具影响力和权威性的国际赛事之一。

VoxSRC 2023测试集数据来自访谈、新闻、谈话、辩论等多个场景,包括专业编辑音频和随意的谈话音频,同时混杂着笑声、其他说话人噪声等复杂的背景噪音,涉及跨年龄、跨语种说话人识别,同时今年的测试数据继续加大难度,专注于短语音说话人识别,音频时长大部分在2-3s区间,是VoxSRC有史以来最难的一届。

在此次竞赛中,云知声采用并进一步优化了当前最领先的算法。这些算法包括基于ResNet系列主干网络,MQMHA pooling,以及融合了Sub-center和inter-topK的Large-margin损失函数。此外,云知声还实施了多阶段训练调优策略等技术。

除此之外,基于对比赛任务的深刻理解,云知声团队首次提出了Consistency Measure Factor(CMF) 算法,即建模音频“说话人特征的一致性”,并将其引入说话人相似度决策中,大幅提升了说话人识别的准确率。同时,依托云知声大规模算力中心,采用大规模模型训练框架,训练出ResNet314、ResNet518说话人模型。凭借对“说话人算法”的创新性研发和超强力的“算力”支持,云知声团队在Track1(固定训练集说话人识别)赛道以minDCF(最小检测代价函数)0.085、EER(等错误率)1.588%的卓越表现,一举夺得本次大赛冠军。

Track 1 (Verification fullysupervised, closed)

c1ed45ec-419c-11ee-a2ef-92fbcf53809c.png

Track 2 (Verification fullysupervised, open)

c2025630-419c-11ee-a2ef-92fbcf53809c.png

Track1 & Track2 榜单

值得注意的是,云知声团队将Track1(官方固定训练数据)赛道的结果,直接提交到Track2(可用任何规模数据)赛道,却依然取得了第二名的优异成绩,这充分证明了其算法的出众性和领先性。

云知声:通过通用人工智能(AGI)创建互联直觉的世界

c20bd534-419c-11ee-a2ef-92fbcf53809c.png

云知声AI技术体系及U+X战略

作为中国AGI技术产业化的先驱之一,云知声于2016年建立了Atlas人工智能基础设施,并据此开发了具有通用能力的专有大模型山海(UniGPT),成为公司技术平台云知大脑(UniBrain)的新核心,与多模态感知与生成、知识图谱、物联平台等各类智能组件相结合,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,推动“U(云知大脑)+X(应用场景)”战略落实,践行公司使命:“通过通用人工智能(AGI)创建互联直觉的世界”。

说话人识别技术,作为云知大脑(UniBrain)的重要组件,已在智能家居、车载、客服等领域广泛应用,包括身份识别、个性化服务、角色分离等。此次夺冠,进一步验证了云知声的AI技术实力,也将进一步通过云知大脑提供业界领先的说话人感知技术能力,以及更好的人机交互体验和分析决策能力,夯实云知声AGI技术底座,推动山海大模型在各领域的广泛应用,为千行百业的智慧化升级注入更强大的AI动力。

未来,云知声将继续坚定走在技术研发的前沿,不断推动其在AGI相关技术的研发突破,为各行各业带来新的增长范式与无限可能。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4585

    浏览量

    92442
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267904
  • Agi
    Agi
    +关注

    关注

    0

    文章

    76

    浏览量

    10180
  • 云知声
    +关注

    关注

    0

    文章

    160

    浏览量

    8345

原文标题:AGI技术底座再夯实,云知声夺冠VoxSRC 2023

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    通过展频进一步优化EMI

    电子发烧友网站提供《通过展频进一步优化EMI.pdf》资料免费下载
    发表于 09-04 09:32 1次下载
    通过展频<b class='flag-5'>进一步</b>优化EMI

    西门子与微软进一步扩展战略合作关系

    近日,西门子数字化工业软件与微软宣布进一步扩展双方的战略合作关系。通过微软Azure服务,西门子正式推出Xcelerator as a Service工业软件解决方案,为客户提供更灵活、高效的服务体验。
    的头像 发表于 05-21 10:47 616次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    引入英伟达机密计算技术,在不影响性能的情况下,增强了大规模实时s生成式人工智能推理的安全性。该架构还具有新的解压缩引擎和用于人工智能预防性维护的可靠性引擎,有助于诊断并预测潜在的可靠性问题,进一步巩固
    发表于 05-13 17:16

    携手耘途教育成立学院福建分院

    近日,与耘途教育携手,共同成立了学院福建分院,此举标志着双方在智慧教育领域展开了深度合作。根据合作协议,
    的头像 发表于 05-13 10:38 354次阅读

    卓驭科技与高通合作宣布进一步推动汽车行业智能驾驶技术的发展

    今日,深圳市卓驭科技有限公司(以下简称:卓驭科技)与高通技术公司宣布扩展双方的技术合作,利用基于Snapdragon Ride平台的全新智能驾驶产品,进一步推动汽车行业智能驾驶技术的发
    的头像 发表于 04-25 16:25 1574次阅读
    卓驭科技与高通合作宣布<b class='flag-5'>进一步</b>推动汽车行业智能驾驶<b class='flag-5'>技术</b>的发展

    推进港交所主板上市进程

    近日,智能科技股份有限公司(以下简称“”)再次更新招股书,继续其在港交所主板上市的征
    的头像 发表于 03-22 14:45 900次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 628次阅读

    推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    于2012年,当时国内的AI产业刚刚萌芽,它率先开启AGI技术商业化。在成立仅三个月后,便发布了语音识别公有
    的头像 发表于 03-22 00:12 3344次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    再闯港股IPO,深耕AI领域

    近日,智能科技股份有限公司(简称:)正式向港交所递交了招股书,计划主板IPO上市。这
    的头像 发表于 03-19 15:36 744次阅读

    材料价格进一步下降,盈利触底 锂电材料企业如何应对?

    在上游原料价格相对稳定、终端销量有所好转的情况下,季度四大锂电主材价格却出现进一步下跌。
    的头像 发表于 03-01 10:25 888次阅读

    MediaTek宣布将进一步深化与海信的长期合作关系

    MediaTek 宣布将进一步深化与海信的长期合作关系。海信率先采用了 MediaTek Pentonic 智能电视芯片,显著提升了流媒体内容的画质表现。自 2024 年起,MediaTek AI 超级分辨率技术(AI-SR)将应用于海信全系列智能电视产品。
    的头像 发表于 01-12 09:37 740次阅读

    有什么方法可以进一步提高AD7714的分辨率啊?

    级放大再加给AD7714时,测得人分辨率还要低些。由于是用干电池得到AD7714的输入信号,该信号相对来说很稳定,而且板上的噪声也不是太大。请问各位大虾,还有什么方法可以进一步提高AD7714的分辨率啊?不胜感激!
    发表于 12-25 06:33

    借助人工智能,存储器比重将进一步增加

    SK海力士预测在人工智能(AI)领域,存储器解决方案的比重将进一步增加,可以通过类似AiMX的解决方案部分替代图形处理单元(GPU)。
    发表于 12-04 09:52 386次阅读
    借助人工智能,存储器比重将<b class='flag-5'>进一步</b>增加

    ad9106如何将波形频率设置为进一步降低到10Hz?

    你好,我有个小问题。我使用100m时钟芯片。每个时钟只有10ns,ad9106寄存器的最小输出波形只有100Hz。如何将波形频率设置为进一步降低到10Hz?我已将配置设置为相关寄存器的最大值。拍
    发表于 12-01 06:12

    智慧交通方案开启2.0版本

    核心问题,探索智能交通前沿科技,分享创新理念与实践。 作为智慧交通赛道的“老玩家”,受邀出席大会,通过主题论坛与展会活动,充分展示其在城市交通管理、智慧交通出行等多个领域的全方位解决方案,
    的头像 发表于 11-21 09:40 925次阅读