0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中文口语语言处理会议已经发展成为相关领域最重要的国际研讨会

思必驰 来源:djl 作者:思必驰 2019-08-06 11:44 次阅读

ISCSLP中文口语语言处理会议由国际著名学术协会ISCA的中文学术小组SIG-CSLP主办,为全球针对中文语言处理技术所举办的大型国际研讨会,1997年创办首届,每两年举行一次,并由新加坡、中国大陆、***及香港等四个国家和地区轮流举办,该会议已经发展成为中文语言处理技术相关领域最重要的国际研讨会。

第十届中文口语语言处理国际会议ISCSLP2016 在天津召开,会议聚集了来自全球各地学界和产业界的人士,并向全球征集业界前沿学术论文稿件,结合当前产业发展态势,共同探讨语言处理的未来发展趋势。

图1 思必驰首席科学家俞凯现场

10月18日下午,思必驰首席科学家/联合创始人、上海交通大学俞凯教授,在大会新技术产业论坛上,进行了题为《基础技术创新推动产业进步》的主题分享。俞凯教授表示,智能语音在经历着从感知智能到认知智能的飞跃,解决如何使智能语音进行理解、决策及表述的问题非常重要。俞凯教授强调技术型公司原始创新的重要性,着重介绍了思必驰基于深度学习语音识别技术,如,VDCNN算法在降噪处理上表现出不可取代的优势;帧同步解码转换为音素同步解码搜索空间减少80%以上等技术成果。依托稳健的研究实力,思必驰用实际行动践行着作为技术型公司应有的创新、原创精神。

思必驰专注为智能硬件提供自然语言交互方案,为智能车载、智能家居、智能机器人三个垂直领域定制基于交互场景的语音方案,应用场景各有不同,思必驰依托强大的研发实力满足用户在不同场景下的个性化需求。虽然目前国内智能语音领域,通用的开源工具应用较多,难度较低,但通用的开源工具在效率和权限上有极大局限性,既无法满足特定的前沿算法需求,也常常无法满足用户基于场景的个性化需求,不同专业领域的算法、数据、架构等都要依托实际应用进行搭建及优化。因此,思必驰专注技术研发,用技术实力说话,通过定制方案满足用户个性化需求。

如何确保技术的专业性与前沿性呢?思必驰成立之初即与上海交大成立联合实验室“Speech Lab”,由思必驰联合创始人,上海交通大学教授俞凯全权负责,专注智能语音技术的研发与应用,思必驰拥有独立知识产权,并积极促进前端科研成果的商业化转化与应用。正如俞凯教授在演讲中所提,近期,思必驰上海交大联合实验室的科研工作又取得了极大突破。

风暴抗噪:VDCNN算法

抗噪处理:VDCNN算法模型结构

噪声环境下的语音识别一直以来是一个难题。目前基于深度学习的主流语音识别技术及引擎,已经可以在很多信噪比相对比较好的环境下取得良好的准确率,但是在面对真实环境下的多类别强噪声情况环境(比如车载噪声、家居远场回声等),性能变会急剧下降,远远不能满足实际应用的需求。

思必驰和上海交大联合实验室,对基于噪声条件下的语音识别问题进行了深入的研究,历时一年多以来,提出了VDCNN算法模型结构。相比于传统语音模型仅使用1至2层卷积层,思必驰通过堆叠较小的卷积层和池化层,将语音模型中的卷积层的深度提高到了10层以上。利用小卷积核更加精细的局部刻画能力和频率不变性描述,能够更好地在语音模型的内部实现了声学自动降噪的能力。

思必驰上海交大联合实验室目前所提出的模型和架构,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率。相比于世界其他机构目前10%左右的最好结果,有一个大幅度的明显优势,在抗噪语音识别上是一个新的里程碑。此外,除了多类别的加性噪声,此模型也被验证在远场识别环境下也具有明显的优势。近5年,在Aurora4噪声数据库上,公开可查的世界上著名研究机构最好语音识别系统对比如下图所示:

思必驰上海交大联合实验室VDCNN算法模型结构,不但在噪声环境下具有非常好的准确率,还具有训练收敛速度快,模型参数规模小等优势,这些特点都为VDCNN的真实使用提供了便利。

新型解码框架

新型解码框架:Phone Synchronous Decoding

大词汇连续语音识别由于词汇量庞大且没有固定语法,会造成搜索空间非常庞大。目前,通过很多传统做法可以加快语音识别速度,如,离线基于WFST的搜索空间预优化,在线逐帧同步维特比解码,结合可变帧率分析等方法。但是,离线优化效果有限,逐帧搜索计算量大,而大量剪枝算法会引入搜索误差。因此目前主流的大词汇连续语音识别系统只能工作在云端。

近来,连接时序模型(CTC)取代传统隐马尔科夫模型(HMM),被应用到语音识别中,其特点显著,能够针对识别序列进行整体建模,带来更好的前后文建模能力,使语音识别的建模单元显著减少,并使庞大搜索空间相应减小。另一方面,模型本身建模了多帧对一个音素的映射关系,使得模型输出的声学信息集中。根据模型输出特点,适宜采用更长的搜索步长,由逐帧同步解码,转变为音素同步解码,从而减少了搜索计算量。

思必驰结合以上两点改进,使语音识别系统的速度累积提高20-30倍,内存下降50%以上,从而使得大词汇连续语音识别可以应用于离线手持设备;而基于该系统提出的置信度算法,得益于集中的声学信息和相应设计的优化算法,取得近一倍的提升。显著改善了语音识别系统的用户体验。

近年来,思必驰凭借稳健的研发实力,在智能车载、智能家居、智能机器人等领域的语音市场展开了布局,与阿里、小米、联想、海尔、美的、庆科、浙江大华等企业建立了战略合作关系,为广大用户带来流畅的语音交互体验。思必驰将始终秉承创新精神,保持技术专注性与独立性,打造更人性化的语音交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能机器人
    +关注

    关注

    17

    文章

    868

    浏览量

    82295
  • 智能语音
    +关注

    关注

    10

    文章

    783

    浏览量

    48772
  • 思必驰
    +关注

    关注

    4

    文章

    284

    浏览量

    14286
收藏 人收藏

    评论

    相关推荐

    2025电子设计与制造技术研讨会

    本帖最后由 jf_32813774 于 2024-12-26 16:14 编辑 电子工程师不可错过的技术研讨会,终于火热启动了! 为了让广大电子行业从业者共聚一堂,探索前沿科技,共话创新未来
    发表于 12-18 10:23

    Imagination 系列研讨会 |中国生成式 AI 的发展

    近期,Imagination将陆续推出全新系列研讨会,涵盖边缘AI如何推动工业物联网的发展,生成式AI,智能汽车未来发展趋势等等多个热门话题。本期研讨会中,Imagination中国区
    的头像 发表于 12-09 16:57 290次阅读
    Imagination 系列<b class='flag-5'>研讨会</b> |中国生成式 AI 的<b class='flag-5'>发展</b>

    【网络研讨会】掌握FLIR IIS工业相机的色彩处理:从感知到精准

    ,51camera的合作伙伴FLIR特别举办了一场有关“掌握FLIRIIS相机的色彩处理:从感知到精准”网络研讨会会议主题掌握FLIRIIS工业相机的色彩处理:从感知到精准
    的头像 发表于 11-25 15:09 125次阅读
    【网络<b class='flag-5'>研讨会</b>】掌握FLIR IIS工业相机的色彩<b class='flag-5'>处理</b>:从感知到精准

    维智科技亮相首届时空智能国际学术研讨会

    近期,第一届时空智能国际学术研讨会暨李德仁院士学术思想研讨会在武汉召开。大会聚焦未知空间自主测绘、实时遥感与智能解译、时空计算与智能服务,汇聚国内外相关
    的头像 发表于 11-25 13:55 202次阅读

    飞腾成功举办散热技术应用发展研讨会

    近日,飞腾公司在深圳成功举办了 “散热技术应用发展研讨会”,并与合作伙伴共同成立业内首个“散热技术应用发展联合中心”。此次研讨会汇聚了众多业界专家,共同探讨散热技术的最新应用、
    的头像 发表于 11-21 16:04 241次阅读

    北斗星通受邀出席莫干山地信研讨会

    莫干山地信研讨会在浙江德清国际会议中心举办。本次研讨会以“测绘地理信息赋能新质生产力”为主题,旨在推动测绘地理信息科技进步和转型升级,服务经济社会高质量发展。来自
    的头像 发表于 09-30 14:27 395次阅读

    线上研讨会 英飞凌处理器在储能电源的应用

    从德国的“工业4.0”到美国的“工业互联网”,再到我国的“中国制造2025”,工业和智能制造已经成为各国竞相发展重要领域。而在这一过程中,微控制器(MCU)作为工业产品的“大脑”,发挥着至关
    的头像 发表于 09-20 08:08 376次阅读
    线上<b class='flag-5'>研讨会</b> 英飞凌<b class='flag-5'>处理</b>器在储能电源的应用

    CET中电技术邀您参加2024第九届中国新型煤化工国际研讨会

    6月27-28日,由煤化客主办的2024第九届中国新型煤化工国际研讨会将在新疆·乌鲁木齐举行。研讨会以当下煤化工产业发展中的热点和难点问题展开,CET中电技术参展此次
    的头像 发表于 06-22 08:35 359次阅读
    CET中电技术邀您参加2024第九届中国新型煤化工<b class='flag-5'>国际</b><b class='flag-5'>研讨会</b>

    会议回顾 | Aigtek第四届全国超声加工技术研讨会高光时刻!

    参加了会议,该会议现已成为超声加工领域具有广泛影响力的国际学术交流平台。 本次会议以智能、融合、
    的头像 发表于 04-24 11:43 372次阅读
    <b class='flag-5'>会议</b>回顾 | Aigtek第四届全国超声加工技术<b class='flag-5'>研讨会</b>高光时刻!

    会议回顾 | Aigtek第四届全国超声加工技术研讨会高光时刻!

    会议,该会议现已成为超声加工领域具有广泛影响力的国际学术交流平台。本次会议以智能、融合、绿色、
    的头像 发表于 04-22 16:06 399次阅读
    <b class='flag-5'>会议</b>回顾 | Aigtek第四届全国超声加工技术<b class='flag-5'>研讨会</b>高光时刻!

    上海贝岭亮相2024国际集成电路展览研讨会(IIC Shanghai)

    3月28日-29日,2024国际集成电路展览研讨会(IIC 2024),在上海张江科学会堂圆满召开。
    的头像 发表于 04-07 09:46 757次阅读
    上海贝岭亮相2024<b class='flag-5'>国际</b>集成电路展览<b class='flag-5'>会</b>暨<b class='flag-5'>研讨会</b>(IIC Shanghai)

    2024 ETAP 电气系统数字孪生平台技术研讨会(深圳站)

    胜”的新思想新战略。我们致力服务大湾区建设发展,在深圳结成了众多合作伙伴,今次亦邀请他们共同分享成功经验。我们与施耐德电气共同举办本次研讨会,与各行业专家共同探讨电力系统数字孪生技术在相关行业
    发表于 03-30 13:06

    凌鸥创芯亮相2024国际集成电路展览研讨会

    2024年3月28-29日,由全球电子技术领域知名媒体集团AspenCore主办的2024国际集成电路展览研讨会在上海张江科学会堂顺利举办
    的头像 发表于 03-29 18:16 1229次阅读
    凌鸥创芯亮相2024<b class='flag-5'>国际</b>集成电路展览<b class='flag-5'>会</b>暨<b class='flag-5'>研讨会</b>

    芯原将出席2024国际集成电路展览研讨会

    3月28至29日,由电子工程领域全球领先的技术媒体机构AspenCore主办的2024国际集成电路展览研讨会 ( IIC Shanghai ) 将在上海张江科学会堂举办。
    的头像 发表于 03-27 09:28 510次阅读

    是德科技智能算力‘芯’技术研讨会回顾

    2023年12月20日,是德科技成功举办了智能算力‘芯’技术研讨会。此次研讨会由是德科技的行业市场经理周巍策划并主持,研讨会聚焦算力网络,算力芯片,通用接口等技术的发展趋势和测试挑战,
    的头像 发表于 01-17 09:34 732次阅读