0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科大讯飞研究副院长魏思博士的讯飞超脑计划及研究成果

汽车玩家 来源:电子发烧友网 2018-04-20 16:44 次阅读

科大讯飞魏思博士

魏思,肥东一中99届高中毕业生,现为中国科学技术大学工学博士、科大讯飞研究院副院长、讯飞易听说首席科学家。2017年获选《麻省理工科技评论》全球青年科技创新人才,入选为“远见者”,代表了深度学习语音识别的创新精神。魏思知识渊博,才思敏捷,为人谦逊,表达力强且不失幽默,善于深入浅出地把深奥的理学知识讲解得浅显易懂。

讯飞超脑计划及研究成果

科大讯飞研究院副院长,带领团队研发语音识别新框架,和传统深度学习模型相比,增加了“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,可以使响应时间可以大大缩短。

近几年,中国讨论度最高的人工智能公司少不了科大讯飞。但大部分人是对讯飞的了解仅限于其语音技术,其实,科大讯飞还有一个更大的目标——打造“讯飞超脑”。

以“从能听会说到能理解会思考”为目标的讯飞超脑计划,要实现基于类人神经网络的认知智能引擎,预期成果是实现世界上第一个中文认知智能计算引擎。

魏思正是“讯飞超脑”计划的主要负责人之一。1999年,他进入中国科学技术大学电子工程与信息科学系学习,并于 2008年获得中国科学技术大学工学博士学位,同年起在科大讯飞研究院工作至今。如今,身为科大讯飞研究院副院长的魏思,同样是讯飞语音技术的核心人物。

基于讯飞超脑计划,科大讯飞正在开启一场以语音和语言为入口的“认知革命”。在过去6年中,讯飞的语音识别技术准确率从60.2%提升到95%以上。

准确率提升的背后,是魏思带领团队研发的一个语音识别“新武器”——一种名为“前馈型序列记忆网络 ”( FSMN )的新框架。据魏思介绍,和传统深度学习模型相比,前馈型序列记忆网络增加了一个“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,从而实现语音识别中的“端到端”建模。和其他多个技术点结合后,讯飞基于FSMN的语音识别框架获得了大幅度的性能提升。这个新模型可以使响应时间可以大大缩短,例如原来的一个星期可以缩短到一天,还可以提升训练效果。

FSMN保证了语音识别的准确性,但这还不够。一个大趋势是,几乎所有在做语音技术的人工智能公司都会追求更高的语音合成自然程度。在这一点上,魏思领导团队则实现了基于深度学习的全新的语音合成系统,进一步提升合成语音的自然度和表现力。在有麻省理工学院、卡内基梅隆大学等国际知名科研机构参加的国际最高水平的语音合成比赛 Blizzard Challenge(暴风雪竞赛)中,魏思团队开发的系统连续 11 年夺冠,7 项指标全部全球第一,并且是所有参赛队伍中唯一超过自然人发音水平的系统。

当然,对于正在采取“平台+赛道”扩张方式的讯飞而言,无论是哪一个赛道,都离不开技术的积累,魏思在多年科研工作中的成果也正迎来新的机会。

比如,他曾创造性地提出多种中英文语音评测评测算法,并带领团队获得国际领先成果。现在,他们已经可以将相关的评测技术应用到普通话测试及教学中,其中英文口语测试系统在国内外首次达到人工评测员水平。这项技术最主要的特点是实现了测试管理的信息化和测试手段的现代化。

而在说话人语种识别研究上,魏思则提出了基于深度神经网络的语种识别算法,大幅提升了语种识别的效果,成为目前业界所有语种识别系统的标准配置。

类似的案例还有很多,魏思的技术征途也不再仅限于语音:他带领团队提出基于CNN的离线手写识别策略,在世界上首次实现试卷扫描自动评分系统;在人工智能-认知智能方面,魏思带领团队获得国际著名的常识推理比赛Winograd Schema Challenge 2016的第一名成绩,该任务是国际常识推理领域的新型评测任务,被学术界普遍认为是替代图灵测试衡量机器智能水平的重要学术挑战……

如果说有什么在驱动魏思不断地创新,那肯定少不了他对现有技术的“不满足”。“虽然近几年深度神经网络的兴起使得语音识别性能获得了极大的提升,但是我们并不能迷信于现有的技术,总有一天新技术的提出会替代现有的技术”,魏思曾在一篇博文中这样写道。

回顾语音识别的发展历史和讯飞语音识别系统的最新进展,他也发现,技术的突破总是艰难而缓慢的,重要的是坚持和不断思考。他也坚信,“现在是一个伟大的时代”。

“那么,在这个伟大的时代,我们的征途是什么呢?我觉得有一句话非常能够表现我自己或者是讯飞研究院这么多年的思考,那就是:在中国,可以改变世界”。魏思认为,在这10年中,中国原创能力的蓬勃发展已经显现出来,与全世界同台竞技,“我们毫不怯场”。

展望下一个10年,魏思和他的团队同样有几个小目标:将讯飞研究院打造成一个世界知名的研究机构,培养出一批世界顶级的科学家,最后,能够解决几个基本的科学问题。

“在下一个10年或者20年,我们终将可以触及智能的本质,解开智慧之谜”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1721

    浏览量

    112533
  • 科大讯飞
    +关注

    关注

    19

    文章

    789

    浏览量

    61179
  • 讯飞超脑
    +关注

    关注

    0

    文章

    3

    浏览量

    3975
收藏 人收藏

    评论

    相关推荐

    科大拟在绵阳建设人工智能协同创新中心

    近日,科大与四川省绵阳市游仙区正式签署投资协议,计划在该市建设科大飞人工智能协同创新中心及
    的头像 发表于 11-11 14:53 246次阅读

    科大发布星火4.0 Turbo大模型及星火多语言大模型

    近日,科大正式推出了其最新研发成果——星火4.0 Turbo大模型。这一发布不仅标志着
    的头像 发表于 10-24 13:58 312次阅读

    科大发布星火4.0 Turbo:七大能力GPT-4 Turbo

    10月24日,在科大全球1024开发者节上,科大董事长刘庆峰正式发布了
    的头像 发表于 10-24 11:39 365次阅读

    科大发布星火拟人数字人

    了语义贯穿的“口唇-表情-动作”的拟人数字人生成。这一技术的突破,使得数字人在表达情感和动作时更加真实、自然,如同在和真人进行对话一般。 在科大的演示中,我们可以看到由大模型生成
    的头像 发表于 10-24 11:03 373次阅读

    科大将首发多模态视觉交互及拟人虚拟人交互

    近日,科大传来喜讯,第七届世界声博会暨2024科大全球1024开发者节将于10月24日至
    的头像 发表于 10-11 16:48 305次阅读

    科大AI总部园区正式启用

    近日,安徽省科技创新领域迎来又一重大里程碑,科大AI总部园区(小镇)正式宣告启用,标志着这一集前沿科技、创新研发与高端人才于一体的智
    的头像 发表于 09-03 16:06 539次阅读

    科大发布智能办公本Air 2

    近日,科大隆重举办了智能办公本新品发布会,正式推出了集前沿科技与高效办公于一体的智能办公本Air 2系列。此次发布,不仅彰显了
    的头像 发表于 08-08 10:43 603次阅读

    科大发布星火大模型V4.0

    在科技创新的浪潮中,科大再度引领潮流,于北京隆重发布了星火大模型V4.0及其在多领域的人工智能应用。此次更新不仅标志着
    的头像 发表于 07-01 10:33 835次阅读

    科大华中总部已封顶 年内交付使用

    科大华中总部已封顶 年内交付使用 科大华中总部位于武汉经开区车谷资本岛,投资额50亿;
    的头像 发表于 04-16 14:49 1456次阅读

    科大星火大模型V4.0预计六月发布,逼近GPT-4水平

    在博鳌2024年会上,科大副总裁、研究院长刘聪透露,公司正在积极训练对标GPT-4能力的
    的头像 发表于 03-28 13:59 782次阅读

    科大子公司医疗正式申请港交所上市

    科大旗下控股子公司医疗已于1月26日正式向港交所递交上市申请,计划在香港主板上市。这是
    的头像 发表于 02-04 13:57 1211次阅读

    科大发布“星火V3.5”:基于全国产算力训练的全民开放大模型

    科大,作为中国领先的智能语音和人工智能公司,近日宣布推出首个基于全国产算力训练的全民开放大模型“星火V3.5”。
    的头像 发表于 02-04 11:28 1457次阅读

    科大星火认知大模型V3.5发布

    近日,科大举办了星火认知大模型V3.5升级发布会。在发布会上,科大董事长刘庆峰和
    的头像 发表于 01-31 17:28 1362次阅读

    科大发布星火认知大模型V3.5

    科大近日发布了星火认知大模型V3.5版本,该版本基于全国产化算力底座“星一号”平台进行训练。与
    的头像 发表于 01-31 14:40 831次阅读

    科大发布星火语音大模型

    科大行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年01月31日 09:17:28