0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

脑机接口技术 不说话也能表达言语

Gv1N_smartman16 来源:fqj 2019-06-06 14:07 次阅读

以脑机接口的方式,捕捉大脑电波,然后实现打字的目的,再进行语音合成输出,并不是一个很难的课题。

去年世界机器人大会上,清华大学研发的“动态窗稳态视觉诱发电位脑机接口系统”就“主导”了一场通过脑机接口来打字的比赛。参赛者们只要在头上戴上相关设备,将注意力集中到电脑屏幕上的虚拟键盘中的字母上,脑电波就会被捕捉,然后将对应的字母显示出来。

字母打得多了,字也就打出来了。

这种方式和对霍金的一小块儿肌肉进行捕捉原理上基本上没有差别,都是通过捕捉人对字母的强烈反应而实现语言的输出。不同之处在于,霍金由世界顶尖科技团队开发,可以采用单词联想的方式提高打字的效率。

这种方法听起来确实很高端,但也存在一定的不足。

第一,打字的速度较慢。英语还好一点,只要字母拼全就完成了打字的过程;而汉语还需要进行转化,遇到同音词还需要进一步进行选择,这就需要进行二次脑电波捕捉。逐字的打字方法令其在单位时间内能够打出的文字相当有限。

第二,对参与者的精神集中有要求,而且抗干扰较弱。脑电波是非常敏感而且活跃的。一方面人如果注意力无法高度集中,系统就将很难对字母进行定位;另一方面人的大脑在看到字母的时候往往会不由自主地产生联想,比如看到“c”会想到“copy”或者“car”等词,这也会对系统识别产生干扰。

正常人想要顺利打个字都极度耗费体力,就更不要说那些身患阿尔兹海默症或者其他病症导致无法言语的病人了。霍金之前没有采用类似的方案,就是考虑到无法承受如此的体力消耗。

当然,个人认为这种方案虽然目前仅仅还停留在科技“趣闻”或者“猎奇”的阶段,但其本身是一种突破性的。它的意义并不在于有多好用或是取得了多少实际的效果,而是在于探索出了一条脑机接口的新的道路。至少让人们看到,通过脑机接口来实现“意念”输处文本甚至是语音输出是完全可行的。

而这种可行性,被加州大学旧金山分校的一项研究成果,进一步证实并且加强。

把脑电波合成为语音,总共分几步?

加州大学旧金山分校的神经科学家的解决方案,是从解剖学的角度出发,模拟真人发音时大脑发出的口腔喉咙肌电信号对发音系统的调动,比如在发“啊”这个音的时候,嘴唇、下巴、舌头和喉咙以及其他成分的动作,然后合成相应的语音。

那么,要把脑电信号合成为语音,总共分几步呢?

第一步,样本收集。研究者让5名完全健康的志愿者在UCSF Epileps接受了一项外科手术,在其大脑中临时植入了一块电极。接下来,志愿者被要求大声朗读指定的数百句话。在朗读的过程中,科学家记录了不同语言文字在朗读过程中在大脑区域内的活动信号

第二步,破译信号。通过循环神经网络(RNN)的不断学习,研究者将大脑神经信号转换成了发音器官动作的信号,这些信号与发音器官的动作直接相关,比如嘴唇、下巴、舌头、喉咙等。

第三步,虚拟声道。虚拟不同声音所产生的声道运动,就像汉语中双唇音、唇齿音、舌尖中音等所需要调动的不同发音部位一样,正常来说,如果模拟的发音运动模式和人正常说话时一样,那么所发的音也一定是一样的。

最后一步,就可以进行语音输出了。

为了测试虚拟语音的流畅性,研究者们在亚马逊的任务众包平台Mechanical Turk上招募听众来对这些合成语音的325个单词和101个句子进行辨认,结果大部分的单词和句子都被人们成功识别。

这意味着,不用动嘴,通过脑电波来实现语音输出,完全是有可能的。这对于中风、脑损伤或其他疾病而导致的语言功能障碍的辅助,将具有里程碑式的意义。

技术落地尚远,“脑机”仍需努力

相较于“字母表模式”,这项研究的优势是显而易见的。

首先,语音合成速度会得到大大提高。字母表模式下,比如通过眼动或者肌肉块儿的捕捉,每分钟能成功输出10个单词左右。对于正常交流而言,一分钟说10个字,一方面的确很不便,另一方面确实很考验人的耐心。而通过声道模拟语音,每分钟输出的单词可以达到150个,这与自然语言中每分钟100-150个单词已经几乎没有差别。实现正常人般的交流,可以说毫无压力。

其次,相较于捕捉大脑信号对字母的感应,语音产生的机电信号更为强烈,也就更容易捕捉。所以,这在很大程度上可以缓解因信号识别缓慢而导致语音合成效率低下和患者焦虑的问题,更进一步而言,也增加了患者的接受度。

当然,作为一项尚未走出实验室的技术,它的缺陷也明显存在。

第一,人工智能识别的准确率和数据的丰富程度呈正相关。也就是说,利用RNN去进行学习破译脑电波信号并将其转化为发音器官动作的信号,要想实现较高的正确率,就需要大量的数据。目前的现实是,虽然语音输出的速度很快,但也只有一半的句子会被识别出来。就像说话的时候嘴里含着一口水,必然是会影响交流的感受和效率的。

第二,不同语言、不同方言之间的通用性很弱,即便是同一种语言,由于方言的差异性也会导致发音的时候各部位的运动存在着细节性的发音差异,会导致语音合成的混淆。比如在汉语中“六”的发音,不同地域之间的差别达到了二十多个。为一种语言建立一种样本?似乎有点过于繁琐。

所以,如果能找到一种更好的方法能够增强该技术的通用性尚可,如果仅仅停留在这个层面,其产品很可能无法走入寻常百姓家,而是成为显贵人群的私人订制。

研究者们自己也承认,声道运动和语音的最终形成是一个复杂的关系,目前该系统对合成较慢的发音比较擅长,对说话者的节奏和语调有一定的要求,距离最终的应用,仍然是有很长的一段路要走。

但不管怎样,这也应该属于脑机接口技术的一次重大突破了。试想在不远的将来,你只需要动动脑子,就会有准确无误的文本或者语音转化出来,人机交互将会变得多么顺畅而自然;而对于那些长期存在语言表达障碍的弱势群体而言,或许“福音”二字,已经远不足以表达其所蕴含的难以估量的价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音合成
    +关注

    关注

    2

    文章

    89

    浏览量

    16157
  • 脑电波
    +关注

    关注

    0

    文章

    52

    浏览量

    17002

原文标题:你尽管“动脑”,话交给脑机接口来说

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    接口重大进展,AI模仿让患者发声!上游芯片技术在不断研发

    电子发烧友网报道(文/李弯弯)近日,接口技术又取得重大进展,美国加州大学戴维斯分校健康中心开发出一款新型
    的头像 发表于 08-17 00:03 7307次阅读
    <b class='flag-5'>脑</b><b class='flag-5'>机</b><b class='flag-5'>接口</b>重大进展,AI模仿让患者发声!上游芯片<b class='flag-5'>技术</b><b class='flag-5'>也</b>在不断研发

    成都华微亮相第二届接口大会

    日前,第二届接口大会在武汉市成功举办。本次大会以“互联·共创未来”为主题,汇聚了来自全球各地的1500余位医学科学、脑科学、
    的头像 发表于 11-27 11:06 308次阅读

    景昱医疗:接口是治疗难治性精神疾病更有效的手段

    电子发烧友网报道(文/吴子鹏)在第三届南渡江智慧医疗与康复产业高峰论坛上,景昱医疗科技(苏州)股份有限公司(以下简称:景昱医疗)董事、CFO、董事会秘书耿东分享的主题是《侵入式接口技术在人类难治
    发表于 11-22 14:57 319次阅读
    景昱医疗:<b class='flag-5'>脑</b><b class='flag-5'>机</b><b class='flag-5'>接口</b>是治疗难治性精神疾病更有效的手段

    接口初创公司Synchron称AI将对设备发挥重要作用

    接口技术的前沿探索中,初创公司Synchron Inc.正引领一场革命性的变革。该公司近期宣布,他们正携手OpenAI的最新人工智能模型,共同开发一项创新技术,旨在通过植入式设备
    的头像 发表于 07-16 14:42 590次阅读

    工信部引领未来科技浪潮,接口标准化技术委员会筹建方案揭晓

    在科技日新月异的今天,接口技术作为连接人类大脑与外部设备的桥梁,正逐步从科幻概念走向现实应用的前沿。7月2日,这一重要领域迎来了里程碑式的进展,工业和信息化部官方网站正式发布了“工业和信息化部
    的头像 发表于 07-02 14:13 364次阅读

    接口技术如何获取信号至关重要

    接口又可分为输出型和输入型两种。输出型接口主要由大脑向外部设备输出通信或控制指令,在不依
    的头像 发表于 04-09 11:16 781次阅读

    马斯克公布首位接口受试者新进展!微美全息(WIMI.US)深入研究开启智能革命性飞跃!

    消息显示,接口初创公司Neuralink的创始人马斯克表示,第一位植入Neuralink接口技术
    的头像 发表于 03-15 14:46 395次阅读

    基于MEMS超声波方案的“真”无线植入式接口技术

    2024年1月30日,埃隆·马斯克通过社交平台发布消息,声称Neuralink公司成功进行了首例接口人体植入手术,被植入者恢复状况良好;
    的头像 发表于 03-15 09:46 939次阅读
    基于MEMS超声波方案的“真”无线植入式<b class='flag-5'>脑</b><b class='flag-5'>机</b><b class='flag-5'>接口技术</b>

    国内接口研究再迎新进展!微美全息(WIMI.US)斩获V-BCI技术专利助力科技腾飞!

    三个月的居家康复训练,该患者目前可以通过电活动驱动气动手套,患者脊髓损伤临床评分和感觉诱发电位测量均有改善。这一进展表明,接口技术已经逐步从实验室走向临床应用,为未来的广泛应用奠
    的头像 发表于 03-05 10:25 506次阅读

    接口:探寻大脑活动新解码技术

    据最新研究,2月20日,英国知名学术期刊《自然》(Nature)特别报道了未来接口的发展趋势及潜在影响力。研究强调,
    的头像 发表于 02-25 15:50 759次阅读

    马斯克接口技术迎来历史性时刻

    马斯克在X平台上发布帖子称,首位接受Neuralink接口植入的人类患者恢复状况良好。初步研究成果显示,神经元尖峰检测充满希望。
    的头像 发表于 02-22 10:55 983次阅读

    接口,带火传感器

    接口研究伦理指引》,以指导接口研究合规开展。以上种种,都揭示了
    的头像 发表于 02-21 09:54 451次阅读

    接口将在十年内实现市场化应用,微美全息(WIMI.US)提前入局稳步推进迈入增长阶段

    在前沿科技这个充满创新活力的领域中,接口技术和突破性进展将主导未来科技潮流。自
    的头像 发表于 01-09 15:06 392次阅读

    光纤在植入式接口中的应用

    光纤在植入式接口中的应用  光纤技术作为一种传输信息的重要媒介,已经在各个领域得到了广泛的应用。而在现代医学领域中,光纤技术
    的头像 发表于 01-09 14:41 462次阅读

    接口案例:如何用超声波技术实现无创“读

    这一研究发现为确认超声接口技术的可行性,以及新型微创(硬膜外)接口技术发展提供重要指引依
    的头像 发表于 01-04 11:00 978次阅读
    <b class='flag-5'>脑</b><b class='flag-5'>机</b><b class='flag-5'>接口</b>案例:如何用超声波<b class='flag-5'>技术</b>实现无创“读<b class='flag-5'>脑</b>”