0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI手语识别技术存在的挑战

lPCU_elecfans 来源:电子发烧友网 作者:李弯弯 2021-11-17 09:16 次阅读

据外媒报道,日本电气大学与软银公司联合,通过人工智能AI技术,能将手语直接翻译成日语,这将使聋哑人士的沟通更顺畅。

目前该系统只能用于柜台设备上,聋哑人士能在摄像头前通过手语沟通,然后系统用图像识别技术,分析手指和手臂等身体几个部位的骨骼运动,将手势翻译成日文,显示在工作人员的电脑屏幕上,随后口头回复以文本的形式出现在听障人士面前的屏幕上,使交流更加顺畅。

该系统的核心技术由ABEJA提供,谷歌2018年投资了它,ABEJA的核心产品是使用机器学习帮助公司从他们的数据堆中开展商业分析。在这个项目中,ABEJA通过让AI学习了5万个手语视频,使其捕捉到手语特征和变化,目前该系统能准确将手势翻译成大约1500个日语单词。

早在2015年就有手语识别研究

人工智能技术的出现和逐渐成熟,不仅有利于产业升级,事实上很早开始,就有研究人员尝试利用AI技术帮助聋哑人士更加顺畅的交流。

2015年9月沙特设计师就专门研发了一款无线智能手套,内置传感器,聋哑人戴上交流的时候,传感器可以根据手指的运动追踪手势,再通过语言软件转换成声音和文字,在初期,这款无线智能手套只会讲法语、英语和阿拉伯语,该研究团队表示,后续会支持更多种语言。

在中国也很早就有相关的研究,2016年有媒体报道,东大自动化专业李师宁等同学研发出了一种最新型的手语识别发声系统,这是一种结合人体生物及姿态信息的便携手语发声器,聋哑人可以通过手语使该机器发声翻译。

2018年东北大学也研制出一款帮助听障人士沟通交流的智能系统,由智能传感手环、前端APP及云端服务组成,智能传感手环可以将听障人士的手语动作捕捉识别,并在云端转换为文字及语音呈现在APP端,传递给非手语使用者,同时又可以将非手语使用者的语音在APP端转换为文字加手语动图的“双语形式”。

百度、腾讯等互联网巨头企业也进行了相关研究,2019年百度在AI开发者大会上提出“Everyone can AI”的理想,意思是让每个人都能有平等接收AI的能力,百度以百度飞桨开源内容为基础建立训练模型,通过采集手势得到数据,借助手机转化成文字信息,听障人士可以使用翻译器,在咖啡馆、餐厅如同正常人一样点餐、交流。

优图AI手语翻译机界面

同是在2019年,腾讯优图实验室也推出了一款基于自研算法的优图AI手语翻译机,以普通摄像头作为手语采集装置,用户正对摄像头完成手语表达,翻译机就能通过后台运算将手语快速翻译成文字。据介绍,优图AI手语翻译机数据集覆盖近千句日常表达,包括900个常用词汇,同时还对数据进行了分析和归纳,是当前最大的中文手语识别数据集。

手语识别技术存在很大挑战

相比于其他AI视觉识别技术,手语识别研发存在更大困难。在2018年东北大学的研究中,就透露出手语识别研究存在的现实问题,即每位听障人士的手语规划不同,同一个词打出的手势有差异,因此智能识别可能就没那么准确。

不过好在2018年中央颁发了国家通用手语标准方案,这很大程度有利于后续手语转文字或语音方面的研究。即使如此可能还是会存在细微差异,百度此前就表示,手语复杂、多样、以及地域性差异给研究带来不少困难。

百度还谈到另外一大困难,即可用于训练模型的数据量小,在上述日本的项目中,一位参与开发的软银工程师也表示,要建立一个将符号准确翻译成日文的模型,需要大量的手语数据。因此他们通过网站等方式,呼吁更多人发送手语图像数据。

小结

AI技术在服务产业升级的同时,也可以极大的帮助聋哑人群更好的实现沟通,这是这个时代的福音。据第二次全国残疾人抽样调查结果显示,我国有2780万听障人士,如果能够利用AI技术实现将手语实时翻译成文字和语音,这将是一项极其有意义的事。

日本聋人联合会认为,要使人工智能成为聋哑人群的有效工具,还需要很长的时间来实现。不过很明显从2015年到现在,手语识别在逐渐取得进步,也有相当多的研究人员和企业投入其中,对于未来逐步突破困难取得更大进步还是值得期待。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    33025

    浏览量

    272822
  • 人工智能
    +关注

    关注

    1801

    文章

    48259

    浏览量

    243381

原文标题:腾讯、百度、软银都在研究,利用AI技术将手语转文字有多重要?

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    岸桥箱号识别系统如何工作?揭秘AI图像识别技术

    在港口自动化升级的浪潮中,AI岸桥识别系统凭借前沿的图像识别技术,成为提升码头作业效率的“智慧之眼”。那么,这套系统如何实现集装箱信息的精准捕捉?又是如何通过
    的头像 发表于 04-02 09:45 34次阅读

    安信可AI人脸识别方案

    作为神仙世界的高科技,"无接触式开锁",人脸识别技术也被广泛应用在现代生活中,安信可也有AI人脸识别方案!
    的头像 发表于 02-25 14:39 225次阅读
    安信可<b class='flag-5'>AI</b>人脸<b class='flag-5'>识别</b>方案

    百度AI手语数字人助力听障人士“听见”声音

    近几年,百度先后与天津理工大学、鲸言科技合作,共同研发出百度智能云曦灵AI手语平台与双向手语翻译机,让手语的“声音”,被更多人听见。
    的头像 发表于 02-21 11:29 431次阅读

    AI技术与PLC编程融合

    如何将AI技术融入PLC编程软件
    发表于 02-14 15:55

    中山大学:基于定制裂纹设计的超灵敏透气水凝胶纤维应变传感器及无线手语识别应用

    和地域多样性可能会给不懂手语的人造成交流障碍。目前,各种识别人类手势的技术,包括视觉图像处理、肌电图和可穿戴应变传感器,在改善聋哑人群体的沟通方面发挥了重要作用。特别地,视觉图像处理在手语
    的头像 发表于 12-02 17:29 702次阅读
    中山大学:基于定制裂纹设计的超灵敏透气水凝胶纤维应变传感器及无线<b class='flag-5'>手语</b><b class='flag-5'>识别</b>应用

    AI智能识别监测摄像机

    随着人工智能技术的飞速发展,AI智能识别监测摄像机逐渐成为各行各业安全管理的重要工具。这种高科技设备不仅具备传统监控摄像机的基本功能,还通过深度学习和图像处理等先进技术,实现了对人、车
    的头像 发表于 11-28 10:39 572次阅读
    <b class='flag-5'>AI</b>智能<b class='flag-5'>识别</b>监测摄像机

    AI图像识别摄像机

    随着科技的迅猛发展,人工智能(AI)在各个领域的应用越来越广泛,其中图像识别技术尤为引人注目。AI图像识别摄像机作为这一
    的头像 发表于 11-08 10:38 603次阅读
    <b class='flag-5'>AI</b>图像<b class='flag-5'>识别</b>摄像机

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    的深入发展。 3. 挑战与机遇并存 尽管AI在生命科学领域取得了显著的成果,但也面临着诸多挑战。例如,数据隐私、算法偏见、伦理道德等问题都需要我们认真思考和解决。同时,如何更好地将AI
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    的物理可信度,还为科学研究提供了新的视角和方法。 5. 挑战与未来展望 第二章也提到了AI for Science面临的挑战和未来展望。尽管AI技术
    发表于 10-14 09:16

    平衡创新与伦理:AI时代的隐私保护和算法公平

    方面的立法和标准存在差异,这不仅给全球化的企业运营带来挑战,也影响了全球用户权益的平等保护。国际组织应当发挥引领作用,推动制定统一的AI伦理框架,同时鼓励各国根据自身国情调整和实施。 AI
    发表于 07-16 15:07

    AI大模型与传统AI的区别

    AI大模型(如LLM,即大型语言模型)与传统AI在多个方面存在显著的区别。以下将从技术层面、应用场景、性能表现、计算资源和成本、以及发展趋势和挑战
    的头像 发表于 07-15 11:37 4494次阅读

    人工智能的语音识别技术详解

    随着科技的飞速发展,人工智能(AI技术已经渗透到我们生活的方方面面,其中语音识别技术作为AI领域的重要分支,更是以其独特的魅力和广泛的应用
    的头像 发表于 07-01 11:39 1989次阅读

    开源项目!设计一款智能手语翻译眼镜

    手语翻译的依赖。 这款眼镜的设计既实用又低调,方便日常佩戴,能够无缝融入用户的日常生活中,让使用者能够轻松地与不懂手语的人士沟通。它的亮点在于利用人工智能技术检测手势并进行实时翻译,不仅打破了交流障碍
    发表于 05-20 15:59

    **十万级口语识别,离线自然说技术,让智能照明更懂你**

    ,使得语音芯片在风噪和人声叠加的情况下,仍能保持较高的识别率,可满足用户对风扇灯语音识别性能的要求。 可应用照明品类 离线自然说: 离线自然说是启英泰伦研发的一种能在端侧AI语音芯片上实现的轻量级
    发表于 04-29 17:09

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI能力,并为
    发表于 04-11 16:14