0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

可通过面部表情来发送表情包的耳机

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-10-30 10:13 次阅读

无需打字、无需搜索表情,只需对着手机微笑,就能发出微笑表情包。

同样的,对着手机皱眉,就能发出皱眉表情包。

以上功能来自一款名为 C-Face 耳机的设备,它诞生于康奈尔大学华人科学家张铖的 SciFi 实验室。他近日以通讯作者身份在 UIST 2020(User Interface Software and Technology)会议上发表了这项研究,论文名为《即使戴着口罩耳机也可以跟踪面部表情》(Earphone tracks facial expressions, even with a face mask)。 图 | 张铖(来源:受访者) 除张铖之外,论文第一作者还有来自北京大学、目前在康奈尔大学访问的本科生陈拓潮。 论文表示,该耳机可通过观察脸颊轮廓,来连续跟踪面部表情,并能把表情转换为表情符号、或无声语音命令。DeepTech 联系到张铖,并就该耳机和其进行了深入交流。 图 | 耳机的展示视频 他表示,C-Face 耳机是实验室系列研究的其中一款设备。该系列研究主要探索信息的获知,如果缺乏信息,计算机就很难理解人类动机和行为。而 SciFi 实验室的长期工作,是致力于提升人机交流,但是第一步,计算机需要获取到信息。 摄像头是获取信息的最常用手段之一,比如在室内外布置摄像头,并且摄像头必须没有遮挡,这就导致传统的 “摄像头方法” 会在某些场景中失灵。比如,在获取脸部表情时,是用摄像头直接 “捕捉” 人脸,但用户在外面时,不可能时刻脸部对着摄像头。 而本次的 C-Face 耳机,正是一款可用于实时获取脸部信息的耳机。其原理是,由于人脸有很多肌肉,肌肉之间相互连接,脸部在做不同表情时,其他肌肉也会被牵动,嘴巴、眼睛和眉毛的位置与形状也会发生变化。基于此,经该实验室的设计后,耳机可通过比较容易捕捉到的肌肉变化来推测出面部表情。

图 | 不戴口罩时戴着耳机做表情 由于新冠疫情的影响,研究人员只能在 9 名参与者的情况下测试耳机。尽管如此,表情符号的识别准确度仍然超过 88%,面部提示的准确度超过 85%。

图 | 戴口罩时戴着耳机做表情 具体来说,耳机内置两个迷你摄像头,它们可以捕捉到侧面脸颊形状,并通过脸颊形状来判断你的脸部表情。因为人在执行面部特征时,面部肌肉组织就会拉伸和收缩,进而推动和拉动毛孔和皮肤,并对面部肌肉组织的紧绷产生影响,这种影响会导致脸颊轮廓发生改变。

在耳机中,摄像头可以传输数据,数据会传输到微处理器(Raspberry Pi),微处理器收集数据,并把它发到计算机上,这时深度学习算法就能开始工作。 深度学习在耳机中的应用 很多情况下,深度学习在数据上的效果,比传统机器学习的效果更好。本次耳机之要想实现根据侧脸和脸颊形状来推断整个面部表情,其实并不容易,因为每个人的侧脸都不一样。 因此,就得通过深度学习来采集训练数据,具体做法是先采集到用户脸颊变化情况,并结合前置摄像头来捕捉面部表情,以标记出相对应的脸部表情。 这相当于摄像头每一帧图片,都有一个对应的面部表情。采集到训练数据后,研究人员就能发掘出不同脸颊形状与面部表情间的复杂对应关系。

张铖表示,深度学习的好处是能通过复杂学习,来学习一些人类不擅长的技能。有的技能人类很擅长,比如一眼就能识别某些物体。但有些技能人类并不擅长,比如只根据侧面脸颊,我们很难判断出脸部全部形状。 深度学习的能力是,可通过算法找出事物间的复杂联系,从而根据侧部面颊,准确推断出面部表情。 具体工作时,在摄像机捕获图像后,计算机视觉和深度学习模型会对其进行重建。由于原始数据是二维的,因此卷积神经网络(一种擅长对图像进行分类、检测和检索的人工智能模型)有助于将轮廓重构为表达式。 此外,该模型可将脸颊图像转换为 42 个面部特征点,它们分别代表受表情变化影响最大的部位,如嘴巴、眼睛、眉毛等。 这 42 个特征点代表的面部表情,也可用于推测出 8 个表情符号,包括 “无表情”“生气” 和 “ Kissy-face”,另外还有 8 个可用于控制音乐设备的静音语音命令,如 “播放” ,“下一首” 和 “音量增大” 等。

相比传统方法用前置摄像头来识别表情,C-Face 耳机的独特优势是戴着口罩也能被耳机捕捉到表情,即摄像机无需对着人脸,只需观察从耳朵到侧面脸颊的形状就能识别表情。 因为即使你戴着口罩(超大口罩除外),侧面脸颊形状并不会发生巨大改变,这时深度学习仍然可以工作。

本次研究还展示了 C-Face 耳机的两大功能:无声语音识别和前文的输入表情包。 无声语音识别指的是,一般的语音识别,都是通过声音来识别。如果不通过声音,是否也能识别?因为,假如你在开会、看电影等场合,突然说话就会很奇怪。再就是,当周围有很多噪音,即便说话也无法识别。 而 C-Face 耳机可通过分析用户表情,来识别沉默的语音指令。这一功能的常见应用场景有,当你跑步时只需做个嘴形,相关智能设备就能以非常私密的方式,来获悉你的指令。 另一个可以想象的应用场景是健康预测,张铖表示,未来该耳机有望连续记录表情。获得大量表情数据后,就可获知用户每天的心情状况。这样大量的情绪信息,还可帮助计算机了解用户的精神健康状况。

两款耳机:入耳式和头戴式 本次耳机分为两款:入耳式和头戴式,功能上它们非常类似。张铖表示,它们所属项目都叫 C-Face,该项目并不局限于某一种特定的设备,只是在本次论文中展示了入耳式耳机和头戴式耳机。 唯一的区别是,两种耳机的摄像头位置略微不同。头戴耳机相对大一点,有较大空间放摄像头。 谈及耳机是否可用于 VR 游戏,张铖表示,经常有人问他这个问题,而他的答案一直是 Yes or NO。 即当然可以用在 VR 上面,但以他了解到的最新技术来说,VR 眼镜已有更好的解决方案。 VR 眼镜本身已经很大,通过在上面加设备来捕捉人的表情,此前已经有人做过。而 C-Face 耳机的好处是它非常小,日常可以进行穿戴。因此,他觉得 VR 眼镜不一定是 C-Face 耳机最核心的爆点。

他举例称,该实验室的耳机可以潜在地提供视频聊天功能。现在的视频聊天,都需要用户面前放置一个摄像头 (桌子上或者手举着)。 但如果用耳机来聊天,耳机自己就能捕捉你的面部表情,你也不需要把摄像头对着脸,你的朋友时时刻刻都能看到你的脸,包括走路时、开车时、甚至做饭时都可以跟人聊天。 解决功耗问题,就能加速落地 谈及商业落地,张铖表示本次论文发表后,有厂商已经和他们联系讨论一些初步的合作可能性。但想在短期内实现到现有设备,最需要解决的仍然是可穿戴设备上的功耗问题。而这一难题,超出了该实验室的能力,因此需要工业界投入资金去优化功耗问题。

目前的耳机,是研究人员买来零件组装的,摄像头可以选配,只是价钱和分辨率会有区别。在零件的选择上,他们未做过高要求,目的是让设备更快速落地成产品。 他认为,该实验室做这款设备,更多是着眼于未来。他们做研究的目的,更多是描述研究人员眼中的未来可能性。 张铖表示,未来的摄像头可能会变得非常小、功耗也非常低。尽管现在的耳机只是实验室设备,但是如果能耗问题得以解决,它有可能在 5 到 10 年后实现应用。 如果想把小型摄像头利用到现有设备上,能耗是个很大的问题。因为,摄像头会耗电,处理摄像头数据也会耗电,这是该设备的最大局限性。 就落地为产品来说,头戴式耳机短期内可能相对方便一点,因为它可以放置更大的电池。对于入耳式耳机,该实验室未来也会寻找更加低功耗的方法来解决问题。

因为如果把摄像头装在耳机上,那么摄像头的耗电量肯定比耳机多。这种情况下,无论产品有多么酷炫,如果使用十分钟就没电了,也不会有人愿意购买。 如果想快速推出该耳机,可能只能先实现一部分功能,因为工业界做产品都有一个提前周期,比如要想现在发布一款产品,可能两年前就得开始规划。 与此同时,该实验室并不局限于耳机,他们关注的是 “无处不在的计算和人机交互”,未来还有可能研发出智能耳环、智能衣服,而他们的愿望就是让似乎无法智能的物体也变得智能起来。 -End-

原文标题:耳机可检测表情?戴着口罩也可以,华人科学家新发明让人脸变成“表情包”

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19155

    浏览量

    229057
  • 耳机
    +关注

    关注

    28

    文章

    3001

    浏览量

    81231
  • 人脸识别
    +关注

    关注

    76

    文章

    4005

    浏览量

    81751

原文标题:耳机可检测表情?戴着口罩也可以,华人科学家新发明让人脸变成“表情包”

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ATA-7030高压放大器在电致变形柔性致动器表情机器人实验中的应用

    实验名称:ATA-7030高压放大器在电致变形柔性致动器表情机器人实验中的应用实验内容:该表情机器人的核心柔性器件是采用PVC凝胶电致伸缩柔性材料与不锈钢金属网状电极层叠而成。在电场作用下,凝胶会发
    的头像 发表于 10-29 17:57 154次阅读
    ATA-7030高压放大器在电致变形柔性致动器<b class='flag-5'>表情</b>机器人实验中的应用

    LM4875可通过控制DC Vol脚的电压改变增益,如果用两个音量按键控制音量要怎么做?

    LM4875可通过控制 DC Vol脚的电压改变增益,我如果用两个音量按键控制音量要怎么做?除了用电位器,还有什么其他方式吗?我的按键应该怎么接?
    发表于 10-15 06:42

    低功耗Bluetooth–有关CC1350和CC26x0器件通过SPI发送的UNPI数据缺失长度检查

    电子发烧友网站提供《低功耗Bluetooth–有关CC1350和CC26x0器件通过SPI发送的UNPI数据缺失长度检查.pdf》资料免费下载
    发表于 09-20 10:49 0次下载
    低功耗Bluetooth–有关CC1350和CC26x0器件<b class='flag-5'>通过</b>SPI<b class='flag-5'>发送</b>的UNPI数据<b class='flag-5'>包</b>缺失长度检查

    开源六轴协作机器人myCobot 320结合人脸表情识别情绪!

    与众不同的功能。通过结合人脸表情识别技术,我们可以让机械臂感知到我们的情绪变化。当我们开心时,机械臂可以跟着一起开心地舞动;当我们伤心难过时,它可以过来安慰我们,给予温暖的抚摸。这种基于表情反馈的互动能让机械臂更
    的头像 发表于 08-12 15:21 845次阅读
    开源六轴协作机器人myCobot 320结合人脸<b class='flag-5'>表情</b>识别情绪!

    旷视AI开源新突破:上传照片即可生成表情视频!

    为了展示其泛化性,MegActor甚至可以将VASA中的人物肖像和视频组合生成,得到生动的表情视频。即使与阿里EMO的官方案例相比,MegActor也能生成近似的效果。
    的头像 发表于 07-12 11:20 320次阅读
    旷视AI开源新突破:上传照片即可生成<b class='flag-5'>表情</b><b class='flag-5'>包</b>视频!

    NONOS如何检查是否实际发送了UDP数据

    我发现进入深度睡眠通常无法传输发送的最后一个 UDP 数据。我现在将睡眠延迟 30 毫秒,这是一个黑客。 我宁愿有一种方法检查是否可以休眠,或者以其他方式能够注册指示数据
    发表于 07-12 06:14

    加入IGMP组后,数据不再通过UDP发送,为什么?

    有谁知道IGMP_Join后发送数据需要什么 似乎在加入IGMP组后,数据不再通过UDP发送。 在下面的示例中,第一个数据
    发表于 07-10 07:20

    若用mdf的router例程做开发,是否需要在应用层通过心跳检测mesh组网网络是否正常?

    请教一下,若用mdf的router例程做开发,是否需要在应用层通过心跳检测mesh组网网络是否正常?目前通过父节点定时
    发表于 06-28 08:01

    机器人动态表情模块JZRF-----江智公司开始全面对外开放提供

    机器人动态表情模块江智公司开始全面对外开放提供江智机器人公司在多年单一静态表情板基础上,通过近1年左右的动态表情变化的研究实际测试,现正式对外提供不同规格(也可按客户规格定制)
    的头像 发表于 06-19 08:14 232次阅读
    机器人动态<b class='flag-5'>表情</b>模块JZRF-----江智公司开始全面对外开放提供

    澄清:iOS系统更新移除&quot;小丑&quot;表情一事系谣言

    该图伪装成美国知名财经媒体CNBC的文章,题目为“苹果新设备更新将剔除小丑表情:内部人士透露其被极右利用”,并谎称文章出自5月15日的科技版块。但真相却是,CNBC并未发出过类似新闻,且对此进行了否认。
    的头像 发表于 05-18 11:07 753次阅读

    谷歌GameFace项目让用户通过面部表情控制PC游戏角色

    开发者可将“Game Face”无障碍功能融入应用程序,使用户能够通过面部手势或头部运动控制光标。例如,张口可实现光标的移动,抬眉则表示进行拖拽操作。
    的头像 发表于 05-15 10:07 359次阅读

    iOS 17.4 &amp; iPadOS 17.4 开发者将可控制“表情反应”默认行为

    苹果公司在iOS 17.4及iPadOS 17.4的RC版开发者文档中明确规定:“开发者可以使用特定代码[…]以实现‘表情反应’功能的设定。然而,最终决定权取决于用户自主选择,而非应用程序预先设定。”
    的头像 发表于 02-28 13:56 589次阅读

    红外耳机和调频耳机一样吗 红外耳机和调频耳机的区别

    信号,但是它们在工作原理、传输距离、信号稳定性等方面存在着很大的区别。 首先,红外耳机的工作原理是通过发送和接收红外线信号传输音频。红外线是一种电磁波,其波长较短,无法穿透物体,因此
    的头像 发表于 02-19 09:25 3366次阅读

    人形机器人的三大关键技术及挑战

    人形机器人是指外形和人类相似的机器人。它们可以通过模仿人类的外貌、动作和表情与人类进行交互和沟通。
    发表于 01-05 10:53 2548次阅读

    帕克西脸部动作追踪在各个领域的应用与影响

    帕克西脸部动作追踪采用先进的AI技术,能够实时捕捉和跟踪用户的面部动作和表情。无论是喜怒哀乐,都可以被精确地捕捉并表达出来。这项技术不仅具有高精度的识别能力,还能够处理头部及面部表情
    的头像 发表于 11-28 10:49 332次阅读
    帕克西脸部动作追踪在各个领域的应用与影响