0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在人与汽车之间构建一个交互系统?

我快闭嘴 来源:盖世汽车快讯 作者: 童郜 2020-09-02 10:07 次阅读

霍金轮椅是当今人机交互的集大成者

“WOW!”—这是斯蒂芬霍金用眼睛写完的人生最后一句话,无比深情地表达了他对世界的热爱!

霍金是继牛顿和爱因斯坦之后最杰出的科学家之一,被誉为宇宙之王。但命运似乎和霍金开了个玩笑,他在21岁就被确诊为“渐冻症”,不能言语。为了让霍金能够继续创造科学奇迹,世界前沿科技公司为霍金的轮椅安装了电脑等设备,配置了文字转换语音、红外线监测、人脸识别、眼球追踪等技术,可以把思想转化为文字。此后,霍金用自己的勇气与坚持做出了常人难以企及的成就,提出了著名的“霍金辐射”学说。可以说,霍金轮椅是当今人机交互的“集大成者”,是人类思想与机械力量擦出的强火花。

如何在人与汽车之间构建一个交互系统

语音转文字并不稀奇,微信中几乎每天都会用到它。人脸识别技术、眼球追踪技术才是霍金轮椅的先进之处。不过随着科技发展,这两项技术在汽车中已经被广泛应用。今年7月份上市的凯迪拉克CT6就配置了Super Cruise超级智能驾驶系统,集成了用于人脸识别的摄像头和红外线发射器。在你疲劳驾驶时,可以更主动的给予提醒。刚刚开启预售的威马EX6 Plus 6座则配置了更先进的“眼神智控”,具备人脸识别、视线唤醒、疲劳检测三大模块。像霍金的传奇轮椅一样,这套系统只需你给它一个眼神,就可以瞬间秒懂你的想法。

可以发现,无论是“眼神智控”还是人脸识别,本质上反映的是机器如何独立思考,如何做决策,如何更好的服务人类。那么,人类工程师是如何实现人与汽车沟通,或者说如何在人与汽车之间构建一个交互系统。

第一阶段的人车交互:没有脑子的汽车和只能下命令的人类

一切的技术谜团都要在从最初的需求出发,人与汽车的交互系统由人对汽车的便捷性需求催生。进入工业化社会,“我很忙”变成了每个职场人的口头禅,在生活与工作之间疲于应对的人们更加需要一台更懂他的汽车。然而从需求出现到市场满足,总需要一个过程,打工族不是霍金,不可能让一堆世界前沿公司不惜一切成本为其量身定制,更何况霍金的轮椅也经历了漫长的升级迭代。于是汽车开始出现了一些最早的智能交互,在2013年凯迪拉克车型就已经搭载了CUE人车交互系统,用户按下方向盘上的启动按钮,然后说出“打开空调”,汽车就可以自动开启空调。在当时,汽车智能化虽然在国内正在如火如荼的进行,但在市场端,国产品牌依旧没有拿出比较成熟的产品。豪华品牌在技术上,依然占据引导作用,并依靠这种时髦的科技,赚足了眼球。

即便以今天的眼光,这种指令式人车交互也有独特优势。它更简单、高效,说让汽车干啥,汽车就能干啥。缺点也很明显,一个功能对应一条指令,想要玩转这一套,需要花时间去学习。最关键的是,智能化不是让人去学习语言,而是让机器去学习人类。而且指令式人车交互,在实际体验中,也不完美。想要的打开空调时,就必须方向盘上操作一番,然后对着车机系统吼一通。可实际上,启动空调很简单,随手一摁就行,完全不需要如此麻烦。

第二阶段: 狂背单词的汽车和爱讲话的人类

初期的人车交互尴尬问题,并没有打击到汽车工程师,对于这类人来说,与天斗,与地斗,与机器斗,其乐无穷! 很快,就出现了以“免唤醒词”为代表的人车交互新方式,标志着汽车开始尝试以朋友的角色,理解你。

那么,免唤醒词是什么鬼?现在让我们回想一下人机交互使用场景。例如,我正在用小鹏G3,我要去外滩看大海,我会说:“小P、小P”,我要打开地图。但如果我们真的把“小P”当朋友,像朋友一样面对面的交流,我们就不会每句话都“指名道姓”,我们会说,去外滩看海景。在这个过程中,“小P、小P”被省略,“去外滩看海景”则变成了启动导航系统的免唤醒词。

免唤醒词的出现大大降低了人车沟通复杂性。尝到甜头后,国内车企迅速扩大了“免唤醒词”词组量。以新发布的威马EX6 Plus 6座为例,人车交互系统内置超过了70组免唤醒词。比方说,日常驾驶听歌时,对当前歌曲完全不感冒,想切换下一首,只需要说“下一首”就行。相比最早的凯迪拉克CUE人车交互系统,免唤醒词的加入取消了手动启动语音和“指名道姓”的语音唤醒过程,第一次真正意义上让语音交互有了实用价值。

然而在人车交互发展方面,国内造车新势力因为发展原因,语音交互是从免唤醒词这一阶段开始。而合资车企在这方面走的更早,它们的人机交互是从简单的语音指令开始。但走的早,不一定走的好。在本土品牌扩大“免唤醒词”应用时,通用、大众这些巨头还在纠结是否需要为此做更深的延展。至今,凯迪拉克CT6的语音交互依旧停留在“安键启动”状态,并不支持免唤醒词。而在小鹏P7的车机系统中免唤醒词已经达到了50+,威马EX6 Plus 6座更是拥有超70组免唤醒词,支持超过120项驾驶场景常用功能的语音控制,包含17项车辆控制指令,能够有效识别中英文混合信息。只需说句话,一切全搞定。

第三阶段:察言观色的汽车和手舞足导的用户

话说回来,免唤醒词始终是技术限制下的产物,真正的人车交互应该像朋友交流一样,一个眼神、一个动作、一个表情就能懂你,而不是仪式感的唤醒。此时,汽车人车交互系统引入了类似斯蒂芬霍金轮椅配置的“眼神追踪”技术,只不过在汽车上被称为“眼神智控”。配置这种技术的汽车会在座舱内放置人脸、眼神追踪等识别模组,用来会检测驾驶员动作。当你扭头向屏幕的时候,汽车就会明白,你在需要我,此时,你给它个眼神,就能唤醒车机交互系统。在这个阶段,汽车学会了看脸色,揣测人类心思,变的更聪明。

在威马EX6 Plus 6座中,“眼神智控”模组设置在了前挡风玻璃靠近内后视镜处,具备了人脸识别、视线唤醒、疲劳检测三大模块。如果我想要设置导航,只需要扭头看向中控大屏,然后说导航去国家大剧院,车机系统就会自动输入导航位置,然后开启导航模式,这就是视线唤醒的奇妙之处。

如果说,“眼神智控”只是为了实现视线唤醒,那它将毫无存在感,这种小活,“免唤醒词”就能做到。作为新的交互方式,“眼神智控”的雄心是要从被动到主动实现全新人车“互动”。疲劳驾驶检测就是一种很受欢迎的主动关怀配置。统计表明由于疲劳、瞌睡引发的交通事故在交通事故的总数中占7%左右,在重型卡车和高速路上的交通事故中则占到35%左右,而在严重交通事故中的占比更达到40%。同时交通事故统计结果显示,如果驾驶员反应速度能够快0.5秒,将有60%的交通事故能够避免,如果快1.5秒,将有90%的交通事故能够避免。

在凯迪拉克CT6和威马EX6 Plus 6座中都配置了“疲劳驾驶检测”。它们就像机警的侦察员,随时分析驾驶员面部数据,如果驾驶员出现眨眼睛和打哈欠等动作,它们就进入分阶提醒。如果眨眼睛的时间和打哈欠的次数满足了车辆设定条件,车机系统就会发生提醒,或者主动启动语音,询问车主是否来点音乐。只不过新势力出身的威马在“眼神智控”的人脸识别模块中,还进行了更深的拓展应用。譬如,用户坐进驾驶舱,人脸识别模组就能进行识别驾驶员,自动把对应的喜马拉雅、QQ音乐、爱奇艺、百度地图等账号全面互通。如果说语音交互的差异是豪华品牌的本土化服务缺失。那么,“眼神智控”的深度拓展则反映出各自不同的软件开发实力。

需要指出的是,合资品牌并不傻,他们已经醒悟过来,体会到了人车交互对用户的吸引力,以及人车交互开发对自身在智能化方面的积极作用。但合资品牌经历了太久的战略迟疑,从16年开始,人车交互已经在国产车上基本普及,相关人车交互产业也被本土的百度、阿里、科大讯飞、商汤等巨头所垄断,他们能做的只能是买国产供应商提供的半成品,加上无法很好的本土化适配,最终导致他们从先行者,变成如今的追赶者。

第四阶段:“声情并茂”的汽车和不想说话的用户

那么,在接下来的一段时间内,人车交互又会如何发展呢?

是像电影(钢铁侠)中的贾维斯?还是像(流浪地球)中和吴京对话的缪斯。NO,都不是,人车智能交互属于基础科学,完全不存在“大跃进”式的跨越发展。下一阶段的人车交互会把语音交互和“眼神智控”深度融合,从声音和表情上“声情并茂“的理解用户,然后在交互上,做出一些新的创新形式。

如何定义新的创新形式?试想当你点燃一支烟,希望略作放松时,车辆会为你主动降下窗户,实现车内通风。当你忽然接到一个电话,要做简单沟通时,车辆会为你主动降低音乐和导航音量,以保证通话效果,这些功能在威马EX6 Plus 6座上已经能够实现。未来更超前的手势控制,也会在威马下一代数字智能座舱中逐渐落地。譬如,开车时,需要触控屏幕完成操作时,可以不用俯身,直接做一个滑动手势,车机系统就能完成屏幕滑动。这一阶段的人车交互智能化,将无限接近霍金的传奇轮椅。

相比新势力这种更快速地智能化发展,合资品牌的人车交互进程就要保守太多。通用集团凯迪拉克品牌在下一代旗舰车型凯雷德上依然只是提供了基础的4G通讯和百度语音,不仅缺少5G 、V2X等前瞻科技,甚至是车机交互的发力点仍然是在向着整车OTA、本土化语音发力,还是在打基础,做基本功。

致敬霍金,致敬他对世界的热爱,对科研的热诚。以为往圣继绝学的科技态度、和落后就要挨打,天天担心被淘汰的焦虑感,造车新势力在智能化方面突飞猛进。从汽车人车交互的四个发展阶段看,造车新势力显然走在了时代前列,虽然它们依然有很多方面都需要努力追赶,但并不妨碍我们给予适当鼓励,毕竟“胡萝卜加大棒”才是好的激励方式。在此,我引用我国已故著名生物学家童第周的话:“一定要争气,中国人并不比外国人笨。外国人认为难办的事,我们中国人经过努力,也能办得到。”
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    59

    文章

    4791

    浏览量

    95251
  • 人脸识别
    +关注

    关注

    76

    文章

    4002

    浏览量

    81661
  • 5G
    5G
    +关注

    关注

    1352

    文章

    48322

    浏览量

    562888
收藏 人收藏

    评论

    相关推荐

    如何构建物联网系统

    构建物联网系统复杂而细致的过程,涉及多个关键步骤和组件。以下是详细的
    的头像 发表于 10-29 10:40 260次阅读

    为THS3001构建简单的SPICE模型

    电子发烧友网站提供《为THS3001构建简单的SPICE模型.pdf》资料免费下载
    发表于 10-29 10:11 0次下载
    为THS3001<b class='flag-5'>构建</b><b class='flag-5'>一</b><b class='flag-5'>个</b>简单的SPICE模型

    SLAM:机器何在未知地形环境中进行导航

    作者: Aswin S Babu 设想下,当我们困在陌生的沙漠中时,所面临的艰巨任务是寻找条安全之路。长期以来,在陌生地形中导航
    的头像 发表于 10-02 16:37 296次阅读

    何在不同应用场景下构建音频测试环境

    在之前的文章中,我们已经详细介绍了基础音频参数和AP525的软硬件配置。本文将延续这主题,以泰凌TLSR9518A EVB作为测试设备(DUT),向大家展示如何在不同应用场景下构建音频测试环境。
    的头像 发表于 07-03 15:00 412次阅读
    如<b class='flag-5'>何在</b>不同应用场景下<b class='flag-5'>构建</b>音频测试环境

    人机交互界面是什么_人机交互界面的功能

    终端(OT),是指与计算机系统之间的通信媒体或手段,是与计算机之间进行各种符号和动作的双向信息交换的平台。   人机
    的头像 发表于 06-22 11:03 1979次阅读

    PLC之间的IO交互怎么实现

    在工业自动化领域,可编程逻辑控制器(PLC)作为核心控制设备,其重要性不言而喻。PLC之间的IO交互是实现自动化生产线高效、稳定运行的关键环节。本文将详细探讨PLC之间IO交互的实现方
    的头像 发表于 06-17 11:09 1364次阅读

    PLC之间如何交互信号

    在工业自动化系统中,PLC(Programmable Logic Controller,可编程逻辑控制器)是核心的控制设备。在许多复杂的应用场景中,需要两或多个PLC之间进行信号交互
    的头像 发表于 06-14 16:57 3368次阅读

    简单的汽车蓄电池维修电路

     这是围绕当地市场上容易买到的非常常见的电子元件构建的简单电路,用于保护汽车汽车)电池免受深度放电并防止损坏。
    的头像 发表于 05-05 11:19 900次阅读
    <b class='flag-5'>一</b><b class='flag-5'>个</b>简单的<b class='flag-5'>汽车</b>蓄电池维修电路

    人机交互的三阶段 人机交互的常用方式

    交互经历的三阶段:命令行界面交互阶段、图形用户界面交互阶段、自然和谐的人机交互阶段。
    的头像 发表于 03-13 17:25 2654次阅读

    怪兽智能数字,实时交互数字直播系统,3D超写实虚拟形象直播

    也在不断创新,推出了许多令人惊叹的技术产品。其中,可互动的怪兽智能数字以及实时交互数字直播系统,以及其超写实的3D虚拟形象直播系统就是其
    的头像 发表于 03-05 09:08 577次阅读

    鸿蒙开发丨设备内 UIAbility 的几种交互方式

    UIAbility 组件间交互(设备内) 在设备内,UIAbility(用户界面能力)是系统调度的最小单元,它们负责展示用户界面和执行相关的业务逻辑。设备内的不同功能模块之间交互是应
    的头像 发表于 02-02 10:42 523次阅读
    鸿蒙开发丨设备内 UIAbility 的几种<b class='flag-5'>交互</b>方式

    新能源汽车交互设计现状及发展趋势

      随着车内信息成倍地增长,汽车相关的界面也越来越多,因此人们利用各种屏幕进行操作和反馈便成为种主流的交互方式,界面交互汽车软件
    发表于 12-22 17:33 546次阅读
    新能源<b class='flag-5'>汽车</b><b class='flag-5'>交互</b>设计现状及发展趋势

    基于Redis Enterprise,LangChain,OpenAI 构建电子商务聊天机器

    鉴于最近人工智能支持的API和网络开发工具的激增,许多科技公司都在将聊天机器集成到他们的应用程序中。LangChain是种备受欢迎的新框架,近期引起了广泛关注。该框架旨在简化开发人员与语言模型
    的头像 发表于 11-25 08:04 425次阅读
    基于Redis Enterprise,LangChain,OpenAI <b class='flag-5'>构建</b><b class='flag-5'>一</b><b class='flag-5'>个</b>电子商务聊天机器<b class='flag-5'>人</b>

    何在下一代智能手机的设计中节约空间?本文提供思路

    何在下一代智能手机的设计中节约空间?本文提供思路
    的头像 发表于 11-23 09:06 401次阅读
    如<b class='flag-5'>何在下一</b>代智能手机的设计中节约空间?本文提供<b class='flag-5'>一</b><b class='flag-5'>个</b>思路

    springboot前后端交互流程

    Boot 进行开发时,前后端交互非常重要的部分,本文将详细介绍 Spring Boot 前后端交互的流程。 前后端交互的基本原理 在
    的头像 发表于 11-22 16:00 1979次阅读