电子发烧友网报道(文/李弯弯)日前,梅赛德斯-奔驰和微软共同宣布,梅赛德斯-奔驰通过微软的Azure OpenAI Service,将ChatGPT整合进他们的MBUX语音助手。
测试计划将于当地时间周五(6月16日)开始,在美90万辆配备MBUX信息娱乐系统的车辆都可参与测试。车主可以通过登录官方应用程序“Mercedes me”,或在车内使用语音命令“嘿梅赛德斯,我想加入测试计划”,自愿注册参与测试。
汽车是大模型最大的交互应用场景
微软公司发言人称,这是ChatGPT产品第一次应用在汽车环境中。据微软介绍,车载ChatGPT能支持更动态的对话——不仅可以理解车主的语音命令,还可以进行交互式对话,对话范围可以涵盖地点信息、菜谱,甚至是一些更加复杂的问题。
与普通的语音助手不同,车载ChatGPT可以处理完整的对话,比如追问,并且能保持对前后文的理解。驾驶员可以提出复杂的问题或进行多轮对话,从语音助手那里收到详细的回复。
微软还在与梅奔探索ChatGPT的插件生态系统,为第三方服务集成开辟可能性。驾驶员未来有望通过车载系统,就能完成预订餐厅、预定电影票等任务,进一步提高便利性和生产力。
近半年来,全球主要的互联网公司、人工智能企业已经推出众多大模型产品,而接下来探索大模型的落地应用是关键。
早前在上海车展上,阿里集团副总裁、斑马智行CEO张春晖谈到,汽车是大模型最大的交互应用场景,智能汽车操作系统将会被重塑。他表示,AliOS智能汽车操作系统已接入通义千问大模型进行测试,相关技术会率先在智己汽车上落地。
不仅阿里巴巴,众多企业都在探索大模型在汽车上的应用,包括百度、阿里、商汤等。此外,特斯拉、英伟达、毫末智行等都有这方面的探索。
此前,百度发布文心一言之后,长安汽车就官宣,旗下逸达将成为国内首款搭载文心一言的量产车型,后续将通过软件升级的形式搭载到新车上。除此之外,集度、吉利、岚图、红旗、长城、东风日产、爱驰、零跑、海马等多家车企都确认将内测体验并接入其相关能力,与百度共同打造针对汽车智能场景的大模型人工智能交互体验。
5月份,百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果,包括出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,还有在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。
百度阿波罗智舱业务部产品架构师徐嘉南表示,大模型的能力给汽车加上了智商和情商,这是过去系统不具备的能力。
商汤此前推出的“日日新SenseNova”大模型体系拥有语言大模型以及数字人等多种生成式AI能力,可为车舱提供更智能和人性化的多模态人车交互体验。在前不久的上海车展上,商汤科技就展示了其大模型在车舱智能化方面的实力。另外,在“日日新SenseNova”大模型体系的支持,其自动驾驶产品方案也获得持续创新的能力。
此外,毫末智行此前也发布了首个基于大模型的自动驾驶算法DriveGPT。不久前马斯克也被曝出紧急抢购1万张GPU,创立X.AI,准备开发TruthGPT。
英伟达也有这方面的探索,此前消息,英伟达与慕尼黑大学等院校的研究人员联合发布了一篇有关视频潜在扩散模型的论文,该模型能够将文本转换成视频,实现高分辨率的长视频合成。研究人员指出,该模型其中一大具有潜力的应用领域,是驾驶数据的高分辨率视频合成,能够模拟特定驾驶场景,在自动驾驶领域中具有巨大的应用潜力。
大模型赋能智能座舱和自动驾驶发展
大模型在汽车上的应用主要是智能座舱和智能驾驶。当前,随着新能源汽车的快速渗透,汽车智能化的步伐也在加快。其中,智能座舱的渗透率增长态势更为明显。数据显示,预计到2025年,在国内市场,智能座舱的渗透率将突破76%。
根据调研,在智能座舱方面,智能化功能搭载率排名第一的是语音交互。所以各家大模型在智能座舱上的应用来看,对语音交互的优化是其首先要做的事。大家都知道,语音交互其实已经发展很多年,但目前车载语音助手整体水平还停留在可能叫不醒、响应慢、总出错、听不懂、不好用的阶段。
而大模型能带来的好处是,它可以通过深度学习等技术,训练出更加准确的语义和意图理解模型,帮助车载系统更好地理解用户的指令和意图,并让车载语音实现更深层次的个性化和自然拟人的交互。因此在大模型赋能下,车载助手将具备真正的智能化水平,更好地了解用户的喜好,根据语义识别,理解用户的环境和情绪状态。
就如上述谈到的,微软的车载ChatGPT,能支持更动态的对话,可以理解车主的语音命令,还可以进行交互式对话,与普通的语音助手不同,车载ChatGPT可以处理完整的对话,比如追问,并且能保持对前后文的理解。
再如百度推出的小度车载语音SDK,基于大模型本地化技术,它的体验更流畅,用户可以在任何位置、任何时间直接交流,没有交互屏障,不像原来要不断进行唤醒,真正做到全时免唤醒,不需要再唤醒。小度车载语音还支持多路同时交互,车内每个位置都有专属的服务语音交互,其背后比较大的挑战就是拒识能力,具体来说就是区分人是不是在和车说话,如果是和车说话,就应该有响应,如果不是和车说话,就应该忽略。
近几年,虽然众多企业都在大力研究推进自动驾驶的发展,然而其进展却相当缓慢。而ChatGPT的出现让业界似乎看到了新的希望。
业内人士认为,大模型可在算法、数据闭环、仿真等环节全面赋能自动驾驶。比如,在数据闭环和仿真环节,大模型的精准识别和数据挖掘以及数据生成能力可对数据挖掘、数据标注、以及仿真场景构建赋能。再比如,在模块化的算法部署模式下,感知算法、规控算法也可受到大模型的加强而实现感知精度和规控效果的提升。
小结
自从去年底ChatGPT出现以来,到目前为止,全球已经涌现出众多大模型产品,而接下来,该是拼落地应用的时候了。目前而言,汽车被认为是大模型一大重要的应用场景,包括智能座舱和自动驾驶,从目前的情况来看,业界在这方面已经有诸多尝试。可见,大模型能否给智能座舱带来升级、给自动驾驶带来新的突破,估计不久的将来就能见分晓。
-
奔驰
+关注
关注
1文章
411浏览量
23293 -
ChatGPT
+关注
关注
29文章
1558浏览量
7597
发布评论请先 登录
相关推荐
评论