0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从方言对话这枚“落子”,看AI手机“棋局”的尴尬赛点

脑极体 来源: 脑极体 作者: 脑极体 2024-11-01 09:21 次阅读
wKgZomcjjr6AagLxAAnjENBQWHs894.jpg

这段时间,手机厂商的新品发布会、开发者活动比较密集,我们团队东奔西跑,整体感觉是,手机AI确实火了,但这盘棋局,所有厂商都对弈得不太轻松。

一方面,各家都在想尽办法讲好AI故事。一位CEO在发布会后采访时就特别烦恼,“AI要讲场景,不讲场景用户没感觉,明年我们还要上很多新功能,发布会的两个小时根本讲不完”。这是手机AI越来越完善的一面。

但同时我们也发现,大家手里的牌其实都差不多,很少有哪家能靠一个或某个AI功能,就形成碾压级的体验优势。结果就是单点功能容易被复制,AI手机功能趋同。我就听过至少三个厂商表示:我们这个xx功能去年一推出就被致敬了,欢迎友商来“普及”我们这个AI功能……

假设AI手机市场是围棋对弈,观众们想看什么样的比赛过程?肯定是棋手们通过各种复杂的策略,展开激烈的劫争,才能吸引大家的注意力。而不是各方实力差不多,导致比赛过程冗长乏味、难分胜负。目前的AI手机竞争,就有点后者的意思。

在大众对AI手机这一概念的兴奋劲儿过去之前,手机厂商们必须尽快找到更聚焦的策略和体系化攻势,而不能只关注浅层的、零敲碎打的AI功能。

举个例子,方言对话,就不是AI手机的一步好棋。

wKgZomcjjr6AWyFcAAJSJrZPJFc873.jpg

首先要说明的是,方言的识别、理解与生成、交互是非常重要,甚至不容有失的一个领域。

从技术能力上看,方言的语言资料少,语音识别、语义理解、语音合成等模型的打磨,也比普通话等主流语种要更复杂、成本更高,是比较能体现科技公司实力的。

从社会效益上看,国内还有20%群体没有完成普通话的普及,确实有很多人存在方言对话的需求。而且,随着大模型的到来,低资源的方言如果不能被大语言模型所学习和训练,很可能越来越弱势,甚至消失。所以,从科技普惠、文化保护的角度,方言对话也是十分必要的。

今年的几个手机厂商活动中,我们就看到了方言对话成为手机AI的一个典型用例。其中应用场景包括:

1.方言的语音理解。普通话不标准的用户发出的方言指令,也能被手机智能助手很好地理解。

2.方言的语音生成。手机智能助手可以用本地方言跟用户聊天,播报新闻等,提供更个性化、更温暖的服务。

上述功能当然是有用的,但从市场策略上来说,方言对话真的是手机厂商在AI领域的一步好棋吗?未必。

wKgZomcjjr-AeAa3AAIZFSSFEBA470.jpg

之所以说方言对话不是一步好棋,答案在于,市场策略的低效性

无论是短期或长期,手机厂商想靠方言对话来带动AI手机市场,都是一件挺困难的事情。

短期看,市场营销最看重的就是“效果”,即激发消费者的行动,这就要进行好的CTA(Call To Action,行动呼吁)设计。

比如传统电视广告会呼吁“赶快拿起电话订购吧”,网页时代会将“click”“立即咨询”等按钮放在最显眼的地方,而近期手机厂商也意识到AI很难被用户感知,开始营造场景化、现场感的氛围,来让观众们身临其境。

那么,方言对话的用例展示,能够让用户做出关注、搜索、试用、购买等商业想要的行为吗?显然是很低效的。

“AI手机”的受众大多是对前沿技术、新锐功能比较感兴趣的年轻群体、极客、潮人等,普通话普及率是比较高的,方言对话固然有趣、有人情味儿,但并不会高频使用,所以转化到购买行为的概率很低。

当然,也许有人会说,方言对话很能彰显手机厂商的技术实力和人文关怀啊,这对品牌来说是一种长期利好,没错,但前提是手机厂商能在方言领域建立长期壁垒,而这几乎不可能。

一是成本很高。语音识别、理解依赖于大规模语料数据,而方言数据的采集和标注成本比普通话更高。有业内人士分享,传统单一方言的识别,需要十万小时的标注数据量才能获得比较好的效果。这意味着,手机厂商要投入极高的研发成本,去开发一个市场前景未知的小众功能。

二是技术挑战。即使有的手机厂商愿意在方言领域的耐心投入,但能否建立壁垒也要打一个问号。

wKgZomcjjsCAR3x_AAIG-h1DZr4308.jpg

目前,基础模型厂商如科大讯飞(星火大模型V4.0)、商汤科技(商量SenseChat粤语版大模型)、阿里通义实验室(粤语识别与生成大模型),基础服务商如中国电信(星辰大模型)、字节跳动(豆包大模型)、喜马拉雅(珠峰AI音频多模态大模型)等,都推出了自研的、具备方言能力的语音大模型,手机厂商想要在这一技术赛道上做到“人有我优”并不容易。友商通过基于开源模型自研或与闭源模型合作等形式,就能补齐相关能力。

wKgaomcjjsCAfqnFAAEW92OF1RA779.jpg

所以,想要靠方言能力建立壁垒,长期为品牌价值赋能,很难做到,投资效益比也要打一个问号。

总结一下,从短期市场行动到长期品牌价值上,方言对话带来的贡献都很有限,算是一个低效落子。

其实,类似方言对话这样零敲碎打的AI功能还有不少。这暴露了AI手机目前的一个尴尬处境,就是趋势向好、细节模糊。AI应用到底怎么做?这是很多厂商还没有想好的问题。

wKgZomcjjsGAOkIeAAJiE87jc8M174.jpg

越来越多的AI功能加入手机,却面对一种硬件新品的阶段性困境:

需求模糊,必然有大量AI功能注定失败。

AI大模型作为一种新技术,用户根本不知道怎么用,甚至手机厂商、产品经理们自己也不知道。以“产品成熟时才发布”而著称的苹果,在这一轮AI浪潮中行动也是头部厂商中最慢的。这种情况下,很多AI功能是厂家根据模糊的需求或自己的产品定义拿出的探索方案,其中必然会有很多是注定失败或被遗忘的。

多点开花,难以产生压倒性的说服力。

AI+手机相结合的场景众多,手机厂商在探索中很容易多点开花,如果不成体系,就很难形成具有压倒性说服力的产品。在消费理性化的市场环境下,结果就是无法激发用户的购买欲望。一个AI功能,A厂商有,B厂商很快也能推出,既然“等等党永远不亏”,那就干脆持币以待。

方言对话,就恰好是这样一种很难拉开差距的AI功能。

整体来看,相比去年,手机中的AI应用数量,有了极大增长,场景也越来越多,从简单的文生文、文生图能力展示,与输入法、摄影、系统设置、出行服务、点餐等诸多场景都有了结合。AI作为撬动手机新一轮换机潮的关键,越来越受到了用户、媒体与分析师的认可。

面对整体向好、细节模糊的“AI手机”大趋势,手机厂商当下最需要的就是聚焦。用更清晰、体系化的产品策略来展开市场攻势,一鼓作气形成突破,快速完成对细分市场份额的占有。

比如给方言对话这一步散棋出个主意,用“让父母大胆开口说”来撬动中青年群体为长辈换机,这就需要:

1.产品精细化,在语音大模型的基础能力上,开发出中老年高频用机场景下,具有说服力的方言产品,比如方言取消续费套餐,方言搜索影视剧内容等。

2.能力体系化,除了方言对话,结合中老年用机需求,形成组合攻势。比如AI反诈、手机自动驾驶主动服务、适老化功能等,全面解决目标群体的用机困扰。

3.营销情境化,AI作为一种通用软件技术,大众还是难以理解,通过场景化、故事化的营销方式,更容易激发用户的代入感,产生兴趣和后续的行为。这就要求手机厂商改变与用户沟通的方式,从比参数、放demo、碾压友商、价格刺激等短平快式输出,转变为情境化的语言。

通过方言对话这一个AI用例,我们会发现AI手机的棋局才刚刚开始。手机作为最适合AI落地的硬件载体,行业正逐步收敛与聚焦,接下来更清晰有力的体系化AI能力与策略会逐步登场。

从一个个AI功能的零敲碎打,到体系化AI能力的强势出击,届时不同厂商也将拉开显著差距。

高水平的激烈劫争,是一场围棋赛最精彩的部分,我们会继续为大家解说大模型时代的手机赛事。

wKgaomcjjsKAGWcjAAGokTUd1v8968.jpg
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30348

    浏览量

    268602
  • ai手机
    +关注

    关注

    0

    文章

    43

    浏览量

    3247
收藏 人收藏

    评论

    相关推荐

    国芯科技携手昉科技发布高性能AI MCU芯片

    近日,国芯科技再次传来喜讯,国芯科技与广东昉科技有限公司(以下简称“昉科技”)合作研发的高性能AI MCU芯片产品CCR7002已成功通过了内部性能和功能测试,实现了RISC-V
    的头像 发表于 11-25 10:11 166次阅读

    一杆有AI的路灯:感知环境监测路况还能“对话”无人驾驶AI灯杆屏

    一杆有AI的路灯:感知环境监测路况还能“对话”无人驾驶AI灯杆屏
    的头像 发表于 11-15 09:45 268次阅读
    一杆有<b class='flag-5'>AI</b>的路灯:感知环境监测路况还能“<b class='flag-5'>对话</b>”无人驾驶<b class='flag-5'>AI</b>灯杆屏

    AI对话魔法 Prompt Engineering 探索指南

    Engineering 就是设计和优化与AI对话的“提示词”或“指令”,让AI能准确理解并提供有用的回应。 Prompt Engineering 主要包括以下几个方面: 1.明确目标:希望A
    的头像 发表于 11-07 10:11 719次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>对话</b>魔法 Prompt Engineering 探索指南

    手机行业AI竞赛步入新阶段:颠覆到体验提升

    自去年以来,手机行业掀起了一场生成式人工智能(AIGC)的竞赛热潮,各大厂商纷纷加大AI技术的研发力度。然而,经过近一年的发展,AI手机已逐渐
    的头像 发表于 10-23 11:36 303次阅读

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟
    发表于 09-09 15:36

    力斯获数百问界系列商标

    近日,华为技术有限公司与赛力斯汽车有限公司的商标转让事宜引发广泛关注。据天眼查知识产权信息最新披露,华为已将持有的数百“问界”、“AITO”、“AITO SELECT”及“DESIGN
    的头像 发表于 09-02 16:50 548次阅读

    AI奥运 | 巴黎奥运会看人工智能的应用和发展

    2024巴黎奥运会火热空前,开幕式到金牌争夺战,本届奥运会的关注热度持续攀升。与往届不同的是,本届奥运会不仅是首次在体育场馆外举办的户外开幕式的奥运会,同时也是在转播技术上首次广泛应用AI技术
    的头像 发表于 08-09 16:17 942次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>看</b>奥运 | <b class='flag-5'>从</b>巴黎奥运会看人工智能的应用和发展

    【AIBOX快速入门】2步玩转AI对话

    随着目前AI的高速发展,大批量AI硬件应运而生,但使用门槛普遍较高。为了解决这类问题,Firefly开源团队推出了基于Web的AI对话应用:FireflyChat,让
    的头像 发表于 05-30 08:02 516次阅读
    【AIBOX快速入门】2步玩转<b class='flag-5'>AI</b><b class='flag-5'>对话</b>

    中国电信发布首个支持30种方言混说语音大模型

    中国电信人工智能研究院(TeleAI)近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自由混说识别,打破了传统单一模型只能识别特定方言的局限。
    的头像 发表于 05-28 09:14 550次阅读

    Vidda两个“进球”,拿下高端智能显示终端的中场

    高端智能显示终端“中场”,Vidda踢出两个“进球”
    的头像 发表于 05-17 14:11 411次阅读
    Vidda两个“<b class='flag-5'>赛</b><b class='flag-5'>点</b>进球”,拿下高端智能显示终端的中场<b class='flag-5'>赛</b>

    开发者手机 AI - 目标识别 demo

    Lite的API接口实现主要功能; Mindspore Lite为Openharmony AI推理框架,为上层应用提供统一的AI推理接口,可以完成在手机等端侧设备中的模型推理过程; Neural
    发表于 04-11 16:14

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日发布了一项令人瞩目的新功能,它是一款能够借助自然语言对话帮助用户生成旅行行程和出游建议的AI工具。这款工具的推出,标志着谷歌在人工智能领域的又一重要突破。
    的头像 发表于 03-29 11:08 636次阅读

    百度地图AI向导用户破亿,日均提供超千万次对话

    百度地图AI向导用户破亿,日均提供超千万次对话
    的头像 发表于 03-21 09:44 381次阅读
    百度地图<b class='flag-5'>AI</b>向导用户破亿,日均提供超千万次<b class='flag-5'>对话</b>

    用于对话AI的高性能MEMS麦克风,助力改进用户体验

    对话式人工智能(AI)是一个快速发展的机器学习(ML)领域,旨在使人机交互更加自然直观。
    的头像 发表于 03-12 09:44 808次阅读
    用于<b class='flag-5'>对话</b>式<b class='flag-5'>AI</b>的高性能MEMS麦克风,助力改进用户体验

    CES 2024AI PC江湖

    CES 2024有闭幕的一天,但这场名为AI的PC产业协奏,才初试啼声
    的头像 发表于 01-13 14:53 1883次阅读
    <b class='flag-5'>从</b>CES 2024<b class='flag-5'>看</b><b class='flag-5'>AI</b> PC江湖