0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

雷军:小爱同学5.0背后的人工智能

璟琰乀 来源:IT之家 作者:懒猫 2020-11-25 12:01 次阅读

在本月上旬举办的 2020 小米开发者大会上,小米发布发布小爱同学 5.0 版本。

小米集团副总裁、集团技术委员会主席崔宝秋此前表示,小爱同学将从过去的语音助手升级为智能生活助手。

IT之家了解到,今日上午,小米创办人,董事长兼 CEO 雷军发文表示,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,“小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手”。

以下为《雷军:小爱同学 5.0 背后的人工智能》全文:

在月初举办的 MIDC 开发者大会上,我们发布了最新一代的小爱同学——小爱同学 5.0。全新的小爱同学带来了五大升级,覆盖了囊括影音娱乐、生活服务、信息查询、出行路况等 8 大领域 1400 + 技能,成为大家生活中离不开的智能生活助手。

从 2017 年 3 月 21 日,“小爱同学”第一次与大家见面,到现在仅仅 4 年时间,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手。

新一代小爱同学 全新五大升级

新一代小爱同学的 5 大升级包括:全场景智能协同、对话式主动智能、定制化情感声音、多模态融合交互和智慧学习好助手。

小爱同学 5.0 全场景智能协同

目前,拥有 5 件及以上连接小米 AIoT 平台的设备用户已达 560 万。随着用户家中的智能设备越来越多,使用和操作也变得更加复杂。全场景智能协同就是让小爱同学 5.0 成为控制家中众多 IoT 设备的大脑,当你发出一条需求指令时,小爱同学会进行统一决策,家中多个设备进行协同配合,达到 “再多设备,都能化繁为简”的效果,是当之无愧的 “智能生活助手”。

想要达到智能协同,这其中需要解决的问题非常复杂。不仅要根据设备距离、活跃状态、形态等综合条件判断,自主选择出设备能力最能满足当前语义需求的设备,甚至还需要预测用户潜在的设备控制需求,适时主动的作出提醒和建议。

截止 2020 年 6 月,使用协同唤醒的总用户数已达 94.4 万,同时唤醒的拦截次数已达 9.4 亿。

小爱同学 5.0 对话式主动智能

有别于传统移动互联网 APP 或信息流被动猜测用户的形式,对话式主动智能产品形态是小爱同学以自己的方式和节奏与用户互动沟通,像人一样发起问题来增进对用户的了解。

主动对话本身就是高级智能的体现,它意味着人工智能不仅仅存在于与用户互动的短暂过程中,而是在更长的时间内不断的进行思考和计算,需要像人一样,拥有 “记忆”。

小爱同学 5.0 通过强大的自然语言处理技术,主动学习其中关于用户的知识,从而建立记忆。这有赖于小米自然语言处理技术(MiNLP)的深厚积累,MiNLP 目前已迭代到 3.0 版本,支持 30 多个业务场景,日调用次数达 80 亿。

在记忆的存储方面,小爱同学云端大脑会为用户建立多维度的个人画像,实现全设备个人信息互联互通。小爱同学的所有功能,会对内共享这些关于用户的 “记忆”,每次交互结合个人画像进行计算,产生出面向用户个人的个性化结果。

小爱同学 5.0 定制化情感声音

为了满足用户提出的,可以跨越地理、时间阻碍,随时随地就可以得到陪伴感的 “情感诉求”,小爱同学定制声音项目应运而生。

定制化情感声音的实现,不是仅依靠常规声音处理技术就可以做到的。首先需要能够对用户音频数据进行预处理。然后是提取关键声学特征,区别不同音色在频谱上的表现。最后是通过定制合成音库训练的基础模型,进行自适应学习,最终才能可实现只需少量的用户录音,就能取得很好的合成效果。

除了定制声音功能以外,小爱同学 5.0 针对粤语也进行了深度的优化,并在 8 月份开启了粤语在音箱上的内测。本月中旬,我们已正式启动在手机及电视上小爱同学粤语功能的内测,预计在月内,小爱同学粤语功能将陆续开放到所有音箱上。

小爱同学 5.0 智慧学习好助手

小爱同学 5.0 将学习作为一个重要的升级模块,整合了海量的优质的 K12 网课资源,精选 1000 + 网课视频资源,与读书郎、义方教育等 35 家优质资源方达成了合作,并拉通了电视 / 音箱 / 手机教育会员同步。

课程表是学生学习中最基本的一个工具类需求。我们把课程表与小爱同学结合在一起,打造了一个拥有国内首发 AI 拍照导入课程功能等先进人工智能技术加持的 AI 课程表。

另外一大工具,就是翻译。为了让翻译更高效、更精准,小爱同学团队在文本前处理模块进行了优化,包括基于语言规则和模型的文本顺滑技术、融合上文内容的实时文本纠错算法、基于多语言预训练模型的实时语义断句算法等。

小爱同学 5.0 多模态融合交互

为了让小爱同学与用户之间进行更自然的沟通,我们做了更智能的多模态融合交互,可以通过声音、肢体语言、信息载体(文字、图片、音频、视频)、环境等多种方式与智能设备进行交流。打破了传统 PC 式的键盘输入和智能手机的点触式交互,定义了下一代智能产品和人的专属交互模式。

新一代小爱同学背后 是小米 AI 能力的长期积累

小米集团拥有非常丰富的业务线,包含了硬件产品、电商和新零售以及互联网业务。小米的人工智能不仅仅体现在小爱同学上,还拥有非常广泛的应用领域,比如计算机视觉技术、计算机语音技术和机器学习技术等。经过这几年的努力,我们的 AI 已经建立了比较完整的能力图谱和小米的 AI 能力平台,在此基础上打造了小米的相关应用,包括智能相机、小爱同学、机器翻译等等。强大的智能硬件生态为 AI 能力的快速提升建立了基础,同时 AI 能力又反过来,全面赋能了小米各个业务线。

比如在计算机视觉技术方面,我们做了大量的工作,包括超级分辨率、文档模式 / OCR、魔法换天、魔法分身等。今年,我们的 HDR(高动态范围拍照)也助力小米 10 Pro / 至尊纪念版相机成功获得 DXOMARK 评测世界第一。

我们在计算机语音、机器学习等很多方面也都做了大量的工作,整个集团在人工智能领域的投入,可能远远超过大家的想象。截止 2019 年 12 月 31 日,小米集团共提交专利申请 33000 余件,其中 AI 领域专利申请数量已进入全球互联网企业第一阵营。包括端到端语音识别、就近唤醒、分布式放音、离线翻译等在内的多项技术处于行业一流水平。

同时,我们也在积极引入全球顶尖的研发人才,比如我们成功邀请到了人工智能领域的顶尖专家 Daniel Povey 加入小米。

未来,小米的人工智能会进一步打造核心技术,推进各项 AI 技术的业务落地,给用户打造更好的体验。同时,也会更加的开放,继续加强和高等院校科研院及其企业的合作,将更多更好的 AI 技术开放给社会,为每一个人带来更美好的和智能的生活。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29640

    浏览量

    267981
  • 人工智能
    +关注

    关注

    1789

    文章

    46566

    浏览量

    236890
  • 小米
    +关注

    关注

    69

    文章

    14300

    浏览量

    143662
收藏 人收藏

    评论

    相关推荐

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    周末收到一本新书,非常高兴,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 《AI for Science:人工智能驱动科学创新》这本书的第一章,作为整个著作的开篇
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    长时间运行或电池供电的设备尤为重要。 高性能 : 尽管RISC-V架构以低功耗著称,但其高性能也不容忽视。通过优化指令集和处理器设计,RISC-V可以在处理复杂的人工智能图像处理任务时表现出色。 三
    发表于 09-28 11:00

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    ! 《AI for Science:人工智能驱动科学创新》 这本书便将为读者徐徐展开AI for Science的美丽图景,与大家一起去了解: 人工智能究竟帮科学家做了什么? 人工智能将如何改变我们所生
    发表于 09-09 13:54

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    8月28日至30日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会将在深圳国际会展中心(宝安)举办。大会以“魅力AI·无限未来”为主题,致力于打造全球通用人工智能领域集产品
    发表于 08-22 15:00

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    Python中的人工智能框架与实例

    人工智能(AI)领域,Python因其简洁的语法、丰富的库和强大的社区支持,成为了最受欢迎的编程语言之一。本文将详细介绍Python中的人工智能框架,并通过具体实例展示如何使用这些框架来实现不同的人工智能应用。
    的头像 发表于 07-15 14:54 1455次阅读

    小米AI助手小同学接入字节豆包大模型

    人工智能领域的浪潮中,小米旗下的人工智能助手“小同学”再次迈出坚实的一步,与字节跳动旗下的火山引擎达成深度战略合作。双方基于火山引擎精心打造的豆包大模型,共同为用户带来了更为
    的头像 发表于 06-14 17:26 1937次阅读

    小米小同学携手火山引擎,共启智能新篇章

    在数字化浪潮汹涌的今日,人工智能技术的发展日新月异,其应用场景也在不断拓宽。近日,科技界的这一趋势又迎来了一次重要的里程碑事件——小米旗下备受用户喜爱的人工智能助手“小同学”与字节跳
    的头像 发表于 06-13 15:33 676次阅读

    阿里云通义大模型助力“小同学”强化多模态AI生成能力

    小米的人工智能助手“小同学”近期与阿里云通义大模型达成战略合作,共同提升其多模态AI生成能力,特别是在图片生成与理解方面。这次合作不仅将强化“小
    的头像 发表于 05-13 09:19 698次阅读

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    课程类别 课程名称 视频课程时长 视频课程链接 课件链接 人工智能 参赛基础知识指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:参赛基础知识指引
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
    发表于 02-26 10:17

    同学AI助手已通过大模型备案

    小米公关部总经理王化在微博上宣布,小同学AI助手已经成功通过大模型备案。这一里程碑式的进展标志着小同学人工智能领域又迈出了坚实的一步,
    的头像 发表于 02-06 16:34 5565次阅读

    身边的人工智能有哪些

    身边的人工智能有哪些  身边的人工智能应用已经渗透到了我们日常生活的方方面面。从智能手机中的语音助手到智能家居设备,人工智能正逐渐改变着我们
    的头像 发表于 12-07 16:32 3272次阅读

    人工智能大模型、应用场景、应用部署教程超详细资料

    丰富的选择。 此次推出的人工智能模型主要包括:Adain 风格迁移模型、Conformer 模型、DeeplabV模型、Fastdepth 模型、LaneAF-ERFNet 模型、Lenet 模型
    发表于 11-13 14:49