0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第六代微软小冰发布,对话引擎、全双工语音和实时视觉相融合

Qp2m_ggservicer 来源:未知 作者:工程师郭婷 2018-07-31 15:08 次阅读

第六代微软小冰正式发布,相比与以往的低调,此次微软小冰六代的发布会现场格外盛大。

小冰是微软亚洲研究院在2014年5月在中国推出的人工智能聊天机器人,也是知名的虚拟形象之一,如今已进化到第六代。此外,小冰还改头换面,彻底抛弃了以前的形象,并且由 2D 变成了 3D(如下图所示)。

第六代小冰核心对话引擎与交互感官的升级

小冰项目负责人李笛介绍,微软的目标就是让小冰成为一个高情商的机器人:从有趣、到有情绪、到能探测、到能占据主动。微软最新推出了全新的共感模型,它融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。

共感模型是一种基于生成模型的对话引擎。微软在去年的第五代小冰发布会上,首次正式完成生成模型的产品化,该模型的特点,通俗地说,就是小冰可以自创她的回应,而不需要从已有的对话语料库中检索而得。在生成模型的基础上,共感模型能够进一步提高小冰对于对话内容、领域和节奏的控制力,也即小冰可以通过自创回应,来牵引对话向她所希望的方向进行。微软宣布已经完成共感模型的测试,今日起,共感模型将在微软小冰所覆盖的五个国家正式上线。

在去年八月份举行的第五代小冰发布会上,微软宣布已完成全双工语音(Full Duplex Voice)交互感官的产品化,并在打电话和智能音箱设备两个场景中落地。

微软在今年发布会上宣布开始公开测试的这个新感官,是融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。微软在发布会现场放置了用于体验的测试设备。在该测试设备中,小冰可以通过视觉、语音的实时连续交互,指挥用户完成面容检测,并可在上述过程中进行开放域的对话。微软预计该感官将于一年内完成全部产品化工作。

第六代小冰在人工智能创造(AI Creation)方面的技术和产业化进展

微软认为,利用人工智能技术,学习人类并进行与人类质量水平相当的内容创造,是重要的、但目前尚未被行业注意到的未来趋势。目前,微软小冰已通过人工智能技术,实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成,以及电视电台节目和可交互式电台等串流内容领域的生成工作,并分别完成了不同程度的落地。

2018年6月,微软(亚洲)互联网工程院成立人工智能创造事业部,旨在进一步推动微软小冰在人工智能创造这一内容领域的生产线搭建及产业化落地等工作。

微软还发布了新的第四版人工智能歌曲DNN模型,从而展示了微软在这一领域领先于世界的技术优势。与前三个版本的技术相比,第四版能够进一步快速合成与人类歌手质量相当的歌曲,并能够使人工智能小冰自由吸收多数人类歌手的演唱技巧,融会贯通,在演唱过程中达成更加成熟的演绎。此外,该技术还能够完整吸收并复制特定人类歌手的全部演唱特质(嗓音、韵律等),使小冰能完全代替原人类歌手完成新作品的创作。目前,微软在这一领域的技术研究和产品化,均居于全球领导地位。

微软宣布与多个领先的大众文化公司合作,已经完成部分人类歌手的人工智能化工作。在发布会上,微软演示了最新版本的小冰在唱歌上取得的成绩。

第六代小冰的Dual AI战略

小冰产品负责人彭爽解释道:“在这样一个半开放生态环境上,一方面我们会直接负责产品体验,也就是说我们会直接把控最具体的、直接和用户接触的产品细节,另一方面我们又不封闭在一个自有平台上,而是走出去接触,甚至直接融入到第三方平台上,这样就形成了一个完整的半开放生态环境。”

具体来说,微软会根据已有合作伙伴的实践,将该战略的实施分为三个部分:首先,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI。其次,微软小冰作为该合作平台的辅助AI,融入该平台生态。第三,微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6447

    浏览量

    103262
  • 机器人
    +关注

    关注

    208

    文章

    27396

    浏览量

    202360
  • 人工智能
    +关注

    关注

    1781

    文章

    44946

    浏览量

    232361

原文标题:GGAI 头条 | 微软小冰6代出道:是时候表演一下惊人的唱歌本领了

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    esp32 wroom 32d是半双工还是全双工的?

    我的疑问有几个: 1. esp32 wroom 32d是半双工还是全双工的? 2. 链路层在状态机切换的时候,比如在广播态发广播包的时候,一个广播事件还没结束,状态机能切换到扫描态吗? 3. 一个
    发表于 06-18 06:15

    全双工与半双工技术解析

    ,即A到B的同时可以B到A。这种通信方式极大地提高了数据传输的效率和实时性。在手机通信中,全双工模式的应用尤为突出,使得电话的两边的人在同一时刻都可以说话发送数据,实现了真正的双向通信。 全双工模式的优点在于能够实现高
    的头像 发表于 06-16 10:18 207次阅读

    谷歌发布第六代TPU芯片Trillium,挑战GPT-4o

    分析人士认为,谷歌积极推进自主研发芯片,按照其规划,第七代和第八代产品将分别与联发科、世芯合作生产。此次第六代TPU的推出,有望引领CSP(云端服务提供商)厂商投入自研芯片领域。
    的头像 发表于 05-16 18:05 908次阅读

    全双工与半双工技术解析及其应用场景

    及适用场景。 一、全双工模式 全双工模式允许数据在通信链路的两个方向上同时进行传输,即A到B的同时可以B到A。这种通信方式极大地提高了数据传输的效率和实时性。在手机通信中,全双工模式的
    的头像 发表于 05-11 15:29 270次阅读

    全双工音频对讲模块-支持空中升级、多级无线中继

    ,支持OTA空中升级。SA618F30配备1W功率,支持8通道数据和全双工通信。全双工实时双向通信方式,使得对讲者可以更快地交换想法、传递信息。为了提供更好的音质对话
    的头像 发表于 05-08 17:13 214次阅读
    <b class='flag-5'>全双工</b>音频对讲模块-支持空中升级、多级无线中继

    以太网中用交换机为什么能全双工传输呢?

    以太网中用交换机为什么能全双工传输呢? 以太网是一种局域网传输协议,常用于连接计算机和其他网络设备。以太网使用交换机作为网络集线器,能够实现全双工传输。本文将详细介绍全双工传输的原理和以太网中使
    的头像 发表于 02-20 14:41 616次阅读

    恩智浦发布新一代智能语音技术组合的语音识别引擎

    恩智浦发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、恩智浦新的Speech to Inten
    的头像 发表于 01-26 09:15 308次阅读
    恩智浦<b class='flag-5'>发布</b>新一代智能<b class='flag-5'>语音</b>技术组合的<b class='flag-5'>语音</b>识别<b class='flag-5'>引擎</b>

    双工全双工通信模式的比较

    双工全双工通信模式的比较  半双工全双工是两种不同的通信模式,在不同的通信需求下,它们各有优劣。下面,我将详细介绍半双工
    的头像 发表于 01-09 14:00 1001次阅读

    网络传输单工、半双工全双工的解读

    在网络传输中,数据在线路上的传送方式可以分为单工通信、半双工通信和全双工通信三种。
    的头像 发表于 11-24 16:33 1427次阅读
    网络传输单工、半<b class='flag-5'>双工</b>、<b class='flag-5'>全双工</b>的解读

    芯片设计中半双工全双工数据传输的区别

    在现代通信技术中,半双工全双工数据传输是两种常见的数据传输方式。本文将为大家详细解析这两种传输方式在芯片设计中的应用和区别,帮助大家更好地理解芯片设计中的通信原理。
    发表于 11-19 11:31 540次阅读

    骑行头盔多人全双工通话对讲方案

    骑行头盔多人全双工通话对讲方案 本方案采用全新的无线全双工对讲芯片模块+高音频通话的高通蓝牙芯片模块+高速消风噪芯片模块等组成的高性能高品质多人全双工通话对讲产品应用。 应用领域:骑行头盔对讲、多人对讲户外运动产品、
    的头像 发表于 10-28 15:39 1219次阅读
    骑行头盔多人<b class='flag-5'>全双工</b>通话对讲方案

    AT32F4xx SPI使用全双工模式通讯

    AT32F4xx SPI使用全双工模式通讯演示AT32F403Axx SPI使用全双工模式通讯,其余系列的使用方式与此类似。
    发表于 10-27 07:27

    RS422是全双工通信还是半双工通信?

    RS422到底是全双工还是半双工
    发表于 10-12 06:15

    谈起对讲机为什么大家都在谈论全双工对讲

    全双工是一种通信传输的术语,指的是在通信的双方可以同时进行双向的通信,即可以同时发送和接收信息。在全双工对讲中,双方可以同时进行发言和听取对方的发言。这意味着在双方可以实时地进行交流,无需等待对方
    的头像 发表于 08-26 16:11 1279次阅读
    谈起对讲机为什么大家都在谈论<b class='flag-5'>全双工</b>对讲

    Emulex和博科产品的第六代光纤通道评估

    电子发烧友网站提供《Emulex和博科产品的第六代光纤通道评估.pdf》资料免费下载
    发表于 08-23 15:19 0次下载
    Emulex和博科产品的<b class='flag-5'>第六代</b>光纤通道评估