0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第六代微软小冰发布,对话引擎、全双工语音和实时视觉相融合

Qp2m_ggservicer 来源:未知 作者:工程师郭婷 2018-07-31 15:08 次阅读

第六代微软小冰正式发布,相比与以往的低调,此次微软小冰六代的发布会现场格外盛大。

小冰是微软亚洲研究院在2014年5月在中国推出的人工智能聊天机器人,也是知名的虚拟形象之一,如今已进化到第六代。此外,小冰还改头换面,彻底抛弃了以前的形象,并且由 2D 变成了 3D(如下图所示)。

第六代小冰核心对话引擎与交互感官的升级

小冰项目负责人李笛介绍,微软的目标就是让小冰成为一个高情商的机器人:从有趣、到有情绪、到能探测、到能占据主动。微软最新推出了全新的共感模型,它融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。

共感模型是一种基于生成模型的对话引擎。微软在去年的第五代小冰发布会上,首次正式完成生成模型的产品化,该模型的特点,通俗地说,就是小冰可以自创她的回应,而不需要从已有的对话语料库中检索而得。在生成模型的基础上,共感模型能够进一步提高小冰对于对话内容、领域和节奏的控制力,也即小冰可以通过自创回应,来牵引对话向她所希望的方向进行。微软宣布已经完成共感模型的测试,今日起,共感模型将在微软小冰所覆盖的五个国家正式上线。

在去年八月份举行的第五代小冰发布会上,微软宣布已完成全双工语音(Full Duplex Voice)交互感官的产品化,并在打电话和智能音箱设备两个场景中落地。

微软在今年发布会上宣布开始公开测试的这个新感官,是融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。微软在发布会现场放置了用于体验的测试设备。在该测试设备中,小冰可以通过视觉、语音的实时连续交互,指挥用户完成面容检测,并可在上述过程中进行开放域的对话。微软预计该感官将于一年内完成全部产品化工作。

第六代小冰在人工智能创造(AI Creation)方面的技术和产业化进展

微软认为,利用人工智能技术,学习人类并进行与人类质量水平相当的内容创造,是重要的、但目前尚未被行业注意到的未来趋势。目前,微软小冰已通过人工智能技术,实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成,以及电视电台节目和可交互式电台等串流内容领域的生成工作,并分别完成了不同程度的落地。

2018年6月,微软(亚洲)互联网工程院成立人工智能创造事业部,旨在进一步推动微软小冰在人工智能创造这一内容领域的生产线搭建及产业化落地等工作。

微软还发布了新的第四版人工智能歌曲DNN模型,从而展示了微软在这一领域领先于世界的技术优势。与前三个版本的技术相比,第四版能够进一步快速合成与人类歌手质量相当的歌曲,并能够使人工智能小冰自由吸收多数人类歌手的演唱技巧,融会贯通,在演唱过程中达成更加成熟的演绎。此外,该技术还能够完整吸收并复制特定人类歌手的全部演唱特质(嗓音、韵律等),使小冰能完全代替原人类歌手完成新作品的创作。目前,微软在这一领域的技术研究和产品化,均居于全球领导地位。

微软宣布与多个领先的大众文化公司合作,已经完成部分人类歌手的人工智能化工作。在发布会上,微软演示了最新版本的小冰在唱歌上取得的成绩。

第六代小冰的Dual AI战略

小冰产品负责人彭爽解释道:“在这样一个半开放生态环境上,一方面我们会直接负责产品体验,也就是说我们会直接把控最具体的、直接和用户接触的产品细节,另一方面我们又不封闭在一个自有平台上,而是走出去接触,甚至直接融入到第三方平台上,这样就形成了一个完整的半开放生态环境。”

具体来说,微软会根据已有合作伙伴的实践,将该战略的实施分为三个部分:首先,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI。其次,微软小冰作为该合作平台的辅助AI,融入该平台生态。第三,微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6565

    浏览量

    103947
  • 机器人
    +关注

    关注

    210

    文章

    28189

    浏览量

    206454
  • 人工智能
    +关注

    关注

    1791

    文章

    46838

    浏览量

    237496

原文标题:GGAI 头条 | 微软小冰6代出道:是时候表演一下惊人的唱歌本领了

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    联想推出第六代垂直液冷技术AI服务器

    在今日举办的联想2024年度全球创新盛会Tech World上,联想集团震撼发布了其第六代Neptune垂直液冷产品——ThinkSystem N1380 Neptune,这款产品专为生成式AI计算量身打造,再次彰显了联想在高性能计算和液冷技术领域的卓越实力与创新能力。
    的头像 发表于 10-16 17:15 604次阅读

    SK海力士开发出第六代10纳米级DDR5 DRAM

    SK海力士宣布了一项重大技术突破,成功开发出全球首款采用第六代10纳米级(1c)工艺的16Gb DDR5 DRAM。这一里程碑式的成就标志着SK海力士在半导体存储技术领域的领先地位。
    的头像 发表于 08-29 16:39 633次阅读

    字节跳动豆包大模型已支持实时语音通话

    字节跳动火山引擎今日隆重推出创新对话式AI实时交互解决方案,该方案以火山方舟大模型服务平台为核心,全面升级语音交互体验。该方案深度融合火山
    的头像 发表于 08-12 16:13 687次阅读

    单工、半双工全双工传输模式的区别

    传输模式主要分为单工(Simplex)、半双工(Half-Duplex)和全双工(Full-Duplex)。这三种模式在数据传输能力、通信效率和应用场景等方面存在显著差异。
    的头像 发表于 08-07 14:32 923次阅读

    全双工与半双工技术解析

    A到B的同时可以B到A。这种通信方式极大地提高了数据传输的效率和实时性。在手机通信中,全双工模式的应用尤为突出,使得电话的两边的人在同一时刻都可以说话发送数据,实现了真正的双向通信。 全双工模式的优点在于能够实现高
    的头像 发表于 06-16 10:18 701次阅读

    百度携手江铃新能源推出第六代Robotaxi车型

    百度近日宣布,其自动驾驶出租车业务“萝卜快跑”正式推出第六代车型——颐驰06,这是百度Apollo与江铃新能源的联合力作。新车出厂价定为20.46万元,首批交付量高达1000辆。
    的头像 发表于 05-20 14:36 2828次阅读

    谷歌发布第六代TPU芯片Trillium,挑战GPT-4o

    分析人士认为,谷歌积极推进自主研发芯片,按照其规划,第七和第八产品将分别与联发科、世芯合作生产。此次第六代TPU的推出,有望引领CSP(云端服务提供商)厂商投入自研芯片领域。
    的头像 发表于 05-16 18:05 1349次阅读

    百度Apollo推出第六代无人车颐驰06,定价为20.46万元,萝卜快跑

     据悉,颐驰 06 搭载了百度 Apollo 第六代智能化系统解决方案,配备了 7 类共 40 个传感器,计算平台算力高达 1200 Tops,且具备全方位安全冗余功能。
    的头像 发表于 05-15 11:39 933次阅读

    谷歌将推出第六代数据中心AI芯片Trillium TPU

    在今日举行的I/O 2024开发者大会上,谷歌公司震撼发布了其第六代数据中心AI芯片——Trillium Tensor处理器单元(TPU)。据谷歌首席执行官皮查伊透露,这款新型TPU预计在年内交付,届时将带来前所未有的计算性能飞跃。
    的头像 发表于 05-15 11:18 593次阅读

    全双工与半双工技术解析及其应用场景

    及适用场景。 一、全双工模式 全双工模式允许数据在通信链路的两个方向上同时进行传输,即A到B的同时可以B到A。这种通信方式极大地提高了数据传输的效率和实时性。在手机通信中,全双工模式的
    的头像 发表于 05-11 15:29 1187次阅读

    全双工音频对讲模块-支持空中升级、多级无线中继

    ,支持OTA空中升级。SA618F30配备1W功率,支持8通道数据和全双工通信。全双工实时双向通信方式,使得对讲者可以更快地交换想法、传递信息。为了提供更好的音质对话
    的头像 发表于 05-08 17:13 477次阅读
    <b class='flag-5'>全双工</b>音频对讲模块-支持空中升级、多级无线中继

    小马智行第六代自动驾驶车型在京开启全无人载客测试

    小马智行近日宣布,其搭载第六代L4自动驾驶软硬件系统的丰田赛那自动驾驶乘用车(Robotaxi)已经获得在北京进行“车内无人,车外远程”自动驾驶载人示范应用的许可。这一里程碑式的进展标志着小马智行在自动驾驶技术领域的持续突破和领先地位。
    的头像 发表于 02-18 11:12 770次阅读

    恩智浦发布新一智能语音技术组合的语音识别引擎

    恩智浦发布新一智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑
    的头像 发表于 01-26 09:15 716次阅读
    恩智浦<b class='flag-5'>发布</b>新一<b class='flag-5'>代</b>智能<b class='flag-5'>语音</b>技术组合的<b class='flag-5'>语音</b>识别<b class='flag-5'>引擎</b>

    双工全双工通信模式的比较

    双工全双工通信模式的比较  半双工全双工是两种不同的通信模式,在不同的通信需求下,它们各有优劣。下面,我将详细介绍半双工
    的头像 发表于 01-09 14:00 1689次阅读

    网络传输单工、半双工全双工的解读

    在网络传输中,数据在线路上的传送方式可以分为单工通信、半双工通信和全双工通信三种。
    的头像 发表于 11-24 16:33 3156次阅读
    网络传输单工、半<b class='flag-5'>双工</b>、<b class='flag-5'>全双工</b>的解读