0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能伴侣虚拟机器人小冰的技术解读

电子工程师 2018-06-17 22:25 次阅读

三百六十行,行行出状元。在众多行业中有这么一个行业迎来了一位“新人”——微软小冰。

作为一款人工智能伴侣虚拟机器人的小冰,去了歌唱界。不仅发表个人单曲,还参与作词作曲,经历了五次迭代的微软小冰,现在已经成为一个会作曲会唱歌的全能型艺人。

▌作曲写诗写词样样精通

2017 年,微软出版了一本由小冰原创的诗集《阳光失了玻璃窗》,这是第一部 100% 由人工智能创造的诗集。在写诗之后,小冰还创作不同类型的文体,填词,唱歌,发表个人单曲等。

据介绍,小冰创作的基本原理有两大块,一块是他需要学习前人的作品,包括上千位诗人的诗集、上千万行歌词等等。第一步,训练深度神经网络的模型;第二步,有了一定的模型之后,需要给她一个触发源,工程师们称为创作冲动。

创作冲动有不同的方式,给出一张图片或文字,基于图片里的元素或文字内容的理解去创作,例如知乎上的海量回答,学习知乎预料大数据作为触发源,基于一个训练好的模型,生成对应的歌词。

值得注意的是,在小冰发布的单曲中,还听到有模拟真人呼吸的声音,据微软(亚洲)互联网工程院微软小冰首席语音科学家栾剑表示,主要是因为考虑到大众的习惯,没有换气可能会让人听着感觉很累,因为有些时候发烧友会跟着哼唱,没有呼吸换气的地方,会觉得不太舒服。

在技术上实现呼吸换气主要分为两个模块,第一个模块,首先要预测什么地方会有呼吸的声音,第二个模块,怎么样把呼吸的声音生成出来。

关于第一个,人类有两种呼吸,一个是这个歌到了一个休止符,在语意的地方需要一个停顿;还有一种,这首歌可能节奏很快,中间没有任何的停顿,这时候人类的歌手必须要在某个地方换一下气,不然的话,人类的肺活量支撑不了。

关于换气的声音,其实换气的声音有点类似于人类的声音,它就是一种没有声带振荡的声音,我们可以把他作一种中文语言系统以外的一种新的发言的因素去建模。

▌最早实现全双工对话

在 2016 年的 9 月份,微软小冰就开始真正的给人类打电话,到目前为止,打了超过 60 万通电话。在通话过程中会增加“嗯”、“啊”这样的语气词,给人的感觉更像真人,并且做到了全双工对话,可以互相打断,真正做到双方互动的聊天。

另外,小冰运用的领域是一个很开放的领域。她实际上跟用户在沟通的过程中话题,内容,都是可以双方提出来的。不仅是小冰抛出一个话题,就限定在这个话题里聊,而是随时可以根据对方抛出的新话题去聊。

据栾剑介绍,小冰这种开放领域的聊天难度上会更大一些。首先上下文大篇幅的语义理解在业界和学术界都是一个很难的课题,比如在写诗的时候,有时候的用词比较古怪,或者语句之间不太通顺,但实际上可能存在有一种潜在的逻辑。

也遇到了一个技术的瓶颈,语意理解像是一个黑盒子,这个黑盒子,会收入一些内容也会反馈一些内容,反馈的内容给人的感觉好像是理解了,但实际上他是不是真正理解了,是没有办法判断的。

人也是这样,在实际对话过程中,更多的是先给个输入,然后给个输出,再根据这个输出来判断他是不是真正理解了,但实际上这里面是有一定的套路存在的,你去判断他是不是理解,可能是很困难的,因为里面并没有一个那么直观的东西存在。

AI 的三个层次:运算智能、感知智能、认知智能

第一层,运算智能,像算盘一样;

第二层,感知智能,能够感知到一个物品是什么;现在大多数的 AI,包括语音、图象等还是停留感知智能层次上;

第三层,认知智能;像人一样,知道是什么,还知道为什么这样,还可以推理,这个层次较难。

说到底,AI 的创造力和人类的创造力之间有什么差别呢?

微软(亚洲)互联网工程院人工智能创造事业部副总经理袁晶表示,人的左脑更加偏向于计算;人的右脑是偏向创造力,发散思维,现在希望用计算的方式,让 AI 用左脑的方式去模拟右脑的行为。

换句话讲,这种创造在人里面只有顶尖的艺术家才能干,但是放到 AI 上,就相当于可以简化这个学习和训练的过程了。

相当于说,让她去拟合人类创作者的创作过程,并且能以这样的能力去帮助普通人去做一些创造,因为每个人都想去做一些创作的行为,只不过说限于自己的能力,AI 能够做到相当于他的助手,帮助普通人,享受创作的乐趣。比如她可以和你一起为你新出生的孩子、或你的恋人写首情诗,也可能为你爸爸的生日创作一首歌曲等。

▌未来小冰将尝试更多内容领域的创作

袁晶表示,未来会渐渐让小冰去尝试往内容生成的领域做一些探索,可能半年一年,很多别的公司或者机构,也会跟随这个趋势去做类似这样的事情。

在袁晶看来,人工智能在内容领域有一些新的能力或者突破可能将会是未来的一个方向,所以也会往这个方向不断的去做一些尝试,包括声音、文字、图像等三个方面,AI 未来会充当协助角色,帮助人类的创作者,去更好更快更高效的创作内容。

首先 AI 创造的成本是很低的,要比人类的创造成本低很多。比如读故事,当我们找配音员去读这个故事,他可能要付出一定的成本,但是如果声音的模型训练好了之后可以大批量的生成,成百上千个小时的大量的用户,所以他的成本会摊薄到很低。

小冰的声音技术里面增加了一些韵律和风格的变换,使得她可以去模仿人类创作者,在各种场景下面做各种不同的演艺。而机器人可以非常真实的模拟人声,让很多人有各种各样的顾虑。

栾剑表示,小冰声音的生成和使用的过程都是严格受控的,将来提供服务的时候,模型本身,以及合成的引擎本身,另外,小冰之前给人类打电话已经打了60万个,小冰都会先申明身份,明确告诉用户我们是微软小冰。微软设有专门的人工智能的委员会,防止人类利用人工智能技术去做伤害他人和社会的事情。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28098

    浏览量

    205806
  • 人工智能
    +关注

    关注

    1789

    文章

    46636

    浏览量

    236980

原文标题:微软小冰作词又作曲,网友:要出道的节奏吗?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    科沃斯助力吴中区机器人+人工智能产业发展

    科沃斯机器人总部迎来了一场盛会——吴中区机器人+人工智能产业专班走进科沃斯机器人产业链供需对接会。本次活动由吴中区工信局牵头组织,旨在推广机器人
    的头像 发表于 10-14 15:25 338次阅读

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    探讨了人工智能如何通过技术创新推动能源科学的进步,为未来的可持续发展提供了强大的支持。 首先,书中通过深入浅出的语言,介绍了人工智能在能源领域的基本概念和技术原理。这使得我对
    发表于 10-14 09:27

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V和Arm内核及其定制的机器学习和浮点运算单元,用于处理复杂的人工智能图像处理任务。 四、未来发展趋势 随着人工智能技术的不断发展和普及,RISC-V在人工智能图像处理领域的
    发表于 09-28 11:00

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    大力发展AI for Science的原因。 第2章从科学研究底层的理论模式与主要困境,以及人工智能三要素(数据、算法、算力)出发,对AI for Science的技术支撑进行解读。 第3章介绍了在
    发表于 09-09 13:54

    海默机器人携产品精彩亮相人工智能产业创投融资对接专场活动

    人工智能领域不断取得突破的今天,海默机器人以其创新的产品和前沿技术,成为行业内的一颗耀眼新星。近日,海默机器人携其产品精彩亮相了一场人工智能
    的头像 发表于 08-02 08:13 457次阅读
    海默<b class='flag-5'>机器人</b>携产品精彩亮相<b class='flag-5'>人工智能</b>产业创投融资对接专场活动

    FPGA在人工智能中的应用有哪些?

    定制化的硬件设计,提高了硬件的灵活性和适应性。 综上所述,FPGA在人工智能领域的应用前景广阔,不仅可以用于深度学习的加速和云计算的加速,还可以针对特定应用场景进行定制化计算,为人工智能技术的发展提供有力支持。
    发表于 07-29 17:05

    人工智能机器人的区别

    在当今科技飞速发展的时代,人工智能(AI)和机器人已成为社会关注的热点话题。尽管两者在多个领域有着广泛的应用和交集,但它们本质上是两个不同的概念。本文将从定义、技术方向、功能、应用范围、研究重点及未来发展等方面,详细探讨
    的头像 发表于 07-04 17:41 1930次阅读

    国产Cortex-A55人工智能教学实验箱_基于Python机械臂跳舞实验案例分享

    一、实验目的 本实验通过TL3568-PlusTEB教学实验箱修改机械臂不同舵机的角度,增加延迟时间,从而做到机械臂跳舞的效果。 二、实验原理 ROS(机器人操作系统) ROS(机器人操作系统
    发表于 06-28 14:37

    AI人工智能机器人产业--政府真正应承担的责任与角色

    AI人工智能机器人自人机大战至今已得到了前所未有的突破与发展。世界上主要国家都把人工智能机器人产业作为首要目标进行战略规划布局推进。有些国家甚至采取抱团打压我国
    的头像 发表于 06-01 08:14 349次阅读
    AI<b class='flag-5'>人工智能</b><b class='flag-5'>机器人</b>产业--政府真正应承担的责任与角色

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    ://t.elecfans.com/v/27221.html *附件:初学者完整学习流程实现手写数字识别案例_V2-20240506.pdf 人工智能 语音对话机器人案例 26分03秒 https
    发表于 05-10 16:46

    其利天下技术·搭载无刷电机的扫地机器人的前景如何?

    随着人工智能和物联网技术的不断进步,扫地机器人智能化程度也在不断提高。现代扫地机器人已经可以通过智能
    发表于 05-05 15:03

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    *附件:初学者完整学习流程实现手写数字识别案例.pdf 人工智能 语音对话机器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:语音对话机器人
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    联网ARM开发 NB-IoT开发及实战 七:python工程师,人工智能工程师 python语法基础 python核心编程 基于OpenCV的机器视觉开发 嵌入式人工智能渗入生活的方方面面,广泛应用
    发表于 02-26 10:17

    人工智能大模型在工业机器人方面的规划

    工业机器人应用较多的企业已具备良好的数字化基础,结合实际需求,对人工智能大模型在工业机器人领域的应用进行整体设计规划。
    发表于 01-05 17:27 610次阅读