电子发烧友网报道(文/黄山明)就在近期,华语乐坛的不少歌迷喜气洋洋,认为目前的歌坛回到了20年前,歌迷们又享受到了许多动听的歌声。不过与以往不同的是,这些演唱者并非真人,而是一个个训练出来的AI。
这些AI足以以假乱真,通过技术将一首音乐以更换演唱者的方式来进行不同的演绎,不仅为歌坛带来了不一样的视听体验,同时也引发了行业对AI技术应用的思考。在AI时代,我们的所见所闻,或许都是由AI创造的。
光怪陆离的AI时代
如今的网络上有一个梗,要问今年哪个歌手最火,答案可能会出乎许多人意料,并不是某位歌手,而是一些由AI所制作出来的语音,如AI孙燕姿、AI周杰伦等。通过将原来歌手的声音进行采集训练,从而替换另一首歌的原唱。
通过这种方式,实现了让自己喜欢的歌手唱另一首自己喜欢但非歌手的歌,比如用孙燕姿的声音演唱周杰伦的《晴天》。关键在于,不论是演唱语调、技巧乃至音色,几乎都与孙燕姿相差无几。
实现这一技术目前已经有一套标准流程,先通过收集大量的音乐和歌词,并对这些数据进行清洗和标注,以便训练算法和模型。再选择合适的算法和模型,并进行优化和调整,以提高虚拟人物的歌唱和表演能力。
通过语音合成技术将文字转换为声音,并对声音进行处理和优化,以达到更加自然和流畅的效果。最后将原来歌曲的声音替换成语音合成的声音,再进行调试,就能得到一首全新演唱的歌曲。
既然都已经可以替换声音演唱歌曲了,那么更进一步替换视频画面进行演绎也就不太难了。近期谷歌的I/O大会上,便公布了一项Universal Translator技术,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。
这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。
当然,为了避免这项技术被用来制作虚假视频,谷歌将这项技术只授权给少部分的合作厂商使用,普通人是无法接触到的。但市场上如今已经有许多类似的AI出现,谷歌的此举不过是略作限制,但无法阻止这股趋势。
更有甚者,如一位美国网红发布了AI版本的自己“Caryn AI”,这个应用是一款聊天机器人,可以作为用户的虚拟伴侣,目前正在内部测试阶段,每分钟收费一美元。
据美国杂志《财富》披露,就在过去一周的时间内,这款软件已经为其创造了7.16万美元(约合人民币50万元)的收入,已经吸引了超过1000名付费粉丝。
这种模式或许也将冲击未来的娱乐行业,想象每一位追星的粉丝,只要付费,都将拥有与自己偶像一对一聊天的机会,其所创造的价值潜力将是巨大的。
但这种由AI所创造出来的音乐、视频、伴侣或者偶像,真的可以提供人们所需要的情绪价值吗?这是个值得思考的问题。
AI之后的隐忧
尽管这些AI应用的落地前景非常诱人,比如采用AI替换歌曲中的声音,就能够实现歌手只需要提供声音的模板,便可以进行批量的音乐制作。甚至不用自己演唱,也能够推行相关专辑。
技术上主要通过机器学习技术,训练机器模仿一个特定的歌手的音乐风格、声音和唱腔,然后将这些技能应用于其他歌曲的录制中。这种技术在一定程度上提高了录制歌曲的效率和质量,并且可以节省制作成本。
但如果使用他人的声音进行创作,就可能有侵权的风险。尤其在数据采集阶段,以语音替换为例,首先需要收集大量的语音数据,并对这些数据进行标注和处理。标注可以包括音素、语调、语速等信息,以便训练模型能够准确地识别和替换语音。
这一过程便可能涉及到对用户隐私数据的采用,甚至对用户的隐私和数据安全造成威胁,还有可能进一步造成财产安全。因为语音合成就可能被犯罪分子用于诈骗,通过合成亲属或者熟人的声音来谋取资金。
如果用AI更改视频画面甚至进一步篡改其中的对话,则可能造成更多的风险。比如将会遇到即便是用视频聊天,也无法确定对面的是不是真的想要联系的那个人。这项技术目前甚至已经应用在许多的直播平台中,比如一些虚拟主播、虚拟偶像等,如果一旦滥用,可能会造成更多的危害。
为了避免这一情况的发生,除了加强对AI技术的监管,建立相应的法律制度和规范,还可以通过一些技术手段来避免自身的数据被采集,从而造成侵权以及侵犯隐私的风险。比如采用区块链技术来保护数据的安全性和隐私性,采用人工智能算法来检测和识别恶意行为等手段。
以区块链技术为例,其去中心化和不可变性特点能够确保数据的安全和完整性,因此可以用于AI技术的安全验证和认证。基于区块链技术,数据交互和交流的过程被保护,因此可以授权AI对数据的操作并确保AI数据访问权限受到限制。
同时,区块链技术还可以帮助人们更好地控制AI技术的使用,并提高AI的公正和透明性。例如,以基于区块链技术的智能合约的方式来控制AI的使用,可以加强对AI系统的监督,并确保其行为符合人类的期望和价值。
当然,区块链技术还面临着可扩展性、隐私保护等问题,同时在操作成本和技术难度方面也存在一定的限制,还无法完全避免AI滥用的问题。
我们还可以运用数字签名技术检测音频和视频是否被AI修改,数字签名是指在文件中包含数字代码的技术,在将文件传输或转发给其他人时,可以验证文件的完整性和真实性。或者使用机器学习算法来检测这些变化,例如,可以使用深度神经网络来对音频或视频进行分析,以检测其中的模式和结构是否与人类创作者的作品相似。如果发现有明显的差异,则可能表明该作品是由AI生成的。
但随着未来AI技术的发展,这些差异化和容易被检测出来的问题都有可能被AI克服,使得我们最终很难分辨哪些产品是由AI制作,哪些才是由人所原创的。
写在最后
随着生成式AI技术的大爆发,如ChatGPT、文心一言、讯飞星火等聊天机器人的出现,让人们工作效率得以极大地提高,Stable Diffusion、Midjourney等AI的出现,让图片制作成本大幅降低,Universal Translator、Video Dubbing AI等,让视频也开始变得容易制作。
这些AI技术的出现显然极大的解放了人们的生产力,让人类发展走上快车道。当然有人会说以上这些AI都是通过收集大量数据之后,输出缝合之后的产品,根本不能称得上是原创。
但就像我们的学习过程一样,最开始都是模仿,后来才开始拥有自己的独立风格,但这些风格或多或少都会有之前学习过的影子,而这就是创造的过程,AI也是如此。
更值得关注的是,随着AI技术的快速发展,其所带来的风险也在与日俱增。如何更好的处理AI所引发的风险,将是我们未来所面对的主要问题。
这些AI足以以假乱真,通过技术将一首音乐以更换演唱者的方式来进行不同的演绎,不仅为歌坛带来了不一样的视听体验,同时也引发了行业对AI技术应用的思考。在AI时代,我们的所见所闻,或许都是由AI创造的。
光怪陆离的AI时代
如今的网络上有一个梗,要问今年哪个歌手最火,答案可能会出乎许多人意料,并不是某位歌手,而是一些由AI所制作出来的语音,如AI孙燕姿、AI周杰伦等。通过将原来歌手的声音进行采集训练,从而替换另一首歌的原唱。
通过这种方式,实现了让自己喜欢的歌手唱另一首自己喜欢但非歌手的歌,比如用孙燕姿的声音演唱周杰伦的《晴天》。关键在于,不论是演唱语调、技巧乃至音色,几乎都与孙燕姿相差无几。
实现这一技术目前已经有一套标准流程,先通过收集大量的音乐和歌词,并对这些数据进行清洗和标注,以便训练算法和模型。再选择合适的算法和模型,并进行优化和调整,以提高虚拟人物的歌唱和表演能力。
通过语音合成技术将文字转换为声音,并对声音进行处理和优化,以达到更加自然和流畅的效果。最后将原来歌曲的声音替换成语音合成的声音,再进行调试,就能得到一首全新演唱的歌曲。
既然都已经可以替换声音演唱歌曲了,那么更进一步替换视频画面进行演绎也就不太难了。近期谷歌的I/O大会上,便公布了一项Universal Translator技术,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。
这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。
当然,为了避免这项技术被用来制作虚假视频,谷歌将这项技术只授权给少部分的合作厂商使用,普通人是无法接触到的。但市场上如今已经有许多类似的AI出现,谷歌的此举不过是略作限制,但无法阻止这股趋势。
更有甚者,如一位美国网红发布了AI版本的自己“Caryn AI”,这个应用是一款聊天机器人,可以作为用户的虚拟伴侣,目前正在内部测试阶段,每分钟收费一美元。
据美国杂志《财富》披露,就在过去一周的时间内,这款软件已经为其创造了7.16万美元(约合人民币50万元)的收入,已经吸引了超过1000名付费粉丝。
这种模式或许也将冲击未来的娱乐行业,想象每一位追星的粉丝,只要付费,都将拥有与自己偶像一对一聊天的机会,其所创造的价值潜力将是巨大的。
但这种由AI所创造出来的音乐、视频、伴侣或者偶像,真的可以提供人们所需要的情绪价值吗?这是个值得思考的问题。
AI之后的隐忧
尽管这些AI应用的落地前景非常诱人,比如采用AI替换歌曲中的声音,就能够实现歌手只需要提供声音的模板,便可以进行批量的音乐制作。甚至不用自己演唱,也能够推行相关专辑。
技术上主要通过机器学习技术,训练机器模仿一个特定的歌手的音乐风格、声音和唱腔,然后将这些技能应用于其他歌曲的录制中。这种技术在一定程度上提高了录制歌曲的效率和质量,并且可以节省制作成本。
但如果使用他人的声音进行创作,就可能有侵权的风险。尤其在数据采集阶段,以语音替换为例,首先需要收集大量的语音数据,并对这些数据进行标注和处理。标注可以包括音素、语调、语速等信息,以便训练模型能够准确地识别和替换语音。
这一过程便可能涉及到对用户隐私数据的采用,甚至对用户的隐私和数据安全造成威胁,还有可能进一步造成财产安全。因为语音合成就可能被犯罪分子用于诈骗,通过合成亲属或者熟人的声音来谋取资金。
如果用AI更改视频画面甚至进一步篡改其中的对话,则可能造成更多的风险。比如将会遇到即便是用视频聊天,也无法确定对面的是不是真的想要联系的那个人。这项技术目前甚至已经应用在许多的直播平台中,比如一些虚拟主播、虚拟偶像等,如果一旦滥用,可能会造成更多的危害。
为了避免这一情况的发生,除了加强对AI技术的监管,建立相应的法律制度和规范,还可以通过一些技术手段来避免自身的数据被采集,从而造成侵权以及侵犯隐私的风险。比如采用区块链技术来保护数据的安全性和隐私性,采用人工智能算法来检测和识别恶意行为等手段。
以区块链技术为例,其去中心化和不可变性特点能够确保数据的安全和完整性,因此可以用于AI技术的安全验证和认证。基于区块链技术,数据交互和交流的过程被保护,因此可以授权AI对数据的操作并确保AI数据访问权限受到限制。
同时,区块链技术还可以帮助人们更好地控制AI技术的使用,并提高AI的公正和透明性。例如,以基于区块链技术的智能合约的方式来控制AI的使用,可以加强对AI系统的监督,并确保其行为符合人类的期望和价值。
当然,区块链技术还面临着可扩展性、隐私保护等问题,同时在操作成本和技术难度方面也存在一定的限制,还无法完全避免AI滥用的问题。
我们还可以运用数字签名技术检测音频和视频是否被AI修改,数字签名是指在文件中包含数字代码的技术,在将文件传输或转发给其他人时,可以验证文件的完整性和真实性。或者使用机器学习算法来检测这些变化,例如,可以使用深度神经网络来对音频或视频进行分析,以检测其中的模式和结构是否与人类创作者的作品相似。如果发现有明显的差异,则可能表明该作品是由AI生成的。
但随着未来AI技术的发展,这些差异化和容易被检测出来的问题都有可能被AI克服,使得我们最终很难分辨哪些产品是由AI制作,哪些才是由人所原创的。
写在最后
随着生成式AI技术的大爆发,如ChatGPT、文心一言、讯飞星火等聊天机器人的出现,让人们工作效率得以极大地提高,Stable Diffusion、Midjourney等AI的出现,让图片制作成本大幅降低,Universal Translator、Video Dubbing AI等,让视频也开始变得容易制作。
这些AI技术的出现显然极大的解放了人们的生产力,让人类发展走上快车道。当然有人会说以上这些AI都是通过收集大量数据之后,输出缝合之后的产品,根本不能称得上是原创。
但就像我们的学习过程一样,最开始都是模仿,后来才开始拥有自己的独立风格,但这些风格或多或少都会有之前学习过的影子,而这就是创造的过程,AI也是如此。
更值得关注的是,随着AI技术的快速发展,其所带来的风险也在与日俱增。如何更好的处理AI所引发的风险,将是我们未来所面对的主要问题。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
谷歌
+关注
关注
27文章
6172浏览量
105627 -
AI
+关注
关注
87文章
31130浏览量
269447 -
AIGC
+关注
关注
1文章
363浏览量
1559
发布评论请先 登录
相关推荐
英伟达新一代AI芯片过热问题引关注
近日,英伟达新一代Blackwell AI芯片遭遇过热问题,这一消息引发了业界的广泛关注。据悉,搭载该芯片的服务器在运行过程中存在过热现象,可能影响其正常交付,这令谷歌、微软等潜在客户感到担忧。
特斯拉加大AI投资,纬创成AI服务器市场赢家
近日,特斯拉宣布将全力冲刺AI投资,主要用于训练自动驾驶系统。为实现这一目标,特斯拉计划在得州超级工厂大幅增加AI服务器的数量,从目前的2.9万组提升至5万组,增幅超过七成。
下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI中更快的嵌入处理
电子发烧友网站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI
发表于 08-15 11:06
•0次下载
爆火!产能激增800%!
,SK海力士的1b DRAM产能预计将从第一季度的每月1万片晶圆增加到年底的每月9万片,增幅达800%, 且这一目标较去年年末给出的7万片目标高出近三成。SK海力士还计划到明年上半年将1b DRAM产量增加到14万至15万片,是
商汤科技:AI 2.0时代的“新质生产力工具”
2024年全球开发者先锋大会(GDC)在上海盛大开幕,汇聚了全球顶尖的开发者与科技创新者。商汤科技董事长兼CEO徐立受邀出席,并发表了题为《AI 2.0时代的“新质生产力工具”》的主旨演讲,引发了广泛关注和深度思考。
AI时代,忆恒创源如何定义SSD?
AI技术的飞速发展,存储行业迎来了前所未有的挑战与机遇。AI对算力的需求推动了存储技术的进步,在这一背景下,作为一家成立于2011年的本土企业级SSD厂商,忆恒创源不断探索如何提升存储
荣耀引领端侧AI新时代
在今年的MWC盛会上,荣耀宣布与高通、Meta携手,将70亿参数大模型引入端侧,这一创新举措预示着端侧AI新时代的到来。荣耀终端CEO赵明在发布会上详细介绍了荣耀魔法大模型,并通过现场
是德科技如何赋能医疗AI大模型应用呢?
自从ChatGPT爆火以来,各种AI大模型纷纷亮相,如百度科技的文心一言,科大讯飞的讯飞星火,华为的盘古AI大模型,腾讯的混元
联想今年将发布AI OS操作系统
联想正式宣布,将把AI PC和个人Agent作为2024年的核心业务推进重点,并计划在今年内推出全新的“AI OS操作系统”以及一系列搭载此系统的“
智谱AI推出新一代基座大模型GLM-4
智谱AI近日宣布推出新一代基座大模型GLM-4。这一模型在整体性能上相较上一代实现了大幅提升,其表现已逼近GPT-4。
评论