AI孙燕姿成今年爆火歌手，这一时代眼见不实，耳听为虚-电子发烧友网

电子发烧友网报道（文/黄山明）就在近期，华语乐坛的不少歌迷喜气洋洋，认为目前的歌坛回到了20年前，歌迷们又享受到了许多动听的歌声。不过与以往不同的是，这些演唱者并非真人，而是一个个训练出来的AI。

这些AI足以以假乱真，通过技术将一首音乐以更换演唱者的方式来进行不同的演绎，不仅为歌坛带来了不一样的视听体验，同时也引发了行业对AI技术应用的思考。在AI时代，我们的所见所闻，或许都是由AI创造的。

光怪陆离的AI时代

如今的网络上有一个梗，要问今年哪个歌手最火，答案可能会出乎许多人意料，并不是某位歌手，而是一些由AI所制作出来的语音，如AI孙燕姿、AI周杰伦等。通过将原来歌手的声音进行采集训练，从而替换另一首歌的原唱。

通过这种方式，实现了让自己喜欢的歌手唱另一首自己喜欢但非歌手的歌，比如用孙燕姿的声音演唱周杰伦的《晴天》。关键在于，不论是演唱语调、技巧乃至音色，几乎都与孙燕姿相差无几。

实现这一技术目前已经有一套标准流程，先通过收集大量的音乐和歌词，并对这些数据进行清洗和标注，以便训练算法和模型。再选择合适的算法和模型，并进行优化和调整，以提高虚拟人物的歌唱和表演能力。

通过语音合成技术将文字转换为声音，并对声音进行处理和优化，以达到更加自然和流畅的效果。最后将原来歌曲的声音替换成语音合成的声音，再进行调试，就能得到一首全新演唱的歌曲。

既然都已经可以替换声音演唱歌曲了，那么更进一步替换视频画面进行演绎也就不太难了。近期谷歌的I/O大会上，便公布了一项Universal Translator技术，该工具旨在将视频从一种语言翻译成另一种语言，同时保留整体基调和氛围。

这意味着该技术不仅可以将音频从一种语言翻译成另一种语言，还可以模仿说话者的声音、语气和面部表情，人物说话视频会根据目标语言的发音同步改变口型。

当然，为了避免这项技术被用来制作虚假视频，谷歌将这项技术只授权给少部分的合作厂商使用，普通人是无法接触到的。但市场上如今已经有许多类似的AI出现，谷歌的此举不过是略作限制，但无法阻止这股趋势。

更有甚者，如一位美国网红发布了AI版本的自己“Caryn AI”，这个应用是一款聊天机器人，可以作为用户的虚拟伴侣，目前正在内部测试阶段，每分钟收费一美元。

据美国杂志《财富》披露，就在过去一周的时间内，这款软件已经为其创造了7.16万美元（约合人民币50万元）的收入，已经吸引了超过1000名付费粉丝。

这种模式或许也将冲击未来的娱乐行业，想象每一位追星的粉丝，只要付费，都将拥有与自己偶像一对一聊天的机会，其所创造的价值潜力将是巨大的。

但这种由AI所创造出来的音乐、视频、伴侣或者偶像，真的可以提供人们所需要的情绪价值吗？这是个值得思考的问题。

AI之后的隐忧

尽管这些AI应用的落地前景非常诱人，比如采用AI替换歌曲中的声音，就能够实现歌手只需要提供声音的模板，便可以进行批量的音乐制作。甚至不用自己演唱，也能够推行相关专辑。

技术上主要通过机器学习技术，训练机器模仿一个特定的歌手的音乐风格、声音和唱腔，然后将这些技能应用于其他歌曲的录制中。这种技术在一定程度上提高了录制歌曲的效率和质量，并且可以节省制作成本。

但如果使用他人的声音进行创作，就可能有侵权的风险。尤其在数据采集阶段，以语音替换为例，首先需要收集大量的语音数据，并对这些数据进行标注和处理。标注可以包括音素、语调、语速等信息，以便训练模型能够准确地识别和替换语音。

这一过程便可能涉及到对用户隐私数据的采用，甚至对用户的隐私和数据安全造成威胁，还有可能进一步造成财产安全。因为语音合成就可能被犯罪分子用于诈骗，通过合成亲属或者熟人的声音来谋取资金。

如果用AI更改视频画面甚至进一步篡改其中的对话，则可能造成更多的风险。比如将会遇到即便是用视频聊天，也无法确定对面的是不是真的想要联系的那个人。这项技术目前甚至已经应用在许多的直播平台中，比如一些虚拟主播、虚拟偶像等，如果一旦滥用，可能会造成更多的危害。

为了避免这一情况的发生，除了加强对AI技术的监管，建立相应的法律制度和规范，还可以通过一些技术手段来避免自身的数据被采集，从而造成侵权以及侵犯隐私的风险。比如采用区块链技术来保护数据的安全性和隐私性，采用人工智能算法来检测和识别恶意行为等手段。

以区块链技术为例，其去中心化和不可变性特点能够确保数据的安全和完整性，因此可以用于AI技术的安全验证和认证。基于区块链技术，数据交互和交流的过程被保护，因此可以授权AI对数据的操作并确保AI数据访问权限受到限制。

同时，区块链技术还可以帮助人们更好地控制AI技术的使用，并提高AI的公正和透明性。例如，以基于区块链技术的智能合约的方式来控制AI的使用，可以加强对AI系统的监督，并确保其行为符合人类的期望和价值。

当然，区块链技术还面临着可扩展性、隐私保护等问题，同时在操作成本和技术难度方面也存在一定的限制，还无法完全避免AI滥用的问题。

我们还可以运用数字签名技术检测音频和视频是否被AI修改，数字签名是指在文件中包含数字代码的技术，在将文件传输或转发给其他人时，可以验证文件的完整性和真实性。或者使用机器学习算法来检测这些变化，例如，可以使用深度神经网络来对音频或视频进行分析，以检测其中的模式和结构是否与人类创作者的作品相似。如果发现有明显的差异，则可能表明该作品是由AI生成的。

但随着未来AI技术的发展，这些差异化和容易被检测出来的问题都有可能被AI克服，使得我们最终很难分辨哪些产品是由AI制作，哪些才是由人所原创的。

写在最后

随着生成式AI技术的大爆发，如ChatGPT、文心一言、讯飞星火等聊天机器人的出现，让人们工作效率得以极大地提高，Stable Diffusion、Midjourney等AI的出现，让图片制作成本大幅降低，Universal Translator、Video Dubbing AI等，让视频也开始变得容易制作。

这些AI技术的出现显然极大的解放了人们的生产力，让人类发展走上快车道。当然有人会说以上这些AI都是通过收集大量数据之后，输出缝合之后的产品，根本不能称得上是原创。

但就像我们的学习过程一样，最开始都是模仿，后来才开始拥有自己的独立风格，但这些风格或多或少都会有之前学习过的影子，而这就是创造的过程，AI也是如此。

更值得关注的是，随着AI技术的快速发展，其所带来的风险也在与日俱增。如何更好的处理AI所引发的风险，将是我们未来所面对的主要问题。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉