2023年最火爆华语歌手是谁?不是周杰伦,也不是孙燕姿,而是“AI孙燕姿”。
近期,在各大视频平台上,“冷门歌手孙燕姿”靠着各种各样的AI“分身”翻唱不同曲风的歌曲,营业时长感人,作品出圈火爆。从流行到摇滚,再到“魔性”,没有AI孙燕姿驾驭不了的曲风。有人说,本来以为AI最不能替代的是艺术类,结果AI就往艺术上发展。“UP主”子鱼(化名),至今只做了4个“AI孙燕姿”的音频,但在B站总播放数已超过150万次。其中《下雨天》单曲播放数超过100万次,收藏人数近2万人。不少粉丝听后表示,“还原得有点可怕了”“这简直就是科技与狠活!”这不禁让人想起前段时间,孙燕姿在海潮宇宙音乐节演出结束后被粉丝追问何时开演唱会的那句打趣——“再不开演唱会就要被AI取代了!”AI歌手真的能取代真人歌手吗?AI技术在唱片工业上有着怎样的发展足迹?在AI技术“狂飙突进”的背后,又有哪些问题浮出水面?
AI歌手火热
近两个月,借由AI分身,陈奕迅、周杰伦、披头士等知名歌手及乐队纷纷在B站“复出”并发表“新歌”。周杰伦唱日语歌、邓丽君演唱《反方向的钟》……一切看似不可能的事情,在AI歌手这里都能实现。其中,孙燕姿因其独具辨识度的音色与唱腔,成为AI宠儿,每天都有数十首“新作”面世。有人调侃,“孙燕姿不营业,粉丝便替她营业。”于是,大家耳熟能详的《一直很安静》《岁月神偷》《红豆》,以及《好汉歌》《火红的萨日朗》等歌曲都在AI孙燕姿的演绎下有了别样的色彩。
按照目前的技术,歌手的唱腔、技巧和风格还很难完全模仿,但音色已经基本能1:1复制了。而笔者也发现,AI孙燕姿用的核心技术主要来自一个叫作So-Vits的开源项目。目前,这个项目已经迭代到了4.0版本。相较于以往 VITS、soft-vc、VISinger2 等 项 目 ,So-Vits的使用大大简化,仅凭数段音频,就可用一个生成式模型来合成目标音色的音频,训练出用户想要的声学模型。这个模型可以保留音高和音调,也可以用不同的语言来翻唱。
笔者观察到,虽然当前AI技术在音乐工业的使用仍大面积停留在调教、翻唱等方面,但AI技术与音乐创作、音乐表演的结合已成为一个显著的趋势。像是此前为了纪念邓丽君逝世22周年,日本节目《金SMA》利用全息投影技术,令一代歌后“复活”。粉丝们自行训练张国荣、姚贝娜等故去歌手的模型,让故人以“数字生命”的形式重现,透过这些久违的声音,让听众在互联网的一片喧嚣之中,感受到独有的人文主义温暖。
今年3月,歌手陈珊妮发布新歌《教我如何做你的爱人》,粉丝听完新歌后几乎都在称赞这首歌的演唱水准一如以往。但一周后,陈珊妮发表长文表示,她的新歌其实是由“AI模型”演唱,就连单曲封面也是AIGC生成。在歌曲制作过程中,她为调教AI演唱做了充足的工作,这些工作量不低于乃至远高于亲自演唱。而陈珊妮也表示,期望透过这首歌,促动所有关心艺术创作的人思考——如果AI的时代必将到来,身为创作人该在意的或许不是“我们是否会被取代”,而是“我们还可以做些什么”。
除了AI翻唱外,还有AI音乐制作
AI在音乐领域能“发挥”的作用越来越多。虽然总有人认为,AI的声音没有感情,无法代替人的艺术性创作。但不可否认,AI的能力早已慢慢“渗透”进音乐产业的诸多方面。早在2007年,虚拟歌手初音未来就面世了。后来“二次元形象+语音合成引擎”的虚拟歌手层出不穷,B站的洛天依,LOL推出的K/DA女团都属于此类。
目前AI对于音乐行业的介入除了AI翻唱外,还有AI音乐制作。像是早期 Korg、Yamaha、Roland品牌的高端自动伴奏合成器,Band in a Box自动编曲软件等都已成为许多知名音乐人的“左膀右臂”。
而基于AI技术的母带制作服务(例如LANDR),则为音乐人们提供了一种成本远低于传统母带制作服务的替代性方案,已经有超过200万音乐家利用它制作出1000万余首歌曲。
AI对于音乐制作的介入正在变得越来越深入和广泛。在Chat-GPT爆火后,越来越多的生成式AI工具被快速推出。去年年底出现的开源 AI翻唱项目 Diffsvc和So-vits,从出现到发展至普通人难以辨别的地步,只用了几个月时间。
今年初,谷歌宣布开发了一款名为MusicLM的人工智能工具,可以从文本中直接生成音乐。而最近,B站官方也在积极鼓励AI创作,推出了名叫“虚拟之声创作计划”的主题活动。
目前看来,在对原创性需求不高的商业音乐应用场景上,AI音乐有着更广的发展空间和更快的发展速度。以游戏场景为例,业内人士指出,音乐作为游戏画面的相关载体,游戏对音乐的需求量极大但要求并不算高。AI音乐的出品速度和处于中游水平的质感,能够完美适应游戏行业需求。
隐忧
是否涉及侵权,争议一直存在
围绕“AI克隆”是否涉及侵权,争议一直存在。AI玩家们认为训练AI仅为娱乐而非商用,并未损害歌手们的权益。但版权方认定使用未经授权的歌手或作品的数据集来训练AI是一种侵权行为。曾就职于多家音乐流媒体平台版权部的李强在接受媒体采访时表示,“在未获得歌手授权下,AI对歌手声音的模拟甚至公开展示,应属于对歌手表演者权的侵权行为。”也有人指出,“在鼓励AI创作的语境里,所有试图绕过版权谈创新都是耍流氓。”
鉴于此,在海外包括环球音乐在内的版权方纷纷向Spotify和Applemusic等流媒体平台施压,要求下架AI克隆歌曲。在环球唱片执行副总裁迈克尔·纳什看来,人工智能音乐正在 “稀释”市场,使原创作品更难找到,并侵犯了艺术家获得作品报酬的合法权利。
3月16日,美国唱片业协会(RIAA)联合美国独立音乐协会、美国音乐家联合会、美国出版商协会、国际唱片业协会等30余个社会团体组建了一个广泛的音乐人和艺术家联盟,共同发起了“人类艺术运动”,以保证AI不会取代或“侵蚀”人类文化和艺术。
整体来看,对音乐工业来说,数字音乐版权的规范化、数字音乐制作的人工智能化是大势所趋,但也面临巨大的现实复杂性。当前,AI的 “介入”无疑让新的、老的问题加速浮出水面,流媒体UGC创作、翻唱侵权、短视频和直播侵权等话题再一次成为平台方、版权方、制作方角力的焦点,而新的行业规则也亟待建立。
不过,也有音乐人对于“AI克隆”持开放的态度,比如加拿大歌手Grimes就公开表示欢迎大家使用AI模仿她的声音进行创作,版税五五分成。而说唱歌手小老虎则表示,如果有人克隆了自己的声音去演唱另一首歌,“不是坏事,也许多交个朋友。”
未来,如果平台规则可以解决创作者使用AI歌手翻唱带来的收入分配问题,不断返回版税给原唱歌手和被翻唱的版权方,那么,AI在音乐工业的想象空间或将进一步被打开。与此同时,对音乐工业大大小小的制作公司来说,AI语音生成和AI创作已成为重要发力方向,不仅能提高传统的音乐创作效率,还能打造虚拟偶像,开辟新的商业场景。
“如果说AI的成长是建立在对人类知识不断学习的基础上,势必会引发与人类现有版权规则及道德、价值层面的激烈冲突。”
孙燕姿“翻唱”怎么办到的?媒体进行了尝试
在搅动华语乐坛前,北美乐 坛 已 经 被 这 个 名 叫So-Vits-SVC的AI项目打了个措手不及。它基于一个叫作VITS(变分推断文本到语音)的深度学习模型,可以精准模拟人声。So-Vits-SVC就建立在这个模型之上,只要一段原始音频,就能拟合成对象的声音。
今年3月,So-Vits迭代到4.0版本,更加好用了,这才被中外网友竞相用来模拟心仪歌手的声音,创造了很多“AI孙燕姿”。在B站,不少UP主也分享了制作AI翻唱训练的“傻瓜”教程,有媒体试着尝试做了一下,用AI孙燕姿的声音翻唱了李克勤版本的《晚风心里吹》。可能因为数据量还不够,最终能听得出是孙燕姿的声音,整体效果还比较粗糙,想达到网上那些AI翻唱的水平,还需要再进行后期的修音和制作。
这首三分多钟歌曲的AI翻唱,从零开始学习各种软件,差不多花了一整天时间。媒体记者的核心体会是,只要有耐心基本上人人都能做得出,但确实有一定的门槛。比如,它对电脑的配置要求比较高,尤其是负责AI处理部分的显卡。12G显存的电脑根本跑不太动,最后是让程序员改了几处代码,由CPU来处理才解决了这个问题,但代价是处理的速度很慢。另外,样本音源的下载和提取比较考验制作者的音视频软件使用能力,样本音源的质量也很重要,不是网上随便扒一首歌就可以制作的……
图文综合每日经济新闻、都市快报、每日人物