AI 音乐最近火到发烫。
首先是三月下旬,美国 AI 草创公司 Suno 发布 V3 音乐生成模型,该模型能够在几秒钟内依据输入的提示词生成两分钟的高质量音频,冷艳的作用让工作信任 AI 音乐现已迎来了自己的「ChatGPT 时刻」。
紧接着,一个月后,国内的昆仑万维宣告推出「天工SkyMusic」音乐生成大模型,其评分逾越 Suno V3,成为 AI音乐生成模型最新 SOTA(State of the Art,指当时技能在本范畴技能指标全球榜首)。
这引起了极客公园的猎奇。客观来说,今日中美在 AI 大模型的根底研发上还存在着必定距离。即便细分范畴的笔直模型,如此自傲地声称全球抢先的团队并不多见。
此外,音乐作为多模态范畴中的重要组成部分,有着不菲的工业价值。全球录制音乐商场一年的总收入近 300 亿美元,而相关的演唱会、BGM、KTV 和线上的短视频、K 歌渠道等更是每年数千亿美元的商场规模。AI 的介入必定带来出产侧和消费侧的全面改造,其潜在影响不会亚于数字音乐和流媒体的鼓起。
因而在 4 月 17 日「天工SkyMusic」正式上线后,咱们榜首时刻下载并体会了这款软件。以下是咱们的体会感触,以及对 AI 音乐未来开展的一点主意。
01
「天工SkyMusic」:
一段歌词,几秒生成
三首不同风格的歌曲
从产品规划视点来看,「天工SkyMusic」与「Suno V3」在多个方面类似,但在一些要害细节上仍是有显着的不同。
运用「天工SkyMusic」生成音乐,需求输入歌名、歌词,一起能够经过增加阶段信息,比方「主歌」、「副歌」、「序幕」等进行微调——这些都与 Suno 的操作类似。
上为 Suno 界面,下为天工SkyMusic 界面
两者最大的不同在于:Suno 要求用户输入歌曲风格,如盛行、爵士或说唱;而「天工SkyMusic」则答应挑选参阅曲目,能够来自其他用户上传过的歌曲,也支撑自己上传。
这个功用十分有用。一方面,比较于泛泛的「风格」,「曲目」供给了更准确的定向,这更有助于生成自己想要的音乐。
从实践运用体会来看,假如短少专业乐理练习,一般用户很难精准描绘歌曲风格——幻想一下,该用什么言语描绘《夜的第七章》?因而,像「天工SkyMusic」这样能够在阅读并倾听原音乐时找到与自己歌词符合的风格,这比运用自然言语描绘能够更好地表达音乐需求,也更符合一般用户的音乐发明的场景。
输入歌词、歌名和参阅曲目今后,就能够直接生成音乐。「天工SkyMusic」会一次性生成三首风格、唱腔略有不同的歌曲——这是一个很有用的产品规划。不论是「Suno V3」仍是「天工SkyMusic」,虽然今日 AI 音乐虽然现已能生成出必定水准的音乐,但安稳性还有待提高,三首里往往只要一首还算不错,而想要得到更好的音乐,除了需求做好歌词分段等微调,更需求重复测验。
输入歌名「夏天的风」以及榜首句「夏天的风我永久记住」,由「AI 写词」完结发明的歌曲|视频来历:极客公园
除了写好歌词生成歌曲以外,「天工SkyMusic」也支撑 AI 写词。如上所示,上面这首《夏天的风》便是咱们用「AI 写词」和「生成歌曲」完结发明的歌曲。这首歌的旋律还不错,但由于没有给歌词分段,整首歌听下来短少了一点腔调改变。
我测验在苏轼的《水调歌头》里加上分段,这次生成的歌曲就有了显着的情感改变,尤其是唱到「人有悲欢离合,月有阴晴圆缺」这样的副歌高潮阶段时,感染力十足。
《水调歌头》Demo
假如生成了满足的歌曲,用户还能够挑选「投稿」发布到「天工SkyMusic」渠道,以及支撑其他交际媒体渠道。在主页,我听了一些点赞比较多的抢手生成音乐,其间不乏一些质量上乘的著作,乍一听简直无法区分其为 AI 生成——当然细心分辩的话,仍是能在一些细节处理上看到与专业著作的距离。
事实上,许多专业音乐人对「天工SkyMusic」也有不低的点评。例如,B 站 UP 主 @Metalion,一名工作音乐人,他测验了用自己的旧歌词生成,并试听了主页其他人发布的抢手 AI 歌曲,其间有好几首都给出了「还不错」、「像是一首完好的歌曲」这种不低的点评。
B 站 UP 主@Metalion 发布的视频 | 来历:B 站截图
全体体会下来,我感觉「天工SkyMusic」的音乐生成才能至少在音乐初学者以上,但生成速度远不是人类可比,并且许多的音乐著作中不乏一些相对完好甚至部分冷艳的优异著作。当然,现在 AI 音乐模型的才能还无法完成整首歌曲自始至终都保持安稳质量,也无法像真实的音乐人那样详尽打磨著作。
可是,就现在的技能水平而言,「天工SkyMusic」已是一款能为用户带来实践价值的优异产品。经过下降音乐发明门槛,如「仿照曲目」、「一次生成三首」和「挑选发布」这些细节规划,大模型现已能够让一般人也能够轻松享用发明音乐、共享音乐的高兴,人人都能以歌明志。
而跟着大模型继续迭代,产品和功用继续丰厚,未来一两年,AI 音乐还有更多的或许性。
02
AI 音乐,会走向何方
谈完对产品的体会,终究咱们来聊聊根据这次体会,咱们能够看到的一些对 AI 音乐工作未来开展的调查。
在「天工 3.0」和「天工SkyMusic」的媒体交流会上,昆仑万维董事长兼 CEO 方汉在承受媒体采访时说,他以为 AI 音乐发明东西未来会有两个分解:面向 PGC和面向小白的 UGC 用户。UGC 基本上是一键生成,便利为主;PGC 就相对杂乱,「天工SkyMusic」也会在后续参加曲调调整等更专业的音乐东西。
「天工SkyMusic」这样的产品,今日对 UGC 和 PGC 而言都有必定的价值,并在可预见的未来,技能会向两个不同的方向继续迭代。
关于一般 UGC用户,AI 音乐生成首要供给的仍是文娱价值。音乐发明是情感表达的一种方法,即便是非专业人士也有发明的需求。以往,技能门槛如词曲发明和音乐理论是首要妨碍,而 AI 技能的引进,相当于为他们供给了一个强壮的「音乐发明外骨骼」,使得任何人都能发明出心中所想的音乐并经过交际媒体进行共享。
当然,当时 AI 音乐渠道操作仍然杂乱,用户需手动进行歌词分段和微调,且生成的音质不行安稳。而跟着技能的继续迭代,这些问题信任很快就会得到解决。正如微博和抖音在文章和视频发明范畴所引发的革新相同,一个去中心化的音乐发明渠道或许将彻底改变人们的音乐发明和消费方法。
关于专业人士的 PGC用户而言,虽然今日的 AI 音乐东西尚不能彻底代替人类发明者,但现已开端成为一个极具价值的辅助东西。
首先是构思激起。现在 AI 音乐大模型发明安稳性还不行,可是速度快,关于堕入瓶颈的发明者,AI 能够成为一个很好的构思启示东西。方汉也列举了一个技能团队与专业发明者交流后的场景,他们以为「天工SkyMusic」有一个特别有价值的当地:便是跨区域风格创意激起。例如,我国音乐人一般对非洲和拉美音乐不甚了解,但经过运用「天工SkyMusic」,他们能够轻松探究并交融这些异域文明的曲调,从而在发明中取得新的创意。
还有一个很有价值的场景在于小样。在许多商务发明的交流场合,尤其是一些音乐人和非音乐人的交流(比方做广告 BGM 时,编曲和广告主交流),很大的费事在于怎么对齐两边对著作方向的了解。而有了 AI 之后,能够很容易地生成一个相对精准地小样儿,这能节约许多的交流时刻以及下降后续返工的危险。
从有用性的视点来看,今日需求用到音乐的工作十分多,比较典型的便是短视频、影视和游戏制造,而传统音乐发明不只本钱昂扬还费时吃力,把 AI 引进到这些工作的音乐出产流程,任何功率的提高都有或许带来巨大的工业价值。
在内容发明范畴,谁能最快习惯技能革新,谁就或许取得最大的利益,这一点在短视频范畴现已有过验证。跟着手机摄像头、5G、以及视频剪辑 APP 的兴起,视频拍照制造门槛不断下降,终究伴跟着抖音的全球走红,短视频赛道全面兴起,摆开一场新时代的大幕。
而今日,在 AI 音乐甚至一切 AIGC 渠道上,前史或许再次重演。
*头图来历:天工 AI