引子

刘慈欣在《诗云》里描述了“神”通过穷举的方式创作了世间所有的诗歌,却无法筛选出优秀作品的故事。在生成式AI普及的今天,我们即将看到科幻走进现实,Suno AI已然让我在音乐领域感受到了“歌云”的震撼。谨以此文,分享关于AI音乐的一二。

“诗云”有感

我读过许多科幻作品,刘慈欣的《诗云》是为数不多的令我十分印象深刻的一部小说,以至于当我深度使用Suno AI的时候,便第一时间想到我遇到了“诗云”。

《诗云》中,一个外星文明为了写出超越李白的诗歌,穷尽了太阳系的大部分能量,列举出了所有可能的字词组合,最终,他们“借助伟大的技术,写出了诗词的巅峰之作”,却还是选择了认输,因为他们“不可能把它们从诗云中检索出来”。《诗云》描述的是“技术与艺术的对抗”,这个主题语也是刘慈欣小说选集本出版社的宣传语。 ——来自百度百科

印象里第一次读《诗云》时,我还在读大学,虽然已经是十多年前的事情了,但至今仍记忆犹新。

之所以如此,是因为对于创作者来说,能通过无限穷举的方式将所有文字组合进行尝试,进而创作并拥有所有的诗歌,这种想法很有趣。

能想到这种点子,我猜大刘一定没少经历绞尽脑汁却写不出稿的窘境~

当年读完作品后,我最大的感触是:

创作最重要的不是追求作品数量,而是把作者本人的阅历和思考,通过作品中蕴含的情感,建立连接读者心灵的桥梁,最终创造内心深处的共鸣与震撼。

这不仅针对文学作品,对于音乐、影视甚至游戏同样适用。

试想一下,如果你事先知道接下来的文章是由AI生成的,你还能够保持平常心去阅读吗?甚至有的人会出现强烈的抵触心理,直接关掉文章。

而如果是由人类创作的呢?哪怕作品质量并不太高,读者也多半会“再给个机会”,因为读者相信别人的故事或许能带来新的启发。

创作的技巧分高低,但创作的初心却不分高下。

因为受到《诗云》的启发,作为自封的诗人与独立音乐人,我开始更关注作品本身的质量,而不再单纯追求数量。

当然,这绝对不是我多年断更并“暂时退出”文坛与歌坛的原因——我纯粹是因为懒~

“歌云”出现

科幻之所以是科幻,是因为故事走不进现实。

然而,有生之年,我在刘慈欣的《诗云》中看到的情节似乎真正地走进了我的生活,只不过,这次是以“歌云”的形式。

作为一名独立音乐人,我更感兴趣于歌曲创作本身。然而,一首歌曲的发布需要诸多环节,除了作词作曲,还需要编曲(伴奏制作)、录音、后期处理等环节。

以往,歌曲编曲和后期制作占用了我大量的时间,因为这方面不是我感兴趣或擅长的。

随着Suno AI等AI音乐生成服务出现,让我看到了帮我解决编曲问题的希望,并且在试用后发现真的可以帮我解决实际问题。

要知道,伴奏编曲是歌曲创作很重要的一个环节,一个好的编曲可以让歌曲情绪表达更饱满、整体更加抓耳,甚至可以说决定了听众是否在前奏就直接切歌。

为了获得AI生成音乐的版权和商用许可,我订阅了Suno AI的专业版,使得我每个月我拥有大量歌曲生成的次数,并远超目前的需求。

为了不浪费每个月剩余的次数,上个月我决定尝试用随机的音乐生成提示词,在每个月的快结束的时候,将剩余的点数全部用来生成歌曲。

当我的播放列表被几百首AI生成歌曲填满时,我突然意识到了“歌云”时代的到来。

在《诗云》中,如何从穷尽所有汉字组合的“诗云”数据库中筛选出真正伟大的作品是一项巨大的挑战。而我面对如此大量的歌曲,如何筛选出有价值的作品同样成为了一项艰巨的任务。我需要从几百首歌曲中判断哪些具有实际价值,哪些可以用作视频的背景音乐,哪些能给我的新歌创作带来灵感等。

“歌云”出现,“诗云”挑战走进现实。

“歌云”的局限

以Suno AI为代表的“歌云”是否能彻底解决音乐人创作的问题呢?

答案显然是:远远不够!

个人体验下来主要问题是:

  • 音质不够好。虽然今年(2025年)的音质已经相比以前提高了不少,但仍会出现无法预料的噪音和低音质,如果遇到了,那么这一段素材基本就废了。
  • 对模型的掌控力不足。提示词对生成结果的影响有限,归根到底还是模型能力不够,如果用户被动适应模型生成的音乐,那么结果还不错,如果想主动掌控一切,那么为时过早。
  • 缺少MIDI和分轨输出。由于目前AI音乐产品的技术路线限制,只能生成完整的音频文件,无法生成MIDI或音频分轨文件,导致无法高质量融入音乐发行的流水线,不太具备替代音乐工业的可能。
  • 音乐同质化严重。听多了就会发现AI音乐也存在“AI味”的问题,并且不小,现在已经能在短视频平台听到不少AI味明显的视频BGM了,体验很不好。

总结下来,目前Suno AI对我这种佛系音乐人还是比较友好的,无非就是做命题作文罢了。对我来说,音乐创作是一种本能。随着和弦、节拍就能创作出旋律,更何况是一段成熟的伴奏?

反正能提成本获得大量成熟的伴奏,还要啥自行车?管它命题作文还是自由作文呢?

再说,命题有时候也会正巧对上心中所感呢~

不过,如果打算直接用Suno AI给客户交差,那就只能祈祷客户好糊弄并且Suno AI恰好听你指挥了。

目前音乐业内主流的做法是通过AI工具获得灵感,然后再手工“扒带”,照着抄一遍音乐,这样就能完全掌控作品接下来的流程了。

毕竟,抄袭自己具有版权和商用许可的AI音乐,怎么能算抄呢?

虽然Suno AI等产品在生成式AI音乐领域迈出了重要的一步,但是仍有较大发展空间,期待有更好的技术出现吧。

“歌云”飘向何方?

伦理与法律

私以为,目前音乐领域的AI研究并不是为了证明“技术能够超越艺术”,而是让技术更好地“服务”艺术。

从目前的社会共识来看,AI对音乐领域的冲击不会让其消失,因为人们不会接受花费宝贵时间欣赏的作品背后,竟然是一个“没得感情的机器”。哪怕是完全由AI创作的作品,最后面向公众的也一定是一个真实的人。

此外,在目前的社会共识和法律法规下,AI无法作为独立的法律主体,这也就限制了AI的性质——被人使用的工具。

也就是说,人们可以使用AI工具完成自己的作品,并以自己的名义发布,但要承担作品的法律责任。举个例子,一个人用笔写了一篇恶意的文章,最后追责的对象是写文章的人而不是那支笔。将来生成式AI的法律地位可能就和笔类似。

因此,对于从事创作行业的人来说,更应该在AI浪潮趁早上车,让AI成为如虎添翼的工具,赢得时代的先机。

即使将来有一天人工智能创作了所有的旋律,以至于任何一段新的由人类创作的旋律都可能与人工智能的作品库雷同,被判定为“抄袭”,那也仅仅是法律意义上的判定,并不是创作者的主观所为。

即使真的到了那样的时刻,相信人类社会的法律也会作出调整,来保障人类创作的权利。冰冷的音符或文字都是没有意义的,只有灌注了创作者的情感,创作者的创作才有了价值。

那么,人工智能对音乐领域而言是否会成为一种毁灭性的打击呢?我认为不会。

一方面生成式AI音乐对于独立音乐人而言是一个非常有用的工具。另一方面位于音乐工业的制作环节的从业者,可能会受到一定的冲击。

人工智能的加持,可以让音乐人更加专注于作品本身,AI如果能解决编曲、混音等问题,可以大大降低独立音乐人出新歌的成本,尤其是对于我这种会编曲、但并不打算专注于编曲的人而言,人工智能可以说是“如虎添翼”。

技术与应用

AI在音乐领域的应用场景有很多,目前最具备实用价值的方向应该算是辅助音乐制作人的AI工具。目前相对成熟的是音频处理方向,例如混音、修音等。

然而,从音频到音乐,仍然是一项巨大的挑战。

目前主流音乐生成式AI的输出结果是混缩后的音频,而不是分轨或者MIDI文件,那么对音乐人的帮助就小了很多,因为混缩后的音频通常难以进行进一步的编辑和调整。

下一代AI音乐产品应该不仅能够生成混缩后的音频,还能生成分轨音频或MIDI文件。这样的技术将使得音乐人能够更自由地调整轨道参数,包括音符、音色、节奏等。如果能做到这些,AI音乐才能说成了!

除了由AI直接生成音乐,我认为还有两个方向值得关注:

  1. 缝缝补补。前文提到目前音乐业内主流的做法是通过AI工具获得灵感,然后再手工“扒带”,照着抄一遍音乐。既然可以手工扒带,为何不能用AI来扒带,这方面已经已经有了一些开源项目,并且仍在快速,可以作为一个补充性的技术融入AI音乐工作流。
  2. 多动脑子。让推理能力强的模型(如DeepSeek R1)学习乐理和编曲等知识,通过MCP协议操作音乐制作用到的DAW宿主软件,想人类一样用软件一步步完成编曲制作。目前已经出现了DAW软件Ableton Live的MCP工具,未来很可期~

总结

从“诗云”到“歌云”,将来势必会出现更多的“生成式AI云”。技术总是在发展的,但我们无需为其所惑。

因为我们有限的时间和精力,更值得留给身边的美好,以及那些讲述故事的真实的人。

希望各种“生成式AI云”能够让我们重新认识创作的初心和本质——创作不仅仅是输出内容,更是创作者思考和情感的表达、是个性的展现和心路历程的记录。

在AI技术不断进步的今天,创作的本质应当被重新审视和珍惜,我们更应多地关注那些源自内心、充满灵感和情感的作品。生成式AI虽然能作为辅助工具,帮助我们提升效率、激发灵感,但它却永远无法替代人类独特的思考和情感。

创作,源于那独一无二的灵魂。