3 月 22 日,AI 音乐生成工具 Suno 发布 V3 版本,它可以从简单的文本描述中生成完整的歌曲,包括歌词、音乐和声音等。支持用户在几秒钟内制作完整的、时长为 2 分钟的歌曲,同时实现更多样化的风格。
Suno V3 的发布,掀起了又一场 AI 狂欢。
官网地址:https://www.suno.ai
只需想象力,就可以让自己的想法具象化为美妙的音乐。
Suno V3 的推出被不少人视为「音乐界的 ChatGPT」,让音乐创作进入了一个全新的时代。
不需要很专业的 prompt 词汇,甚至可以不需要理解音乐的专业知识,任何人都可以通过语言描述轻松地创造属于自己的音乐作品。
突破之处
Suno V3 标志着音乐制作技术的一次重大进步,其设计和功能在许多方面颠覆了传统音乐创作流程。
从 V2 仅能生成 30 秒的音频到现在能创作出长达 2 分钟的完整歌曲,Suno 在短短半年时间内实现了质的飞跃。
官方V3简介博客文章:https://www.suno.ai/blog/v3
-
几秒钟完成音乐创作
在传统音乐制作过程中,从构思到完成一首歌曲可能需要数小时甚至数天,而Suno V3 将这一过程缩短到几秒钟。Suno V3 能够快速把用户的文本提示转换成音乐,不仅大大节省了专业音乐人的创作时间,也使音乐创作变得更加普及,即使是没有音乐背景的人也能轻松创作出自己的作品。
-
音乐风格多样性
Suno V3 能够生成多种音乐风格和流派的作品,从古典到爵士,从摇滚到电子,满足不同用户的需求。这种风格上的多样性使 Suno V3 不仅可以应用于个人娱乐,也能够适应不同场合和用途的音乐需求,如影视背景音乐、广告配乐、游戏音乐等。
-
更好的音频质量
Suno V3 采用更先进的深度学习和神经网络算法,其生成的音乐不仅在旋律上更加丰富多彩,和声处理也更加精细,节奏感更强,整体上更接近专业音乐人的创作水平。
-
个性化创作
Suno V3 的一个显著特点是能够提供高度个性化的创作体验。用户可以通过简单的文本提示,比如描述一个场景、情感或者特定的音乐风格,Suno V3便能够基于这些信息生成独特的音乐作品。因此,每一首由Suno V3生成的歌曲都具有独特性,可以反映出用户的个人风格和创作意图。
界面介绍
Suno 的界面设计简洁清晰,有「Explore」「Create」「Library」三个大板块。
Suno网页地址:https://app.suno.ai
在「Explore」板块,我们能看到网友创作的各种风格的音乐作品,有电子乐、重金属、蓝调、hip-hop等不同的流派,Suno则根据播放量和点赞量对歌曲进行趋势排名。相当于音乐社区,有实时更新的TOP榜单。
在「Library」板块,你可以查看生成记录,以及点赞和发布的歌曲,同时支持对歌曲进行编辑操作。
在「Create」板块,我们可以用简单2步做出一首歌。
创作流程
点击左边的「Create」板块,就会出现这样的制作页面。
默认输入歌曲描述直接生成歌曲。「Song Description」处输入提示词,点击「Create」按钮即可创作。
「Instrumental」选中是纯BGM,关闭则带人声。
点亮「Custom Mode」进入自定义模式。
在这个模式下,我们可以定制自己的歌词,填写音乐风格提示词和歌名。
对于给定的歌词,可以点击「Generate Lyrics」在段落前加 [Verse](主歌)、[Rap](说唱)、[Chorus](副歌)等元标签来告诉 AI 这段歌词应该怎么唱。
「Style of Music」音乐风格
在此处写入歌曲的风格提示词,Suno 就能够依照指定风格生成出一段歌曲。也可以点击「Use Random Style」,随机生成音乐风格。
Suno AI 支持多种音乐风格和语言,能够满足不同需求。具体的提示词内容参考如下:
音乐流派,如 Kpop、Heavy Metal;音乐风格,如 Slow、Broadway;情绪,如 Sad、Angry;乐器,如 Piano、Gita;主题或场景;人声描述等。
最后添加歌名,点击「Create」,Suno 会生成两首旋律和歌词各不相同的曲子。
二次创作和扩展歌曲
在歌曲右侧打开下拉栏,选择「Remix」,重新调整 Prompt 或歌词,在这个主题下进行二次创作。
让每个人的音乐梦想成为现实
Suno,印地语中意为「倾听」。
这是由一群机器学习专家和音乐爱好者共同建立的初创公司,距今仅两年时间。
据《滚石》杂志报道,Suno 创业团队目前仅12人,其中四位联合创始人分别为Mikey Shulman、Martin Camacho、Georg Kucsko 和 Keenan Freyberg。这四人都是机器学习方面的专家,此前曾共同就职于人工智能企业Kensho,还有在 Tiktok、Meta 等互联网公司的从业经验。其中,Shulman 和 Camacho 还是音乐家,常常一起即兴演出。
在 Kensho 期间,他们开发了 AI 语音转录技术。正是在这个项目中,他们认识到了 AI 在音频生成方面的巨大潜力。
起初,他们尝试开发了一个名为 Bark 的文本转语音程序。在与 Bark 的用户交流中,他们发现用户真正想要的是一个音乐生成器。这一发现促使他们转向音乐 AI 领域,并最终创立了 Suno。
Mikey Shulman 表示,大多数人不会演奏乐器,也不了解复杂的软件,到目前为止,这一直是创作优美音乐的障碍。声乐也是其中一个非常重要的组成部分,也是 Suno 的与众不同之处。
他认为,目前音乐听众的数量远远超过音乐创作者是如此失衡,并将 Suno 视为解决这种感知不平衡的工具。
与多数 AI 音乐应用不同的是,Suno 专注于创作全新旋律和人声,而不是模仿已有的知名艺术家声音或歌曲风格。
Mikey Shulman 认为,尽管以特定艺术家风格创作新歌很酷、很有趣,但长期来看,这种体验不会给消费者带来持久的乐趣。
他们的理念是让更多人收获创作音乐的乐趣,同时也更加重视人声音乐,即「通过人工智能技术使音乐创作无门槛、更加民主化」。
Suno 打开了一扇通往音乐殿堂无限可能的大门。通过 Suno,人们能够创作属于自己的音乐,打破制作音乐的门槛,让音乐创作变得更加普及和便捷。
技术发展与创新历程
Suno主要使用两个 AI 模型来创作音乐:Bark 模型和 Chirp 模型。
通过接收用户提供的文本提示来启动一首歌曲的创作过程。这个文本可以是一个描述、一个概念,或者是具体的歌词。
Bark 模型专注于创作歌曲的人声部分,确保歌唱声音和歌词既和谐又吸引人。
这是一个基于 Transformer 架构的开源文本转语音模型,可以生成非常逼真的多语言语音以及其他音频,包括音乐、背景噪音和简单的音效,如笑声、叹息和哭泣。
Chirp 模型则专门处理器乐伴奏的非人声元素,它构建了歌曲的旋律、和声和节奏,为音乐作品提供了坚实的支撑。通过文字描述就能实现逼真的音乐和声音效果,包括配乐、人声、音效等,可广泛用于游戏、短视频、播客等领域。
官方发布有关Chirp和Bark的指南和参考资料网址:https://suno-ai.notion.site/Docs-Guides-Resources-38e5ba5856d249a89dcea31655f4fb74
Suno 采用了与 ChatGPT 等大语言模型相同的技术方法,这些模型将人类语言分解成称为 Token 的独立片段,吸收了数以百万计的用法、风格和结构,并能够按需重新构建语言。
这两种模型利用相同的底层深度学习架构,该架构经过海量音乐数据集的自训练来捕获人声、旋律、节奏等背后的模式,这使得 Suno 能够端到端仅从歌词或其他文本开始创作令人震惊的类似人类的歌唱和音乐风格。
Suno 产品发展历经多个阶段:
- 2023年4月,Suno 推出了文本转音频模型 Bark
- 7月,Suno 增加了人声和音乐功能
- 8月,Discord 频道开始内测,推出Chirp V0 版本模型,可以文生音乐
- 9月,Chirp 模型推出V1版本,新增风格提示功能,用户可以在 Suno 的 Discord 频道体验文字生成音乐
- 11月,官网在网页上推出 Chirp V2 版本模型
- 12月20日,Suno 推出了网页版本应用,并与微软的 Copilot 合作,将 Suno 的功能集成到 Copilot 中,支持对话方式生成音乐
在过去的一年里,生成式 AI 在创作文本、图像乃至视频方面取得了巨大进步。然而,在音频领域,尤其是音乐创作方面,AI 的发展却相对滞后。
跟 AI 生成文本和图像相比,使用 AI 生成可用的音乐要困难得多。
音乐的复杂性远超语言,它包含了丰富的情感和细微的表达。AI 需要学会如何在保持音乐连贯性的同时,捕捉和复制这些微妙的情感变化。系统需要处理更多元素,从语音到个别音符、排列和流程。
尽管存在这些挑战,AI 音乐生成技术仍在不断发展,研究人员正在探索新的方法来克服这些问题,以创造出更加丰富和多样的音乐作品。
引领音乐圈变革
Suno V3 简化了音乐创作过程,为更广泛的用户提供了表达音乐想法的工具和平台,促进了音乐创作民主化,对音乐行业的变革已经开始。
在其帮助下,不需要深厚的音乐理论知识或复杂的音乐制作技能,用户就能够创作出质量上乘的音乐作品。这种技术的普及,意味着音乐创作不再是专业音乐人的专属领域,而是任何人都可以参与的艺术活动。
- 对传统音乐产业的冲击
Suno V3 的出现将重塑传统音乐产业,促使行业重新思考音乐制作、发行和消费模式。
随着AI技术应用深入,音乐制作成本大幅降低,制作周期缩短,这可能会改变音乐市场的供需关系和价值链。
从 B 端和 C 端来看音乐生成类产品的应用场景。TTS(Text-to-Speech)文本到语音技术大幅降低电影、电视、游戏和广告等领域的音频制作成本。
音乐制作公司、唱片公司、音乐发行平台等行业参与者需要探索与AI创作工具的合作方式,开发新的商业模式,以适应新技术变革带来的影响。
在 C 端消费级领域,音乐创作门槛的显著降低也有望让人们通过音乐进行自我表达,让音乐作为独立内容形态成为一种人们在互联网交流的信息载体。
独立音乐人和创作者在 Suno V3 等工具帮助下,将获得更大的曝光机会和创作自由,从而在音乐市场中获得更强的竞争力。
此外,Suno V3 同时也对音乐教育存在潜在影响。比如,可以作为教学工具,Suno可以帮助学生更直观地理解音乐理论和作曲技巧,激发创作灵感。学生可以通过与 Suno 的互动,学习不同音乐风格和元素,拓宽音乐视野,增强创作能力。
从学生到老师,从业余爱好者到专业音乐人,Suno V3为不同背景和技能水平的人们提供了创作音乐的机会,激发了他们的创造潜能和艺术表现力。
- 版权保护与挑战
虽然Suno V3为音乐创作提供了极大的便利性,跟其他AIGC工具一样,也将不可避免地带来对版权保护的讨论。
Suno V3 的音乐水印技术可以一定程度保护用户创作的原创性,帮助区分 AI 生成音乐与人工创作音乐。
然而,随着 AI 创作音乐的广泛应用,如何确保作品的版权归属、如何界定人工与 AI 在创作过程中的贡献、以及如何在法律框架下保护 AI 创作作品知识产权等问题,都需要行业、法律专家和社会各界共同努力开展更广泛的讨论,寻找合理有效的解决方案。
目前存在的不足
和所有AIGC产品一样,Suno V3 同样存在不足。
比如时长限制,精细度以及精准度不够的问题。有用户反馈生成的歌曲中的人声存在不合适的韵脚,且用户无法通过 Suno 直接对局部进行精细化调整。此外,当用户对作品的特定要求非常明确时,Suno 可能难以完全满足这些高标准的需求。
在情感深度和创意独特性方面,Suno 同样具有局限性,这也意味着作品在表达力和感染力上与人工创作存在差距。因此,有不少用户反馈 Suno 创作的音乐缺乏“灵魂”。
Suno 团队表示,目前 Suno 仍处于早期阶段。Suno V4 已在开发中,团队将继续在质量、控制和速度等方面进行改进,开发一些新的、令人兴奋的功能,在未来为用户带来更加优质的体验。
Suno 的意义,不仅是音乐创作技术的突破,更在于它使音乐创作变得简单,为更广大的用户提供了探索音乐新世界的机会,让更多的声音和创意得以被听见。
Suno,不止于音乐。未来,Suno 将如何进化,让我们拭目以待。
作者:傅依婷
编辑:郑慧宁