​音乐的门槛,又一次被AI拉低了

2024-06-01 01:51 来源:网络 点击:

音乐的门槛,又一次被AI拉低了

被誉为音乐界 ChatGPT 的 Suno,最近宣布完成了 B 轮 1.25 亿美元的融资。据推测,此轮融资使这家刚成立两年、总部位于马萨诸塞州的公司估值达到 5 亿美元。截至 2024 年初,公司员工总数仅为 12 人。

公司还顺手放出了新的模型 V3.5。新版本让 AI 生成歌曲的时长达到 4 分钟,而且显著改进歌曲结构与声音模型,很明显的就是歌曲的副歌部分更突出了。另一个官方只浅浅描述并称 "Coming soon" 的功能,似乎是由声音生成声音,把真实世界中的声响转化为音乐。如果在 V4 版本中这一功能实现,确实为 AI 音乐生成提供了无限的可能。

据国内 AI 产品榜(aicpb.com)数据,Suno 实现了连续每月千万级的访问增长量。在 AI 音乐生成领域,Suno 月访问量是第二名的八倍之多,可谓是一骑绝尘

Suno 联合创始人兼首席执行官 Mikey Shulman 直言," 创办 Suno 是为了打造一个任何人都可以制作音乐的未来,帮助人们重新发现我们小时候玩耍和探索的乐趣 "。他的终极愿景,是全球有 10 亿人每月支付 10 美元使用 Suno 创作歌曲。

不只是 AI 工具,还是音乐社区

" 在人生的某个阶段,我们失去了制作音乐的一些乐趣。我们中的一些人长大后成为了真正的音乐家,接受了必要的训练或拥有天生的技能,而我们其他人则开始明白,我们的位置就是安静地坐在观众席上欣赏演出。" 在宣布融资消息的公开信中,Suno 联合创始人兼首席执行官 Mikey Shulman 写道。

八个月前 Suno 发布了第一款产品,宣称让任何人只要有一个简单的想法就能创作出一首歌。现在已有 1000 万人使用 Suno 创作音乐。这其中有格莱美获奖的音乐家,但大部分还是第一次尝试创作音乐的普通用户。

Suno 的主页很简单,在左侧菜单栏里选择 Create 就可以进行歌曲创作。在 Custom Mode 中开启定制模式,可以粘贴自己创作的歌词,也可以让 AI 根据主题生成歌词,然后简单选择一下音乐风格,确定一个歌曲名,就可以自动生成歌曲。

自 V3 版本开始,Suno 可以说在 AI 音乐创作工具中爆火。最多十几秒,即可生成 2 分钟音乐,包含人声、具有复杂曲式结构、听感不亚于专业音乐作品。此外,还有丰富的曲风流派和音响效果供选择。产品一出就惊艳了全世界。

在刚刚推出的 V3.5 中,AI 生成的音乐又有大幅改善。不但时间更长了,还明显感觉作曲中逻辑性更强了。也就是说,AI 可以理解歌词,区分主歌副歌,设定作品的结构,让作品更精巧。即使没有专业的音乐知识或乐器演奏基础,普通人也能通过这些工具创作出高质量的音乐作品。作品还有自动生成的封面,用户可以下载音频进而分享作品。

Suno 取得成功的另一要素是,它不仅是个 AI 音乐生成工具,还是个音乐平台和音乐社区。在首页中,你能看到新鲜的 AI 作品案例,还能看到最受欢迎的作品排行榜,更有分门别类的播放列表供选择。你也可以通过名字、风格或歌词内容搜索作品。你能看到其他用户发布的作品,看到作品的播放量和点赞量,也可以分享自己的作品。

如果你不知道自己想做哪种类型的音乐,在 Explore 功能中,有数百中细分的音乐风格供你试听选择。你可以选择钟意的音乐风格,一键跳到 Create 页面。

以往大多 AIGC 产品,大家只是新鲜一阵,热闹过去就人走茶凉了。但 Suno 却神奇地保留了用户粘性,还在自己的社区推广、制造了大量神曲,这些神曲破圈后又吸引了大量路人来打卡、尝试 AI 创作。

最惊人的是,每天登陆网站的人中,听歌的人比真正去生成音乐的人还多。第一批 AI 音乐的听众群,正在 Suno 的社区中被培养出来。

创始人是 AI 专家,也是音乐家

一段时间里,像 Midjourney 这样 AI 生成图像、文本,甚至视频的工具都取得了重大进展,但音频生成,尤其是音乐生成,却落后了,也鲜有破圈的应用。Suno 身上则寄托了破解 AI 音乐密码的行业期待。

Suno 刚成立不到两年。四名联合创始人都是机器学习专家,他们曾在另一家剑桥公司 Kensho Technologies 共事至 2022 年,该公司专注于寻找解决复杂商业问题的 AI 解决方案。其中,37 岁的 Mikey Shulman 拥有哈佛大学物理学博士学位,他和另一名创始人也都是音乐家,曾一起演出。

在前一家公司,四人致力于开发一种转录技术,用于记录上市公司的财报电话会议,因为会议通话音频质量差、行话太多、口音各异,这是一项棘手的任务。在此过程中,Mikey Shulman 和他的同事们开始研究 AI 音频的可能性。他也发现,在 AI 研究中,音频总体上远远落后于图像和文本。

他们在头脑风暴中预设过开发包括助听器在内各种各样的产品,结果第一个产品是一款名为 Bark 的文本转语音程序。当他们调查早期 Bark 用户时,大家表示真正想要的是一个音乐生成器。

Suno 使用与 ChatGPT 等大型语言模型相同的通用方法,将人类语言分解并标记成片段,然后根据需要重建它。但音频,尤其是音乐,几乎复杂得令人难以置信。音频不像单词那样可以被简单分解,它是一个连续的信号。高质量音频的采样率通常为 44khz 或 48khz,这意味着每秒 48000 个标记,这是一个很大的工程量。在 2023 年,AI 专家还觉得 Suno 这样的服务可能需要数年时间才能实现。

还有一个绕不过去的问题,就是版权。现在,使用 Suno 时,系统可以识别你输入的歌词是否受版权保护。如果用户计划使用受版权保护的歌词,必须征得许可。

但该 Suno 的主要争议在于,它是否利用受版权保护材料进行训练。OpenAI 因 ChatGPT 在其庞大的训练数据中使用书籍、新闻文章和其他受版权保护的材料而面临多起诉讼。有媒体要求 Suno 澄清这一点,但未得到答复。Suno 的创始人拒绝透露他们究竟将哪些数据塞入自己的模型,只透露了一点:它之所以能够生成令人信服的人类声音,部分原因是它除了从音乐中学习外,还从语音录音中学习。

Suno 表示,他们与各大唱片公司保持着沟通,并声称尊重艺术家和知识产权——他们的工具不允许你在提示中要求任何特定艺术家的风格,也不会使用真实艺术家的声音。

从创始人到员工中,许多人都是音乐家。公司的办公室里也摆放着钢琴和吉他,墙上挂着古典作曲家的照片。Suno 并没有像当年 Napster 那样,表现出对音乐行业的公开敌意。但他们在做的事情,确实正在颠覆音乐行业的逻辑。

目标触及 10 亿用户,超越 Spotify?

Suno 创始人毫不掩饰自己的野心,他们想象着一个高度民主化的音乐世界。Mikey Shulman 认为,目前音乐听众的数量远远超过音乐创作者的数量是 " 如此不平衡 ",Suno 有望解决这种明显的不平衡。他的愿景是全球有 10 亿人每月支付 10 美元使用 Suno 创作歌曲。

Suno 最早的投资者之一是风险投资公司 Matrix 的合伙人 Antonio Rodriguez。他认为 Suno 是一款功能强大且易于使用的乐器,并相信它可以将音乐创作带给每个人,就像照相手机和 Instagram 使摄影大众化一样。他和创始人甚至认为 Suno 可以吸引比 Spotify 更大的用户群。

获得新融资后,Mikey Shulman 也宣布这笔钱将用来 " 打造人人都能创作音乐的未来 "。对此,投资人表示全力支持," 所有伟大的公司都拥有优秀人才的组合,做些看似愚蠢的事,直到这事变得明显不愚蠢为止。"

到目前为止,Suno 用户似乎只热衷于将他们的歌曲分享给几个朋友,但也可以将它们上传到 Spotify 或 Apple Music 等平台。不排除一种可能,未来流媒体上充斥着 AI 生成的音乐。

AI 会不会颠覆当下音乐行业的商业模式,一直是歌手、制作人和词曲作者热衷讨论的话题。但 Suno 的创始人声称没什么可担心的," 我们试图让 10 亿人比现在更多地参与音乐,如果人们更热衷于音乐,更专注于创作,培养出更独特的品味,这显然对艺术家来说是好事。我们对音乐未来的愿景是,它对艺术家友好。我们并不是想取代艺术家。"

但 AI 确实也在替代唱片行业中一些基础工作。ChatGPT 可以帮助写词,Suno 可以直接生成音乐,ACE 可以帮助混音,甚至使用 Mid journey、Runway、Sora 可以帮助生成宣传图和 MV。工业时代的音乐制作需要多个工种配合,也许以后只需要一个专业的人整体把关就足够。

尽管 Suno 只专注于吸引那些想创作歌曲以取乐的爱好者们,但在音乐行业人士的眼里,它仍可能造成重大破坏。像往常利润丰厚的广告配乐,未来是不是就都会由 AI 接手?

但对 Suno 来说,当下还有很多工作亟待完成。新的融资到账后,公司需要继续扩大规模,推出新的产品。在 Mikey Shulman 看来,还原已故歌手的声音这种操作不是人工智能未来的方向,他们考虑的是怎么把人们头脑中的想法变成现实,创作出原本不存在的作品。

也许等新技术连续落地后,现在的很多问题才会找到答案。