bibo必博这首名为《We Go!》的歌曲,由音乐大模型Suno生成,其播放量已经超过十几万,甚至一度冲上热度榜首位,引发了网友们的广泛热议。
有网友评论表示:“《We Go!》有点像专业的作品了”,也有其他网友说:“《We Go!》听上去好像没有感情”。
虽然对于AI音乐,网友们褒贬不一,但如果AI能直接生成专业作品,而且受到大多数听众的喜爱,是不是意味着AI将改变音乐界的专业分工甚至促使整个音乐行业革新呢?
日前,音乐大模型Suno发布V3,并且开放给个人用户,随即便引爆了互联网。
其实,Suno已经发布了一段时间,但这一次将免费用户的音乐生成时长增加到2分钟,并且有更丰富的定制选项,比如可以定制纯器乐作品。这一举动激发了网友们的使用热情,大量AI生成歌曲蜂拥而至。
此次,更新的Suno V3模型的亮点之一是其对用户提供的歌词的高效处理能力。用户仅提供歌词,V3便能生成符合多种曲风、流派的歌曲,甚至可定制AI歌手的音色。这种高度定制化和个性化,不仅满足用户基本需求,还激发创作灵感,推动音乐创作的边界。
其中,有一首名为《We Go!》的中文歌在3月24日发布之后,很快就冲上了热度榜第一。我们听到《We Go!》总体感受是,这首歌有着典型的重金属音乐特征和结构,且完整度相当高,因此被不少国外网友分享并热议。
而且,有国内用户用很多耳熟能详的歌词作为基础,让Suno重新生成曲调,“重制”了《让我们荡起双桨》《声声慢》《以父之名》《夜曲》《七里香》等经典曲目,生成效果令人惊艳。
过去一年,我们看到,生成式AI在产生文本、图像甚至视频方面取得了重大进展,特别是OpenAI的新Sora工具,带起了全民文生视频的热潮。但是音频,尤其是音乐方面却一直落后。
除了Suno, 2023年以来,越来越多的AI生成音乐类产品出现。去年8月,Meta以AudioCraft名义发布了三款AI音乐生成研究工具;谷歌子公司DeepMind也与Youtube联合推出了人工智能音乐生成模型Lyria、23年11月推出了Dream Track,它可以按照选定的著名歌手的风格创作原创歌曲,12月14日,谷歌又推出AI音乐创作工具“MusicFX”,仅需几句话用户即可生成原创的音乐作品。
有业内人士分析认为,相比图文和视频,音乐的机器学习要复杂得多,AI需要理解和模拟复杂的音乐结构、和声、旋律以及节奏等元素,这在技术上是非常复杂的。
音乐不仅仅是技术的堆砌,它还包含了深厚的文化背景和个人情感的表达。而且,人声和音乐的结合,也是一个难点。
值得注意的是,Suno V3对于著作权的归属问题在官网做了详尽的描述与规定,同时为了防止模型作品被滥用,还开发了专有的无声水印技术,用以检测歌曲是否是使用Suno创作。
那么,很多人都在好奇,到底是一个什么样的团队创造出这个爆款的软件呢?其实,这又是一个天才团队成立的故事。
Suno AI成立于2022年,其创始团队位于麻省剑桥市。在创立Suno之前,他们一起在剑桥的一家公司名叫Kensho Technologies的公司工作,据了解,Suno创业团队目前仅12人。
创始人是Mikey Shulman,博士毕业于哈佛大学物理学专业。他是创始团队在Kensho时的机器学习团队主管,在创立Suno之前,他还是一名MIT斯隆管理学院的兼职讲师。
在Kensho工作期间,四人的主要任务是开发一种AI语音转录技术,用来转录上市公司的财报电话会议。后来他们发现,AI音频领域好像还没有现象级的产品出现,于是他们开始创业。他们先做了个文本转语音程序Bark。但当他们对早期Bark用户进行调查时,发现用户真正想要的是音乐生成工具。于是他们才找到了真正适合自己的方向。
2023年7月他们推出了音频生成模型增加人声音乐功能;9月,更新后的模型,可以让用户可以在Suno的Discord频道体验文字生成音乐;12月20日推出了Suno网页版本应用。
元宇宙新声也听到很多关于AI用途的声音,有人质疑AI的方向问题,他们希望机器人帮人类扫地、洗碗,是因为人类要去写诗、画画;现在是AI都去写诗和画画了,而人类还在扫地、洗碗。那么,研究AI写诗、画画、做音乐的意义是什么?
我们认为,现在也已经有扫地机器人、洗碗机等工具,机械类的工作早就有机器可以替代bibo必博。而现在AI应该深入各个领域去扩散思维,替代或者辅助人们来做更多的工作,如果,AI连艺术都能做,做那些机械类的工作岂不是更容易?
有业内人士认为,随着数据库的更新、技术的迭代,AI将在未来10年内’干掉’作曲人。
其实,AI显然为业内人士敲响了警钟,但即便AI技术再升级,永远有1%是无法被替代的,这1%的来源也正是音乐行业的核心部分,那就是创造力。
而且,AI合成音乐可能会将音乐创作过度商业化,这完全本末倒置了。他认为音乐创作很多时候是主观的、能动的、感性的,是自己的生活记录和情感抒发。
元宇宙新声认为,机器与人之间的最大区别往往就在于人文情怀,再好的词曲也比不上“周杰伦”“林俊杰”三个字在听众心中的存在意义,再无瑕的人声演绎也难以与明星演唱会现场的万人大合唱相比较。
我们看到,Suno冲击的不仅是行业分工,还有音乐流媒体。在早前发布的宣传片里,Suno勾勒了这样一个未来的音乐场景:用户不再使用流媒体,而是想听歌的时候,直接用Suno生成。
但我们担心的是,随着AI的发展,AI音乐泛滥,用户还能不能在更多的歌曲中找到符合自己审美的音乐和听音乐的初心。如果,可以克服这样的困难,大模型与音乐内容、创作者的结合或许将成就新一代音乐,同时带来行业的变革。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。