编辑 | 苏建勋
在键盘上敲出短短一行命令:请给我写一首充满喜悦/悲哀/的歌,等待少焉,一首完全的、乃至带有人声、歌词的”歌曲“就已经完成——进入2024年,Suno等产品带来的热度还没散去,如今海内已经有不少瞄准AI音乐领域的产品,如雨后春笋般涌现。
36氪此前宣布的「歌歌AI」是个中的一员。这家公司近期得到新一轮数百万元投资,投资方为锡创投。
音律闪动成立于2022年8月,瞄准AI天生音乐方向,其紧张产品为「歌歌AI」app。
音律闪动CTO王枢沛见告36氪,音律闪动的团队为来自互联网大厂的技能专家,以及在音乐家傍边的资深制作人。在天生式AI涌现前,团队就已经有通过AI技能来探究在音乐领域中的运用——早在2016年,团队成员就开始开拓AI写歌产品,并有项目创业履历。
真正匆匆使团队创业的,是在2022年旁边看到以Transformer架构为主的技能打破,“我们认为,这个技能能够真正改变音乐家当。”王枢沛表示。因此,从2023年景立开始,音律闪动就开始从底层模型开始演习,在经历2023年的小程序版试运营后,在4月完成了独立的app开拓,近期刚刚上线。
“让所有人都成为音乐人”是歌歌AI的目标,从产品形态来看,歌歌AI是一款面向所有爱音乐的用户的AI写歌软件。利用方法也非常“傻瓜式”,随意马虎上手——
用户进入app界面,即可看到三种模式:自由模式、惊喜模式、纯音乐模式,通过对话和“AI制作人”沟通,天生自己想要的音乐。
在自由模式下,用户可以输入大略一句话的Prompt,让AI天生拥有详细主题、完全旋律和人声的歌曲。
比如,36氪就以自由和勇气为主题,请AI帮忙写一首歌曲,不到1分钟内,歌歌AI就天生了一首时长为2分20秒的《希望之歌》,并且带有完全填词。
来源:歌歌AI
整首歌拥有比较和谐的旋律和编曲,并且旋律变换也相对丰富。不过在填词上,还是有个别词句会不通,或者断句尚有问题,但用户可以通过手动调度来完成歌词修正。哪怕不懂乐理,还可以通过大略点选操作,来调度每个字的音高。
来源:歌歌AI
“除了修正歌词和旋律,还有包括AI演唱的这个声音,用户也可以在选择付费后进行修正,更换本钱身的声音。”王枢沛表示。
对付哀求更高的用户,歌歌AI还供应了更专业的“惊喜模式”,能够天生知足商业级场景的歌曲。
在这一模式下,用户能够对音乐风格、详细的配器提出更多哀求。AI能够天生更完全的旋律,会有完全的主歌、副歌、桥梁等构造。
并且,人声的变换也更加丰富——无论是颤音、旋律的高低变换过度都更自然,听起来更靠近自然人声演唱的状态,“AI感”减少很多。
在所有模式下,歌歌AI都基于一定的免费积分,用户可以花费积分以天生音乐。一旦用户对AI天生的demo比较满意,希望“扩写”,就能在对话框里和“AI制作人”对话,以修正风格等等,同时付费来让AI天生更完全的歌曲。目前的三档付费价格分别为包月18元、48元、98元。
音律闪动COO王枢沛对36氪表示,惊喜模式利用的是端到真个大模型技能,为了担保音乐效果质量更高,暂时不支持详细的歌词和人声修正,这也是与市情上大部分AI天生音乐产品比较,歌歌AI的上风所在。
“AI笔墨、图片天生现在都有开源框架,技能层面是比较开放的,但从AI天生音乐赛道整体来看,技能路线是比较封闭的,各家都有自己的演习技能差异。”王枢沛表示。
总体来说,上一代将AI技能运用到音乐中的考试测验,普遍能做到的程度是,师长西席成MIDI音乐,即大略将旋律数字化,形成较为单调、机器感的单旋律。
在上一代AI技能逐步成熟之后,AI天生音乐进入到了用小模型、专家系统演习的阶段。大略而言,一种办法是通过人工标注大量的音乐片段,分“科目”演习模型,比如旋律、歌词、编曲等,都有单独的小模型。等到这些模型能够产出比较成熟的片段之后,再“拼接”起来,形成完全旋律。但这种方法的缺陷是,由于各个元素是割裂的,拼接之后的机器感难以肃清,也很难达到和谐的效果。
而从AI天生音乐的演习上,为了担保歌曲能做到质量更高、更自然,歌歌AI对标外洋产品,选择了端到真个大模型路线,即音乐数据不须要经由特殊细致的处理,就输入到模型中进行演习。这样能够天生比较完全、统一的旋律。
歌歌AI的另一个亮点在于,并不局限于“用AI写歌”的定位上,而是希望能够基于天生式AI技能,真正让音乐创作、分发办法的链条发生根本性变革。
音律闪动团队认为,目前音乐平台的推举音乐内容千篇一律,并且推举内容页不真正相符需求。“全国现在每天大概产生新产生约十几万首歌,但天生式AI技能能够让这个数字变成成百上千万。”王枢沛表示,AI技能的遍及,也会让人们天生更个性化的音乐,成为冲破现在音乐巨子垄断的机遇。
除了歌曲天生等基本功能外,歌歌AI也拓展了多个板块,涉及天生和分发。
比如,用户通过AI模型录入自己声音并天生歌曲,可选择不同风格和曲风,乃至发行全网。
歌歌AI近期也正在与海内紧张音乐平台洽谈对接,往后希望做到的效果是,用户天生音乐后可以做到自动修音、AI混音处理,末了——全网一键发行,用户能够通过自己天生的AI音乐,得到版税。
并且,和短视频的结合也是主要的传播节点。当前,歌歌AI已经能够支持下载带有AI音乐的小视频,未来也会拓展到AI天生视频、直播场景。
本轮融资后,歌歌AI团队也会连续加速产品迭代,并且投入到市场增长方面。
团队方面,目前歌歌AI团队不到10人,CEO龙勇拥有20年音乐制作履历,曾是中国好声音、中国有嘻哈、TME官方互助伙伴,有丰富制作运营音乐和版权履历;COO王枢沛是浙江大学工学/ 美国伯克利音乐学院音乐制作和吉他演出双专业学士;CTO张文铂为「我要写歌」APP创始人。