互联网资讯 / 人工智能 · 2023年11月13日 0

AI作曲的未来方向

10月8日,韩国新人歌手夏妍发布了由人工智能作曲机器人EvoM创作的单曲《Eyes on you》,她因此成为全球首位依靠AI作曲出道的歌手。

EvoM是由韩国光州科学技术院人工智能研究生院研发的首个AI作曲机器人,在《Eyes on you》的制作中负责作曲和编曲。其研发者安昌旭表示,希望AI创作的歌曲能够在K-POP排行榜上占有一席之地。

启航:音乐制作自动化的愿景

早在上世纪,音乐制作的计算机化就已引起关注。1956年,列哈伦·希勒的研究室中诞生了世界首首完全由计算机生成的音乐作品——弦乐四重奏《伊利亚克组曲》。1995年,阿尔佩推出的EMI作曲系统成为早期成熟的古典音乐创作系统之一,利用拼接的方式再现已故作曲家的音乐风格,创作出类巴赫的创意曲、器乐协奏曲、组曲,以及类莫扎特的奏鸣曲和类肖邦的夜曲。

随着人工智能技术的发展,近年越来越多的企业和机构开始探索科技与艺术结合的领域,各种作曲算法层出不穷,不少虚拟音乐人也逐渐崭露头角。

2016年,Google的机器学习项目马真塔(Magenta studio)通过神经网络创作出一首时长90秒的钢琴曲。同年,索尼计算机科学实验室(Sony CSL)开发了Flow MacHines平台。

Flow MacHines利用马尔科夫链分析现有歌曲,提取旋律和和弦的关键信息,作为变量学习音乐风格,实现不同风格歌曲的转换和融合。该平台的代表作是一首披头士风格的歌曲《爸爸的汽车》(Daddy’s Car)。此外,Sony CSL还推出了名为“DeepBach(深度巴赫)”的神经网络,利用巴赫的352部作品进行训练,最终创作出2503首赞美诗。

2016年,AIVA(Artificial Intelligence Virtual Artist)成为首位正式获得世界认可的AI虚拟作曲家。AIVA通过学习15000首由莫扎特、巴赫、贝多芬等大师创作的作品,运用深度学习技术建立自己的音乐理解模型,创作出全新的作品。

AIVA已在法国和卢森堡作曲家协会(SACEM)合法注册,成为该协会首位非人类会员,并拥有自己的署名版权。

今年2月,美国数字研究机构space150模仿知名说唱歌手Travis Scott的人声和音乐风格,创造了说唱机器人Travis BOTT。

研发团队采用附加神经网络技术(Additional Neural Network),生成“Travis Scott风格”的旋律和打击乐伴奏,并将Travis Scott的歌词输入文本生成器模型,生成机器自动仿照其风格的歌词。

最终,Travis BOTT完成了自己的创作——《Jack Park Canny Dope Man》。团队还使用基于AI的深度伪造技术(DeepFake)为这首歌拍摄了MV。就音乐效果而言,Travis BOTT几乎完美地模仿了Travis Scott,融合了其作品及个性特征。这个项目也进一步验证了人工神经网络技术的快速发展,助力探索未来AI在音乐中的应用价值。

造船原理:多种算法模型的结合

现代人工智能作曲技术背后融合了多种算法模型,包括人工神经网络、马尔科夫链和遗传算法等。AIVA和Travis BOTT均采用了基于人工神经网络的深度学习技术。

人工神经网络模拟生物神经系统的行为特征,进行分布式并行信息处理。程序员需要构建一个多层的“神经网络”,在各层级中编写代码,以处理不同输入和输出点之间的信息。当作品数据输入后,人工神经网络会识别其中的规律,并学习音乐旋律、节奏、音高和强弱变化。

这种学习的主要目的是进行预测,而非生成作品。AI程序在进行预测时,会在遇到新的验证数据集时验证其准确性,并将正确与错误的反馈记录下来。

通过不断的高速学习,AI的预测能力会不断增强,最终掌握程序员整合的数据曲风,并创作出自己的作品。人工神经网络为传统算法作曲提供了一种新的方法,其优势在于能够学习音乐作品的整体特征,但需要大量样本进行训练。目前,国内外有多种基于此算法的AI作曲系统,如LSTM神经网络,确保所创作音乐的完整性。

除了人工神经网络,马尔科夫链也被广泛应用于算法作曲领域。这是一种随机选择过程,主要用来生成具有特定风格的旋律,仿佛按照特定标准构建的转换表来依次选择音符,并计算下一个音符出现的可能性。这种方法模拟了作曲家创作音乐时的思维,但无法完整建模整部作品的曲式结构。遗传算法则模仿生物进化过程,通过适应性函数优化样本和全局。

在遗传算法中,变异算子可以模拟创作过程中的灵感闪现,留下最具代表性的作品来生成新的旋律。然而,该算法的设计壁垒在于适应性函数尚无统一标准。

版权的“暗礁”:AI作曲面临的主要问题

由于AI音乐的生成依赖算法模型,使得计算机需在大量现成作品中寻找“规律”,并根据这些规律提取特定乐章片段,重新排列组合,这必然涉及到版权问题。

AI如何判断研究人员提供的曲库中哪些作品受版权保护?AI作曲成果是否侵犯学习对象的版权?例如,AIVA最初以古典音乐为学习对象,其使用的莫扎特和贝多芬等人的作品版权时效已过,因此没有版权问题。

AIVA的研发团队特意选择古典音乐作为学习对象,主要是为了规避版权风险。而像Travis BOTT所使用的Travis Scott的资料则需要授权,在此基础上创作的作品是否算对Travis Scott的抄袭,仍然是一个热门话题,相关讨论也未有明确的判断标准。由此可见,当前的人工智能作曲技术依赖于算法,受限于曲库的音乐“规则”,尚无法突破既有规律进行创作,这也是AI作曲面临的另一个技术难题。

即便AI作曲技术不断优化,能够创造出完全原创且不涉及侵权的作品,这些作品依然面临版权认证的问题。随着AI创作技术的成熟与普及,某些国家已开始在法律上明确AI作品的版权归属。

1988年,英国正式颁布了《版权、设计和专利法案》(Copyright, Designs and Patents Act 1988),其中对计算机生成作品进行了明确规定:“为计算机生成之作品进行必要程序者,视为该作品的作者,其保护期限为作品完成创作之年的最后一日起50年后届满。”

规定AI作品的版权归属于“进行必要程序者”,同时也明确了进行程序的人,包括程序员、使用者,也可能是人工智能系统或设备的投资者。

2017年,世界知识产权组织(WIPO)杂志提到:如果一部作品的创作过程中“人类的参与有限,或根本没有人类参与”,著作权法可以有两种潜在的生效方式——著作权法可以“拒绝”对计算机生成的作品进行版权保护,也可以将此类作品的作者归属于程序的创建者。目前国内在解决此类问题时也基本遵循这一思路。

2018年,上海一家公司未经过授权,将腾讯开发的自动化编写程序DReaM wRITeR生成的财务报告复制到其网站。深圳市南山区法院裁定该公司侵犯腾讯版权,需承担民事责任,赔偿腾讯1500元人民币。

中国现行的《著作权法》尚未明确界定AI作品的版权归属,但此裁定或将成为AI创作领域的重要里程碑。《著作权法》规定:“著作权是著作权法赋予民事主体对作品及相关客体所享有的权利。”其中,民事主体指公民、法人或非法人组织。《著作权法》保护的对象是民事主体的独创性思想表达,AI作为非民事主体无法单独享有著作权,但只要在作者名单中添加人类作曲家或研发者的名字,就能解决这一问题。尽管人工智能无法成为法律保护的主体,但对其作品版权的保护也开始得到法律认可。

没有感情的辅助器:方舟的航向

人工智能作曲技术的日益成熟,正在音乐行业引发一场不小的变革。尽管AI已能通过读取和记忆大量乐曲获取规律,计算音符节奏的出现概率并进行排列组合来“创造”音乐,但音乐的核心并非在于音乐本身,而是“人”。音乐源于人类的情感流动。《礼记·乐记》对音乐起源的解释非常恰当:“凡音之起,由人心生也。人心之动,物使之然也。感于物而动,故形于声;声相应,故生变;变成方,谓之音。”作曲家和演奏者通过旋律和节奏表达情感,而观众则通过聆听音乐与之产生共鸣。