在AI面前,Rapper要率先失业了?
|
(原标题:在AI面前,Rapper要率先失业了?)
近期,美国数字研究机构Space150进行了一项有趣的试验:基于人工智能(Artificial Intelligence,简称AI)技术,模仿知名说唱歌手Travis Scott的人声和音乐风格,做出了一个说唱机器人"Travis Bott"。 这个试验的目的是为了看AI到底能够持续创造出什么。 事实上,"Travis Bott"真的创作了一首歌《Jack Park Canny Dope Man》,且歌词和旋律均由自己完成。同时,Space150还使用基于AI的人体图像合成技术"Deepfake",为这首歌拍摄了MV。 说实话,与以往的AI歌曲不同,这首AI歌曲在对真人继续学习后,近乎到底了真人的听感。国外网友在MV下面留言道。"better than real trvis(比真人还好)""Pretty amazing, this is only the beginning(太棒了,这仅仅是个开始)",甚至开始担心AI会奴役人类,但自己还是会买票去看。 原理上,Space150采用附加神经网络技术(Additional Neural Network)创造出旋律和打击乐伴奏,再将Travis Scott的歌词输入"文本生成器模型(Text Generator Model)",两周后,AI"Travis Bott"开始创建了歌词的韵脚(rhymes)。 从效果来看,Travis Bott模仿Travis Scott几乎达到了以假乱真的地步,完全融汇了Travis Scott作品以及人物魅力的最主要的外显特征,以至于被调侃可以加入Spotify的说唱热门歌单《Rap Caviar》。 与此同时,该项目也进一步验证了人工神经网络技术(Artificial Neural Networks)的进步,有助于探索未来AI在音乐中的应用价值。 不可否认的是,AI已经渐渐地嵌入到我们的日常生活中。在"互联网+"以及"工业制造4.0"的新时代背景下,具备通信、网络与人机交互功能的AI作曲覆盖到教育科普、艺术表演和娱乐服务等领域已是大势所趋。而面对AI音乐的优异表现,也让我们思考:音乐人在与AI音乐的共生中,是否会遭遇到AlphaGo式的碾压? 如何克隆 Travis Scott? 事实上,AI作曲(Algorithmic Composition,也称"算法作曲")并不稀奇,复制Travis Scott也并非难事。 早在2016年,索尼旗下的计算机科学实验室(Computer Science Laboratories ,简称Sony CSL)研究人员哈杰里斯和帕切特就曾开发了一个名为"DeepBach (深度巴赫) "的神经网络。他们利用巴赫创作的352部作品目来训练DeepBach,创作出了2503首赞美诗。 而第一个正式获得世界地位的AI虚拟作曲家则是由2016年诞生的初创公司Aiva Technologies推出的AIVA(Artificial Intelligence Virtual Artist)。它的创作方向主要是古典音乐、影视配乐,发展到现在也逐渐有了其他类型的作品,例如摇滚乐、流行乐等。作为虚拟音乐人,它通过了法国和卢森堡作者权利协会(SACEM)的合法注册,并拥有自己的署名版权。在AI领域而言,复制一位或多位音乐人的音乐风格的工作也许早已在进行中。
目前来看,无论是DeepBach、AIVA抑或是Travis Bott,AI作曲背后都是一种基于人工神经网络的深度学习(Deep Learning)技术。在这种深度学习中,程序员必须搭建一个多层"神经网络",并在多层的结构中分别加以编程,从而可以处理各种输入和输出点之间的信息。
来源于:2017·菠萝科学奖,人工智能主题解读 譬如说,DeepBach被输入的是巴赫的362部作品,AIVA被输入的信息是以巴赫、贝多芬、莫扎特等为代表的古典作曲家作品的大数据库,而Travis Bott被输入的则是Travis Scott的作品、人声以及音效。 在数据输入后,人工神经网络会找到众多被输入作品之间存在的规律,继而形成对音乐风格的理解。但这个音乐风格并不是最终的产物,其主要目的是用来预测,AI程序会带着它对音乐风格的预测继续运行,而在前方将会遇到下一个验证数据集。这个数据集会告诉它预测的正确与否,正确与错误的回馈都将被AI记住,在不断的高速学习中,AI的预测能力就会越来越强,最终掌握程序员大数据中归总后的曲风,进而能编写出自己的曲子。 而AI创作者"Travis Bott"的突破,则在于其不止是输入了Travis Scott的作品,更输入了人声及音效,文本与声音的输入与输出在深度学习上又更上了一个台阶。
来源于《I am AI 》系列短纪录片 这种深度学习,看似只是基于人类大脑的神经结构简单模式,但在某种程度上已经可以像人类一般"思考"了。这也使得AI能够在数据中理解并塑造高度抽象化的模型,例如旋律中的模型,或者人脸的特征。 但从人工智能音乐的发展沿革而言,人工神经网络只是AI作曲的主要技术之一,与其他算法相比,有其优点也有其劣势。就优势而言,具有自学能力、联想存储功能、高速寻找优化解的能力是人工神经网络较其他算法最卓越的地方。
来源于:2017·菠萝科学奖,人工智能主题解读 但其劣势也较为明显:1. 著名的"黑匣子"问题,意味着你不知道神经网络将会如何产出结果,更不知道为什么会产生这种结果;2.与认知不同,作曲是更高层次的智能活动;3. 耗时耗力;4. 数据饕餮,相较于传统的机器学习算法,需要更多的数据;5.算力成本较为昂贵。
在实践中,即便是最先进的深度学习算法,要实现真正深度神经网络的成功训练,仍需要数周才能完全训练完毕。而目前AI作曲在主要技术上尚不存在最优解,大多采用混合型算法(Hybrid Algorithm)。 如何避免AI作曲的版权风险? (编辑:52刷机网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |






