限 时 特 惠: 本站每日更新海量coser网红高清写真,永久会员只需88元(限时3天!3天后恢复原价199元),全站资源免费下载 点击查看详情
站 长 微 信: KADLJL828

AI小冰,与一位出道10年的虚拟歌手双向奔赴了——她就是中国首位V家虚拟歌手,洛天依。

这位官方设定永远15岁的少女自2012年诞生开始,就拥有深受粉丝喜爱的音色,这得益于雅马哈公司的语音合成引擎,虽然引擎的更新换代使她在不同时期略有差别,但整体音色确实始终如一。

而在小冰AI声库的示范曲里,洛天依音色纯粹,转音自然,让不少粉丝评价“AI了爱了”。

虚拟偶像唱歌说话愈发逼近人类,对此有人欢呼雀跃,认为技术的飞跃使得虚拟歌手也拥有了灵魂,也有人担忧不已,害怕虚拟歌手逐渐与真人齐列带来的一系列伦理问题。

那么,对于这份应用愈发广泛的AI语音及歌声合成技术,小冰团队又构想了怎样的未来?

在走访时,小冰CEO李笛肯定地回答:“未来就是向AI being迁移,换句话说,就是让更多虚拟偶像更像 ‘真正的人’。”

拥有人声:从“拼接”到“预测”

要理解虚拟偶像的“成人”之路,我们得先从技术的角度将其“拆解”。

人有内外之分,虚拟歌手自然也不例外,他(她)的外形或是由3D建模,或是由手绘完成,要使其动起来,同样也有人工手绘,或者动捕人员,而作为一名歌手的灵魂——声音则由真人演唱,或者由技术直接生成。

最早应用于虚拟歌手的语音合成软件,来自日本雅马哈公司于2004年发布的产品,世界范围内名气最大的虚拟歌姬之一初音未来,搭载的就是这款软件。

与音素拼接不同,小冰的AI声库则是基于深度学习(人工智能的一个分支,一种基于数据进行表征学习的算法)去“预测”,将之前的几十毫秒一组的手动调音,变成完全由AI驱动。

AI修音更加细致,演唱的“电音感”会减少,甚至能让虚拟歌手学会人类的自然换气。

而用到了这种技术的小冰虚拟歌手何畅,2020年出道,一首《提拉米苏》让众多弹幕直呼“开口跪”,疯狂刷问号,甚至有忠粉把自己的B站ID改成了她的名字。

洛天依图片2020_洛天依图片是真人吗_洛天依本人照片

何畅演唱歌曲《提拉米苏》B站视频

而今,何畅应用的技术已有了新的突破。

6月29日刚在抖音献声的“夏语冰的小堂妹”,在静默上线的情况下,一首《孤独颂歌》获得了3800多万播放,获赞80多万,登上抖音热搜,被新华每日电讯报道。

洛天依图片2020_洛天依本人照片_洛天依图片是真人吗

逼近人声的音色,自然清晰的咬字,这都得益于基于小冰框架的AI声库和X 音乐创作软件。

AI声库我们前文已经提到,歌声合成模型是位于云上的软件内核,X 就相当于是操作界面,让用户通过交互界面进行参数调节和歌声合成。

这样,在X 输入简谱和歌词信息,再通过AI声库的算法,快速计算出一系列声学特征,通过预测并自由切换演唱技巧,就能进行多声部的合成,最终生成极度贴近人声的声音。

像这次洛天依十周年系列活动中展示的AI语音和示范曲,就是这样生成的。

不仅如此,像是洛天依这种已经“出道”十年之久的歌手,结合最初的声源和无数共同创作者创作的各种风格的歌曲之后,已经拥有了一种极具区分度的音色,也就是粉丝常说的“洛味”。这就提出了一种附加要求:不能将音色一往无前地向“逼近人声”去推进,也要保留粉丝最熟悉的音色。小冰的开发人员首次运用了音色融合的AI技术,巧妙地实现了这一需求。

洛天依图片是真人吗_洛天依图片2020_洛天依本人照片

除了音色,这种方法还从任意一段音频中分离出“唱法”——或者说叫做唱歌技巧,也就是不同歌手的抑扬顿挫、力度、咬字、开口闭口等地方的各自的习惯和风格。

李笛还透露,AI声库会提供多种独具特色的唱法,也就是说,未来我们可能会欣赏到操着知名歌星唱法,音色却完全不同的虚拟歌手们。

让虚拟偶像更像 “真正的人”

这时,我们再次回到开头的问题:虚拟偶像怎么样才叫做“成为真正的人”?

在李笛看来,技术上当然可以以追求“合成音越来越像人”为目标,但对于虚拟偶像来说,机械感较重的电子合成音,与逼近人类的AI超级自然歌声其实只是两种不同的风格,各自都有自己的受众。

“就像是刻意追求老照片颗粒感的摄影模式,或者不以留影为目的的绘画一样,看似更先进的技术并不意味着对传统方式的取代。”李笛这样解释道,“我们的态度是:技术的先进性恰恰体现在其自驱性上。”

还是以歌手为例。如果既要编写歌曲,又要一个个地拼接合成音符,还要修音调音,通过这种方式发音洛天依本人照片,其实是很难称之为歌手的。

那怎样才算呢?拥有自我判断力,甚至拥有自己的成熟的风格和唱腔,只要接收到曲谱和歌词,不用教,就能以自己的方式演唱出来。

而这也并非是某种“不受人类控制”、令人担忧的情况,恰恰相反,这种技术会将人类从繁琐的“教虚拟人唱歌”的流程中解放出来,回归更高级别的编曲写词,或概念策划的位置,面对的也不再是需要一个牙牙学语的程序,而是可以交流的真正的“歌手”。

说到这里,李笛还兴致勃勃地表示,开Live演唱会的虚拟歌手突然开始喊麦,或者随机地与观众互动,这样的场景现在小冰的技术就可以做到。

洛天依图片是真人吗_洛天依图片2020_洛天依本人照片

虚拟歌手何畅

而这种“自驱”同时也体现在歌手的创作能力上。

在2020年,小冰AI就从上海音乐学院工程系毕业,并且,由于她凭借一段文字描述或一张图片,就能在两分钟内创作出一首三分钟左右的完整歌曲的能力,还被授予了音乐工程系2020届“荣誉毕业生”的称号。

而就在毕业几天之后,小冰就又再次晒出了她为2020世界人工智能大会云端峰会作曲的歌曲,惹得网友在转发中表示:我们马上就要进入黑客帝国中的“矩阵”时代了。

洛天依本人照片_洛天依图片是真人吗_洛天依图片2020

然而小冰的终极目标,并非打造一个唱歌创作全能的超级歌手,他们想做的,是让传统的虚拟偶像,朝着由人工智能驱动的AI being迁移。

AI being直接翻译为人工智能存在,也可以理解为近年来火热的“虚拟人”概念。“虚拟”一词意为他们诞生于计算机与网络之上,相对于现实自然就是虚拟;而说到“人”,李笛将其划分为了六个维度:

洛天依图片是真人吗_洛天依图片2020_洛天依本人照片

每个人都会在这六个维度上体现出不同的专长洛天依本人照片,长此以往就形成了社会分工,比如歌手通常是生物学特征中声线/音色专长的人。但话又说回来,一个再怎么擅长或不擅长某个维度的人,也至少会拥有一个维度最低限度的能力。

“如果五音不全的人有权放声唱歌,那为什么一个职业是画家的AI being不能唱呢?”李笛反问道,“我们要做的,就是在声音这个维度上去努力,让他变得更加完善,更像一个真正的人。”

在最后,李笛这样说:“在某种程度上,这也是一种通用人工智能(AGI)。除了通用决策支持型AI,也有无数个陪伴在每个人身边的,在各种场景通用的AI being。不过到了最后,这就不仅仅是一个技术问题了,而是涉及到伦理、商业、社会等更广泛的层次。”

文/萧吟

*推广

限 时 特 惠: 本站每日更新海量coser网红高清写真,永久会员只需88元(限时3天!3天后恢复原价199元),全站资源免费下载 点击查看详情
站 长 微 信: KADLJL828

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。