您当前的位置:周末画报 > 新闻 > 热点 > 3秒就可模仿逼真人声,AI语音系统有什么用

3秒就可模仿逼真人声,AI语音系统有什么用

摘要: 专家警告AI语音可能会被用于诈骗

iWeekly

2022年出现了一系列有趣的AI工具,AI绘画可以根据文本提示创建图像、艺术品甚至视频;AI写作如ChatGPT也引起了人们对写作未来的兴奋和恐惧。而最近,人工智能的另一个强大用处也进入人们的视野——AI拟音。据悉,微软研发的新语言模型Vall-E仅需3秒钟的样本录音即可模仿任何声音。逼真的声音模仿使Vall-E具有一定的安全隐患,但部分媒体认为妥善使用AI语音则会有很大帮助。

 


逼真的模仿

微软将VALL-E称为“神经编解码器语言模型”,它根据文本输入和目标说话者的短样本生成音频。微软研究者在发表的报告中写道:“Vall-E出现了理解上下文的学习能力,可用于合成高质量的个性化语音,只需录制3秒的声音作为声学提示。实验结果表明,就语音自然度和说话人相似度而言Vall-E明显优于其他AI语音系统,是目前最先进的零样本(文本到语音)系统。”

 

此外,Vall-E不仅可以模仿音调或质地,还可以模仿说话者的情绪基调以及说话环境的声学效果。也就是说,如果目标语音存在干扰,VALL-E也会像有干扰一样模仿该语音,“我们发现VALL-E 可以保留说话人的情感和声音环境。”在测试合成句子中,Vall-E就曾睡眼惺忪地说了这样一句话:“我们必须减少塑料袋的数量。”



为了模仿语音,目标说话人的语音必须与训练数据紧密匹配。研究人员表示,他们已经对VALL-E进行了6万小时的英语语音训练,其中语音来自Meta的LibriLight音频库中的7000多名演讲者,这个训练量比现有其他系统都大数百倍。通过这种方式,AI可以使用其“训练”来尝试模仿目标说话者的声音或大声朗读所需的文本。

 

VALL-E是微软在人工智能领域的阶段性成果,这家公司在这方面投入了大量资金,并且是OpenAI的支持者之一。OpenAI就是ChatGPT和DALL-E的幕后公司。这家软件巨头在2019年向OpenAI投资了10亿美元,近日,美国财经媒体semafor.com上的一份报告称微软正在考虑向该公司再投资100亿美元。

 

AI语音安全吗?

然而,文本到语音AI拟音存在一定的安全隐患。伴随着一个警告,研究人员表明:“由于Vall-E可以合成并保存用户的语音,它可能会出现被滥用的潜在风险,例如欺骗目前软件的语音识别功能或是冒充特定的说话人。”例如,人们可以使用VALL-E使骚扰电话听起来更加真实,从而欺骗人们;政治家或具有社会影响力的人也可以被冒充;需要语音命令或语音密码的应用程序也可能受到威胁。

 

此外,VALL-E还可能会侵占目前声优的工作。洛杉矶一家专注于科技与创业新闻的媒体在评述中提到:“如果更多像詹姆斯·厄尔·琼斯(James Earl Jones,演员)这样的名人同意VALL-E使用他们的声音,或是企业将可以从供应商处购买到可以完美模仿艾迪·墨菲(Eddie Murphy,演员、歌手)的软件时,那么为什么要聘请一个相对不知名的人进入录音室并花费数小时进行配音呢?”

 

对于Vall-E存在的安全隐患,微软公司发表了一份伦理声明:“这项工作中的实验是在假设模型的用户是目标演讲者并得到演讲者认可的情况下进行的。当模型被推广到现实世界中无法辨别说话人时,它将包括一个协议来确保说话人批准使用和合成他们的声音。”目前,这款被微软称为“神经编解码器语言模型”的Vall-E尚未向公众开放。

 

AI语音的多用途

虽然AI语音存在一定的安全隐患,但多年来,互联网公司从未停止开发更真实的AI语音系统。英国的Papercup一直在为Sky News,Discovery,Cinedigm等主要媒体品牌提供多种语言的自然人声AI配音。Sonantic公司通过将非语音声音融入其音频模拟中,例如微小的嘲笑声、微弱的呼吸声,或咯咯笑声,以生成极其逼真的效果。

 

不可否认的是AI合成语音有很多潜在优势,在适当的环境下,AI语音可以帮助节省大量时间和金钱。例如,一位创作者存入自己的声音就可以让AI帮忙录制整个有声读物。在处理重要公共卫生信息或重要安全通知时,音频工程师可以尝试更多的声音和说话风格,以找到最有效的声音并广为流传。

 

在2014年接受喉癌治疗后永久失声的演员瓦尔·基默(Val Kilmer)就曾与Sonantic公司合作,为自己在日常生活中创造了一种由人工智能驱动的说话声音。而当日渐成熟的AI语音技术与AI对话技术相结合,逼真声音将为虚拟对话带来更真实的体验。新聊天机器人Character.AI可以让用户与几乎任何人交谈,不管是历史上诸如马克思、伊丽莎白等名人,还是去世的亲人。那么,将Vall-E与Character.AI结合,怎样的元宇宙将展现在我们面前?


新闻来源:福克斯新闻、纽约时报、印度时报,图片来源于网络

iWeekly周末画报独家稿件,未经许可,请勿转载



相关推荐 更多>
请填写评论内容
确定