变声器Out!加拿大公司开发“语音合成”技术,用AI模仿总统讲话
IT之家、搜狐科技2018/4/18 14:51:28
说到变声器不少人第一反应就会想到《名侦探柯南》中柯南使用的领带变声器,但现实中的变声器只能模仿几种特定的模板,动画中的场景似乎离我们还很远。
不过这种场景或许就要实现了,加拿大一家名为“琴鸟”(Lyrebird)的公司开发出了新的“语音合成”技术,它分析约一分钟的录音后,就能利用语音模仿演算,模仿出任何人的声音,更厉害的是,还能在声音中加入“感情”元素,让声音听起来更逼真,即使是想要变奥巴马也不是难事。
语音合成技术,简单一点说,就是通过计算机等技术,将文字信息转化为语音信息,然后播放出来。这项技术有着漫长的历史,最早可以追溯到1779年,Kratzenstein 研制出一种机械式语音合成器。后来,由于电子技术兴起和加入,1939年贝尔实验室H. Dudley 制作出一个电子语音合成器。而近期,又发展到 TTS,即“文本到语音”技术,它结合了芯片、人工智能、软件等技术,将文字转化为语音。
语音录制与合成
而Lyrebird是由三名蒙特娄大学博士联合创办,他们利用神经网络训练原始的音频样本,然后生成新的声音。只要先将想要变换成的目标人物声音录音1分钟,丢给“Lyrebird”处理,就能得到一个特别的密钥,利用这个密钥就可以生成目标人物任何想说的话。
该项技术的创新和独特之处
1.声音独特
开发者可从几千种不同的预定义声音中进行选择,或者根据需求,为应用程序设计独特的声音。
2.实时生成
通过GPU集群,不到半秒种的时间,就能够生成1000条句子。
3.控制情感
可以注入不同的情感效果,例如压力、愤怒、同情等,生成的声音不是机械的,而是富有感情的。
Lyrebird目前内置了上千种声音,包括川普、奥巴马、克林顿等知名人物,感兴趣的朋友可以到Lyrebird官网录制自己的声音听一下。
(编辑/周末)