变声器Out！加拿大公司开发“语音合成”技术，用AI模仿总统讲话-深圳科技新闻网

变声器Out！加拿大公司开发“语音合成”技术，用AI模仿总统讲话

IT之家、搜狐科技2018/4/18 14:51:28

说到变声器不少人第一反应就会想到《名侦探柯南》中柯南使用的领带变声器，但现实中的变声器只能模仿几种特定的模板，动画中的场景似乎离我们还很远。

不过这种场景或许就要实现了，加拿大一家名为“琴鸟”（Lyrebird）的公司开发出了新的“语音合成”技术，它分析约一分钟的录音后，就能利用语音模仿演算，模仿出任何人的声音，更厉害的是，还能在声音中加入“感情”元素，让声音听起来更逼真，即使是想要变奥巴马也不是难事。

语音合成技术，简单一点说，就是通过计算机等技术，将文字信息转化为语音信息，然后播放出来。这项技术有着漫长的历史，最早可以追溯到1779年，Kratzenstein 研制出一种机械式语音合成器。后来，由于电子技术兴起和加入，1939年贝尔实验室H. Dudley 制作出一个电子语音合成器。而近期，又发展到 TTS，即“文本到语音”技术，它结合了芯片、人工智能、软件等技术，将文字转化为语音。

语音合成技术1 标准.jpg

语音录制与合成

而Lyrebird是由三名蒙特娄大学博士联合创办，他们利用神经网络训练原始的音频样本，然后生成新的声音。只要先将想要变换成的目标人物声音录音1分钟，丢给“Lyrebird”处理，就能得到一个特别的密钥，利用这个密钥就可以生成目标人物任何想说的话。

该项技术的创新和独特之处

1.声音独特

开发者可从几千种不同的预定义声音中进行选择，或者根据需求，为应用程序设计独特的声音。

2.实时生成

通过GPU集群，不到半秒种的时间，就能够生成1000条句子。

3.控制情感

可以注入不同的情感效果，例如压力、愤怒、同情等，生成的声音不是机械的，而是富有感情的。

Lyrebird目前内置了上千种声音，包括川普、奥巴马、克林顿等知名人物，感兴趣的朋友可以到Lyrebird官网录制自己的声音听一下。

（编辑/周末）

首页

科技

图片

专题

视频

教学

About Us

变声器Out！加拿大公司开发“语音合成”技术，用AI模仿总统讲话