主题 : AI语音真假面:你的“声音DNA”可能会被复制
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605029
威望: 529103 点
无痕币: 27 WHB
贡献值: 0 点
在线时间: 62191(时)
注册时间: 2008-12-25
最后登录: 2024-04-28

0 AI语音真假面:你的“声音DNA”可能会被复制

如果有一种技术可以一秒复制或模仿你讲话,你会感到惊喜还是惊恐?
进入2019年,AI技术的应用落地越来越多样化。科大讯飞、搜狗等技术公司相继发布了语音合成技术的应用。通过AI手段,用户可以一秒变声社会名人或者其他想模仿的声音。
互联网技术在悄无声息地改变我们的生活,对人工智能企业来说,语音识别技术的广泛应用已不是难事。但背后的伦理道德和安全隐患,或将成为伴随AI技术发展不容忽视的一个问题。
实时变声技术受AI公司热捧一秒可换声
“嗨,大家好,今天非常开心,来到科大讯飞新品发布会,一直好喜欢科大讯飞哦……”
这是发生在科大讯飞2019新品发布会上的一幕,科大讯飞董事长刘庆峰通过技术,现场模拟了单田芳、林志玲和罗永浩的声音来做开场白。尤其当罗永浩声音响起的时候,不少人以为老罗到了现场。
“你看到的是刘庆峰,但听到的是老罗的声音。”台上的刘庆峰表示,这是公司最新的实时变声技术。据悉,这项新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。

不止科大讯飞,也是在近期,搜狗CEO王小川在一场大会上展示了搜狗变声功能,通过手机软件,王小川模拟了高晓松和东北妹子的声音,引得现场连连发笑。他随后展示了歌曲中的声音替换,据介绍,系统先用14分钟对他的语音做了训练,然后把音色做迁移。
这是搜狗最新的语音合成技术,可以实现把任何人的声音转化成特定声音,秒变林志玲、马云的声音都可以。王小川表示,这不只是一个简单的语音合成,可以把语音语调情感做迁移。
目前,在搜狗输入法中,用户可以将自己的声音自由变换成喜欢的声音,在微信、QQ、陌陌等主要社交场景均可使用。搜狗提供了明星、卡通人物、游戏IP、方言等几个类别供19种特定声音。

▲王小川
其实,语音合成早就不是新技术,之前,我们见到更多的是将文字转化为声音,比如在导航、转写、智能音箱、Siri等智能语音助手等方面的应用,并不是真人在说话。
今年,很多AI公司发力语音合成在变声、语音cos等场景下的应用,将真人发出的声音转化成特定声音。
百度也有相关技术的落地应用,今年5月初,在中央电视台公益节目《等着我》中,百度大脑基于智能语音技术,合成了已故老兵的声音,帮助分别64年的老战友实现“重逢”。
据介绍,该技术使用百度端到端语音风格分离和建模方案,使用多组神经网络对语音的不同维度,例如音色、情感、风格等,进行独立的编码建模,从而指导最终合成。

这些AI技术落地应用的背后,一方面体现了AI技术应用的进展,和为社会带来的普惠价值理念。比如搜狗将语音变声技术、AI合成主播技术等与行业结合,在媒体、教育、内容制作、旅游等场景结合,将会带来更大的价值想象空间。
另一方面,未来可能存在的技术漏洞、技术滥用等风险也不容忽视。有网友就指出“小心被用于电信诈骗”“以后可能会收到‘马云’的电话”……


一音频领域业内人士认为,对于音频作为交互方式的工具型产品应该是有用的,但对于音频作为内容载体的线上音频平台,正面意义有待观察。
知足常乐
级别: 十方秋水

UID: 23
精华: 1
发帖: 261119
威望: 117132 点
无痕币: 2349 WHB
贡献值: 0 点
在线时间: 9390(时)
注册时间: 2007-11-24
最后登录: 2024-04-28

个人隐私和安全问题凸显啊
事能知足心常乐 人到无求品自高
Total 0.049927(s) query 5, Time now is:04-28 02:54, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛