巴黎:上周,OpenAI被迫向演员斯嘉丽·约翰逊道歉,原因是在其最新的聊天机器人上使用了她的声音——或者类似的东西,这让人们关注到语音克隆技术。
尽管OpenAI否认他们使用的声音是约翰逊的,但首席执行官萨姆·奥特曼在社交媒体上用一个词“她”标记了这款新模型,这并没有帮助他们。
约翰逊在电影《她》中为一个人工智能角色配音,奥特曼之前说过这是他最喜欢的关于人工智能的电影。
从一开始,人工智能语音克隆就被证明是有问题的。
去年,英国公司Elevenlabs发布了一款语音克隆软件,由于各种错误的原因而走红。
网络恶作剧者们立即开始推出深度造假的名人——《哈利波特》女星艾玛·沃特森被曝光正在阅读希特勒的《我的奋斗》。
执法部门警告称,人工智能克隆体可能被用来通过电话向亲人勒索钱财。
这项技术在过去一年中发展迅速,变得更加现实和细致。
丹麦企业家、英国人工智能公司synia的首席执行官维克多·里帕贝利告诉法新社,这在很大程度上要归功于两年前发布的一个名为“乌龟”的程序。
该程序的开发人员以一种非结构化的方式将数千小时的语音数据投入到他们的模型中,发现它不仅学会了说什么,还学会了怎么说。
“这是一个相当大的范式转变,”里帕贝利上周在巴黎举行的VivaTech会议间隙说。
Tortoise是一个开源程序,Elevenlabs是第一个使用它进入市场的。
OpenAI使用类似的系统,但他们没有公布任何细节。
“不太好”
围绕语音克隆的许多争议都集中在人们滥用该软件的担忧上。
但针对OpenAI的指控是不寻常的,因为它本身就是被指责反复无常的公司。
TALKR的首席执行官Katya Laine说:“很不幸,OpenAI这么做了——真的不太好。”他在VivaTech对法新社说。
“如果他们真的在她不知情的情况下克隆了她的声音,那么我认为这是非常非常糟糕的,”里帕贝利说。
这两位企业家是数百名利用人工智能语音程序的企业家之一,他们认为这些程序将提高公司的效率。
莱恩的公司提供虚拟语音助手——本质上是人工智能客户服务代理。
她说,她公司的系统现在可以在没有人工干预的情况下解决25%到30%的电话。
synthesis公司擅长制作视频化身,Riparbelli说,它允许任何办公室职员将文本或幻灯片转换成由逼真的人工智能播放的视频。
Riparbelli和Laine都允许他们的客户使用他们自己的虚拟形象、现成的产品或OpenAI和Elevenlabs等公司提供的产品。
里帕贝利说,《合成》使用的演员的形象和声音都获得了两年的授权,在最初的一段时间后,他们可以选择续签。
如果在未经演员同意的情况下使用他们的声音,就会出现问题。
“奇怪的先例”
上周在巴黎举行的开发者大会上,OpenAI展示了一套新工具,这次惨败给大会蒙上了阴影。
在一个礼堂的大屏幕前,OpenAI的开发者体验主管罗曼·休特(Romain Huet)对着自己的手机轻松地聊天。
几秒钟后,他简短的声音样本就被处理了,可以听到他在一个生成的视频中用五种语言解说。
这次演示展示了该领域的发展速度,但头条新闻已经被写出来了。
《华盛顿邮报》在一份时事通讯中问道:“OpenAI有多蠢?,其他评论人士则暗示,神童奥特曼只不过是一个小贩。
尽管如此,Riparbelli对OpenAI的说法持开放态度,即他们使用了另一个听起来像约翰逊的演员。
“如果不是她,而是听起来很像她的人……你的界限在哪里?”里帕贝利问道。
“如果他们不允许使用一个听起来很像她的人,那就开了一个非常奇怪的先例。——法新社
×