OpenAI模仿斯嘉丽·约翰逊，毫无必要。（openingday什么意思）

前两周在OpenAI发布会上大放异彩的ChatGPT-4o Sky语音助手，最近悄然下架。

OpenAI发布会上展示的核心功能“多模态语音对谈”开放的进程再次延缓——在OpneAI官网上，GPT-4o向全部用户免费开放的时间从原来的几周，悄悄咪咪地改成了几个月。

OpenAI发布会上展示的核心功能“多模态语音对谈”开放的进程再次延缓——在OpneAI官网上，GPT-4o向所有用户免费开放的时间从原来的几周，悄悄地改成了几个月。

OpenAI模仿斯嘉丽·约翰逊，毫无必要。_图1

这当然可能和扩容时遇到的技术问题有关，但还有一个问题是，最近知名演员斯嘉丽·约翰逊的法律团队向OpenAI发了两封信，要求OpenAI公布ChatGPT-4o语音“Sky”（简直是斯嘉丽的谐音）的制作过程，因为这个声音听起来非常像斯嘉丽·约翰逊。

如果还是不好理解的话，你可以想象一下某导航软件推出新语音包，听起来非常像林志玲的声音，导航软件的老板是林志玲的粉丝，语音包的名字还叫做玲玲。

OpenAI模仿斯嘉丽·约翰逊，毫无必要。_图2

斯嘉丽·约翰逊向美国媒体表示，听到Sky的声音后，她“感到震惊、愤怒”，不敢相信奥尔特曼竟然选了一个和自己声音一模一样的配音，“连我最亲密的朋友和新闻媒体都无法区分出来”，约翰逊说。

尽管OpenAI坚称GPT-4o的声音绝不是斯嘉丽·约翰逊，OpenAI CTO米拉·穆拉蒂（Mira Murati）在接受采访时甚至说，“完全没有学斯嘉丽·约翰逊的意思，为了这个事我甚至得专门去听听斯嘉丽·约翰逊的声音是啥样的”。

不管穆拉蒂是否熟悉斯嘉丽·约翰逊这个名字，但OpenAI CEO奥尔特曼肯定是知道的，因为——

奥尔特曼是斯嘉丽粉头啊！

OpenAI模仿斯嘉丽·约翰逊，毫无必要。_图3

这个词明确指向了2013年的科幻电影《她》。在这部电影里，男主角爱上了由斯嘉丽·约翰逊配音的人工智能Samantha，奥尔特曼也曾在采访中表示，《她》是他最喜欢的电影。

而据斯嘉丽写给媒体的信，奥尔特曼直到GPT-40发布前两天还在极力邀请她配音。

“去年9月，我收到了奥尔特曼邀请我为GPT-40进行配音的邀请。他告诉我，我的配音可以成为科技和创意之间的桥梁，让消费者在从人类到人工智能的巨变过程中感到舒适。他说他觉得我的声音会给人们带来安慰。”约翰逊写到。

但她出于个人原因，十分感动然后拒绝了奥尔特曼。

奥尔特曼并没有就此放弃，在ChatGPT发布会的前两天，他再次联系了约翰逊的经纪人，请求她重新考虑。但很显然，这是一招先斩后奏，在打电话之前，GPT-4o就已经做好了。

发布会之后，所有人都惊讶地发现Sky的声音与约翰逊的声音非常相似，就连美国国民节目《周六夜现场》也公开调侃GPT碰瓷，质疑追求这种声音的意义何在。他们认为，如果声音脱离了约翰逊本人的身体，那还有谁会对它感兴趣呢。

OpenAI模仿斯嘉丽·约翰逊，毫无必要。_图4

奥尔特曼：我想听更多关于这个话题的内容

约翰逊在信里继续写到：

“由于OpenAI的行为，我被迫聘请了法律顾问，以便他们能够详细说明创建Sky的制作过程。”

在这之后，OpenAI暂时停止了对Sky的语音进行处理。

Sky的声音是如何产生的？

根据约翰逊的要求，OpenAI发布了一篇博客，详细描述了GPT-4o语音的制作过程（尽管目前还没有其他证据证明OpenAI所说的是真实的）。

OpenAI称，他们经过五个月的努力，从400个声音中挑选出了GPT-4o的五个声音（分别是Breeze、Cove、Ember、Juniper 和 Sky）。他们与专业配音演员、经纪公司、选角导演和行业顾问合作完成了这个工作。

在选择合适的声音时，他们制定了一套标准，其中包括几个重要的考量角度：

1、具有丰富背景或能够流利使用多种语言的配音演员，将会得到额外加分。

2、声音要给人一种“永恒（timeless）”的感觉，即不受时间限制的感觉。

3、声音要平易近人，能够引起人们的信任和共鸣

4、声音温暖、迷人、鼓舞人心、富有魅力，音调丰富，给人一种舒适、愉悦的感觉。

5、声音自然，容易被听到

虽然其中有些标准挺抽象的（比如说一个声音要怎么又有永恒感又平易近人？），但不得不说，DAN和Sky能有这么高的人气和感染力，和它们的声线是密不可分的。

之后，OpenAI和每个配音演员详细介绍了GPT-4的功能、局限性和相关的风险，以确保每个配音演员在加入之前都充分了解了语音模式的范围和意图。

OpenAI补充道：每位演员的报酬都高于市场最高水平，只要他们的声音在我们的产品中使用，这种报酬就会持续下去。但为了保护配音演员的隐私，OpenAI不能透露Sky配音演员的具体姓名。

这场争端对约翰逊来说只是一点小伤，但对OpenAI来说可能是致命的打击。

在Deepfake之后，公众对于利用AI技术进行人脸和声音替换的潜在危险已经非常敏感了。作为行业的领导者，OpenAI本应该在安全方面做出更大的努力，但却被指责未经允许使用公众人物的声音来训练AI，这进一步削弱了人们对AI的信任。

此外，OpenAI一直有推迟发布和技术不完善的问题，去年GPT-4的读图功能延迟了6个月才实现，今年发布会上的承诺也一直未能兑现，这让人怀疑OpenAI是否为了抢先发布新产品而推出了不完全成熟的技术。经过这次声音争议，GPT-4o的实现时间再次被延后，实在有些滑稽。

甚至想问问奥尔特曼，GPT-40的声音是否类似于电影《她》中的人工智能角色？声音的重要性是否被高度重视？是否真的有用户对声音有所关注？