OpenAI 45分钟发布会：再次震撼AI界（open ai）

对于 AI 行业从业者来说，刚刚可能是一夜未眠。

北京时间11月7日凌晨，OpenAI开发者大会震撼登场。创始人Sam Altman及团队，仅用45分钟，揭开神秘面纱，发布了全新力作GPT-4Turbo，更快、更全面、更精密的AI，掌握了更强的控制能力。

同时，OpenAI 下调 API 的价格近 3 倍，降到了 1000 输入/美分，让在场开发者欢呼不已。

当然，更为重要的是，OpenAI发布了全新的「GPTs」，允许用户以自然语言构建定制化的GPT模型，而更令人兴奋的是，这些GPT模型可以轻松上传至即将推出的「GPT Store」！

如果说GPT-4Turbo是更强大的「iPhone」，那么GPT Store则可能是OpenAI朝着成为类似「苹果」这样的巨头迈出的重要一步。

而与竞争对手们仍然在「AI炼丹」的阶段不同，OpenAI已经着手构建一个看起来相当宏伟的生态体系。

OpenAI 45分钟发布会：再次震撼AI界_图1

GPT-4 Turbo，

更快，更经济

发布会伊始，Sam Altman宣布了GPT-4的一次重大升级，推出了GPT-4 Turbo版本，同时发布了ChatGPT和API版本。

Sam Altman表示团队一直在积极听取开发者的建议，对他们所关注的问题进行了六大升级，包括更长的上下文长度、更强的控制能力、模型的知识升级、多模态支持、模型微调定制以及更高的速率限制。

其中前四项主要涉及新模型性能的提升，而后两项则专注于满足企业开发者的需求。与性能提升同时，OpenAI还宣布了API价格的下调，堪称「多得益而无害」。

Sam Altman宣布GPT的六大升级|OpenAI

在这六大升级中，首先是上下文长度。

OpenAI以前提供的最大上下文长度为32k，而这次，GPT-4 Turbo直接将上下文长度扩展到128k，一举超越竞争对手Anthropic的100k上下文长度。

128k的上下文长度大致相当于300页标准大小的书籍文字量。除了能够容纳更长的上下文，Sam还表示，新模型在更长的上下文中能够更连贯和准确地进行表达。

其次，提供了更强的开发者控制选项，以更好地进行API和函数调用。

首先，新模型提供了JSON模式，可以确保模型以特定的JSON方式提供答案，使API调用更加便捷。

此外，新模型还允许同时调用多个函数，同时引入了种子参数，在需要时，可以确保模型返回固定的输出。未来几周，模型还将增加新功能，使开发者能够查看log概率。

第三，是模型内外的知识库升级。

ChatGPT发布大约一年后，GPT的知识库终于更新到了2023年4月。Sam Altman承诺未来将继续更新知识库，以确保其不会滞后。他表示：“对于GPT的知识停滞在2021年，我们和你们一样，甚至比你们更感到不满。

GPT内部知识库更新至2023年4月|OpenAI

除了内部知识库的升级，GPT-4 Turbo还改进了外部知识库的更新方式，现在可以上传外部数据库或文件，以为GPT-4Turbo提供外部知识库支持。

第四，或许是最不出人意料的，是多模态。

新模型支持了OpenAI的视觉模型DALL·E 3，同时也新增了文本到语音模型支持——开发者可以从六种预设声音中选择所需的声音。

多模态成为GPT的内置功能｜OpenAI

GPT-4 Turbo现在支持图像到图像生成。在处理图像相关问题时，OpenAI引入了安全系统以防止滥用。OpenAI还宣布将为所有客户支付与版权问题有关的法律费用。

在语音系统方面，OpenAI表示其语音模型远超市场上的同类产品，并且公开了开源语音识别模型Whisper V3。

第五项升级是模型微调与定制。

在8月，OpenAI发布了GPT-3.5 Turbo的微调服务。早期测试表明，经过微调的GPT-3.5 Turbo版本在某些任务中甚至可以超越GPT-4，尽管价格相对较高。现在，Sam宣布GPT-3.5 Turbo 16k版本也可以进行微调和定制，并且价格将比上一代更低。GPT-4的微调定制也正在申请中。

同时，OpenAI开始接受单个企业的模型定制，包括修改模型训练过程的每一步，进行额外的特定领域的预训练，以及特定领域的后训练等。Sam表示OpenAI无法提供大规模的模型定制，且价格不会便宜。

第六项，也是最后一点，是更高的速率限制。

GPT-4用户，发布会后即可享受每分钟速率限制翻倍的体验。如果不满意，还可以通过API账户进一步提升速率限制。

除了六大升级，还有API体系的全面降价。

新发布的GPT-4Turbo在输入方面的价格降低了3倍，输出方面降低了2倍，总体使用成本降低了约2.75倍。新模型的价格为每千输入token 1美分，每千输出token 3美分。API的价格下调引发了在场开发者的欢呼。

OpenAI 45分钟发布会：再次震撼AI界_图2

Sam还表示，在解决价格问题之后，下一个关注的问题将是速度问题，很快，开发者们将看到GPT-4 Turbo的速度大幅提升。

GPT Store来袭！

OpenAI 45分钟发布会：再次震撼AI界_图3

早在5月，OpenAI就开放了插件系统，首批上线了70个与大型模型相关的应用，涵盖了诸如猜词、翻译、查找股票数据等领域。

GPT Store风格酷似「App Store」｜OpenAI

当GPT Store功能首次亮相时，备受期待，许多媒体将其类比为苹果的App Store时刻，认为它将改变大型模型应用的生态。然而，尽管后来插件不断增加，但插件系统的影响力远远不及苹果应用商店。

然而，在本次发布会上，OpenAI对其应用商店的体系进行了重新规划，并将其扩展到全新领域——每个人都可以使用自然语言创建基于个人知识库的AI代理，并将其加入OpenAI的应用商店，分享收益。

OpenAI此次发布的应用不再称为插件，而选择了一个相对奇特的名字，GPT。而整个应用商店被命名为GPT Store，将于本月晚些时候正式推出。

按照Sam Altman的说法，每个GPT就像ChatGPT的一种专为特定目的定制的版本。”

“OpenAI员工试图让ChatGPT自我管理生活｜OpenAI

为了突出新的GPT应用，ChatGPT整个页面将有轻微的调整。在页面的左上角，除了ChatGPT，下方是新推出的GPT应用。

在演示中，我们可以看到一些较为复杂的插件，如Zapier，仍然存在于新的应用商店中，这些插件有望成为未来应用商店中的关键应用。

在演示中，OpenAI的Jessica Shay使用Zapier来链接她的日历和手机短信，通过与Zapier的对话直接安排自己的日程并通知同事。

然而，尽管Zapier等应用功能强大，但这些应用并非此次发布的重点。据Glassdoor数据，Zapier公司拥有500-1000名员工，而根据财富网站的报道，Zapier的估值已达到50亿美元。依赖这些应用来填充OpenAI应用商店，使其成为一个充实的生态系统显然并不现实。

因此，在这次发布中，OpenAI推出了一项重大新功能：允许不懂编程的人轻松定义一个GPT。

Sam Altman在现场进行了演示。

“在YC工作了很多年，我总是遇到开发者向我咨询商业建议。” Sam Altman说，”我一直希望有一天会有一个机器人可以帮我回答这些问题。”

然后，Sam Altman打开了GPT Builder，首先提供了有关这个GPT的定义，类似于帮助初创公司创始人思考他们的业务理念并获得建议。然后，GPT Builder在对话中自动生成了这个GPT的名称、图标，并通过与Sam的对话来询问是否需要对生成的名称和图标等进行调整。”

“Sam Altman正在创建一个「创业导师GPT」｜OpenAI

接下来，GPT Builder主动询问如何与用户互动，Sam表示可以从我的以往演讲中选择适当且具有建设性的回答，然后上传了一段自己以往的演讲。

即使加上讲解，整个应用在短短三分钟内完成。访问这个GPT的人将收到GPT自动生成的对话开头，可以与这个GPT对话，咨询与创业相关的内容，获得的回答将类似于Sam Altman本人的回答。

Sam表示，创建者还可以进一步为GPT添加操作（action）。

实际上，用户能够定制的功能并不多：预设的提示（prompt），外部知识库和操作。然而，将这三者顺利结合起来，使不懂代码的人能够更轻松地创建应用，确实是OpenAI的一大创新。

GPT发布后，应用可以选择私有、专属企业或公开这三种方式。OpenAI表示将为受欢迎的应用提供利润分成。

明显地，OpenAI的目标并不是让普通用户能够通过自然语言创建复杂的应用。这里的关键在于，个人和企业能够上传自己的知识库到OpenAI，轻松构建专属应用。

例如，作为拥有货运价格表的代理，您可以将文件上传到OpenAI，然后轻松创建自己的询价助手。这种简单而流畅的应用部署在此之前是不可能的。如果受到用户认可，类似的应用也将填充OpenAI的应用商店，使其成为各种信息的宝库。

零代码创建AI代理

如果您觉得上述的0代码的GPT很酷，OpenAI还推出了让开发者更容易使用OpenAI API的开发方式——Assistants API。

Sam Altman表示，市面上基于API构建代理的体验非常棒。例如，Shopify的Sidekick可以让用户在平台上采取行动，Discord的Clyde可以帮助管理员创建自定义人物，Snap的My AI是一个自定义聊天机器人，可以添加到群聊中并提出建议。

然而，问题在于，创建这些代理非常困难。有时需要数月的时间，由数十名工程师组成的团队来处理多种问题，包括状态管理、提示和上下文管理、扩展功能和检索。

在OpenAI开发者大会上，这些问题都被API化——OpenAI推出了Assistants API，让开发人员可以在他们的应用程序中构建「助手」。

使用Assistants API，OpenAI客户可以构建一个具有特定指令、利用外部知识并可以调用OpenAI生成式AI模型和工具来执行任务的「助手」。这些案例范围包括从基于自然语言的数据分析应用程序到编码助手，甚至是人工智能驱动的假期规划器。

Assistants API提供的功能包括：

– 持久的线程，人们无需处理长时间的对话历史；

– 内置的检索，利用来自OpenAI模型外部的知识来增强开发人员创建的助手；

– 新的Stateful API管理上下文；

– 内置的代码解释器，允许在沙盒环境中编写和运行Python代码，处理图形、图表和文件，使使用Assistants API创建的助手能够迭代运行代码来解决代码和数学问题；

– 改进的函数调用，使助手能够调用开发人员定义的编程函数并将响应合并到他们的消息中。

Assistants API目前处于测试阶段，从今天开始可供所有开发人员使用。开发者可以前往Assistants Playground来尝试Assistants API测试版，而无需编写任何代码。

OpenAI将Assistants API视为帮助开发者构建「类代理体验」的第一步。有了Assistants API，构建代理应用将变得更容易。OpenAI表示，随着时间的推移，将不断提高其能力，并计划允许客户提供自己的协助工具，以补充其平台上的代码解释器、检索组件和函数调用。”

Sam Altman总结发布会亮点｜OpenAI

当涵盖多模态、长文本输入、更经济实惠、个性化等特点的创新被OpenAI用来自我革命时，当OpenAI的产品在B端和C端都显示出强大吸引力，并且通过GPT Store吸引全球AI开发者时，全球的AI竞争对手可能感到无比焦虑。

OpenAI的技术进步令人激动，而团队采用的商业策略表现出成熟度，超越了一般初创公司。我们正在见证一个行业的变革，也有可能见证一个巨头的崛起。

猜你喜欢