OpenAI 的“草莓”模型将于今年秋季推出

传闻已久的 OpenAI “Strawberry” 模型终于面世。据 The Information 报道，随着 OpenAI 不断筹集更多资金，其研究人员正准备推出一款新的 AI 产品。这款产品有望在解决复杂问题方面超越现有 AI。参与该项目的内部人士透露，研究人员计划于今年秋季将这款内部代号为“Strawberry”（之前称为 Q*，发音为“Q Star”）的新 AI 作为 ChatGPT 功能的一部分发布。

“草莓”旨在解决前所未有的数学问题——这是目前的聊天机器人无法解决的问题——并且它还接受了解决编程相关问题的训练。然而，这种人工智能的能力并不仅限于解决技术问题。

有了更多的“思考”时间，它还可以回答客户关于更主观话题的询问，例如产品营销策略。为了展示“Strawberry”在语言任务中的实力，OpenAI 员工演示了它如何解决复杂的字谜，例如《纽约时报》的“Connections”字谜。

报告强调，这项技术对未来的人工智能产品具有重要意义，尤其是那些旨在解决多步骤任务的产品。OpenAI 及其竞争对手目前正在探索这些智能代理作为增加收入来源的途径。OpenAI 的业务正在快速增长。

虽然其每月的支出可能超过这一数字，但向企业出售大型语言模型和 ChatGPT 订阅服务的月收入较去年增长了近三倍，达到 2.83 亿美元。目前，OpenAI 的估值已达到 860 亿美元。不过，报道指出，OpenAI 的未来在一定程度上取决于其正在开发的新旗舰大型语言模型，代号为 Orion。

该模型旨在改进其现有的旗舰大型语言模型 GPT-4（该模型于去年早些时候推出）。到目前为止，其他竞争对手已经推出了与 GPT-4 性能相匹配的大型语言模型。

报道还提到，OpenAI 能否在今年推出“草莓”的聊天机器人版本还存在不确定性，这是原始“草莓”模型的简化版，被称为蒸馏版，旨在保持高性能的同时更易于操作且更具成本效益。

内部人士表示，OpenAI 还在使用更大版本的“Strawberry”来生成训练 Orion 的数据。这种由 AI 生成的数据被称为“合成数据”。这表明“Strawberry”可以帮助 OpenAI 缓解从互联网获取高质量训练数据的挑战。

此外，该内部人士还提到，“Strawberry”可以帮助减少即将推出的 OpenAI 代理中的幻觉。Minion AI 首席执行官、前 GitHub Copilot 首席架构师 Alex Graveley 表示，使用“Strawberry”生成更高质量的训练数据可以帮助 OpenAI 最大限度地减少其模型中 AI 产生的幻觉。

Graveley 进一步解释道：“想象一下一个没有幻觉的模型；你问它一个逻辑难题，它第一次就能答对。之所以会发生这种情况，是因为训练数据中的歧义较少，从而导致猜测较少。”

本月初，OpenAI 首席执行官 Sam Altman 在 X 平台上发布了一张草莓图片，但未作详细评论，引发了网上的广泛猜测。业内人士还表示，今年夏天，OpenAI 向美国国家安全官员展示了“草莓”模型。Altman 在 5 月份的一次活动中表示：“我们相信现在我们有足够的数据来支持该模型。”他可能指的是 Orion。“我们一直在进行各种实验，包括生成合成数据。”

目前，他也在努力为公司筹集更多资金，寻找减少损失的方法。知情人士透露，自2019年以来，OpenAI已从微软筹集了约130亿美元，作为双方合作的一部分，合同将延长至2030年。

该知情人士还指出，合作条款可能会发生变化，包括OpenAI 如何支付租用云服务器来开发其 AI 的费用，因为云服务器是 OpenAI 最大的成本。截至本文发稿时，OpenAI 发言人尚未就此事发表评论。

路透社此前曾报道过“草莓”的命名和推理能力。业界普遍认为，能够解决复杂数学问题的人工智能可能是一个潜在的有利可图的应用领域，因为现有的人工智能系统在航空航天和结构工程等数学密集型领域表现不佳。

许多人工智能研究人员还发现，ChatGPT 等对话式人工智能容易提供错误答案，包括最近的病毒式挑战中，聊天机器人很难比较数字 9.11 和 9.8。

此外，数学推理能力的提升还可以提高人工智能模型在对话查询推理方面的表现，例如处理客户服务请求。据悉，谷歌和一些人工智能初创公司也在致力于开发推理技术。上个月，谷歌 DeepMind 表示其人工智能将在国际数学奥林匹克竞赛中击败大多数人类参赛者。

OpenAI的竞争对手Anthropic此前表示，得益于推理能力的提升，其最新的大型语言模型可以编写更复杂的软件代码，并回答有关图表和图形的问题。

为了增强模型的推理能力，一些人工智能初创公司一直在使用“捷径”方法将问题分解为更小的步骤，但这种解决方案缓慢且成本高昂。

外媒指出，无论“Strawberry”是否作为产品发布，人们对 Orion 的期望都很高，因为 OpenAI 希望继续领先竞争对手，并保持显著的收入增长。

有趣的是，“草莓”的诞生也与前 OpenAI 首席科学家伊利亚·苏茨克弗（Ilya Sutskever）有关。据报道，几年前，时任 OpenAI 首席科学家的苏茨克弗发起了“草莓”模型的研究。不过，伊利亚最近宣布离开 OpenAI，创办了一家名为 Safe SuperIntelligence（SSI）的新公司。

在他离职前，OpenAI 研究员 Jakub Pachocki 和 Szymon Sidor 在 Sutskever 工作的基础上开发了一个名为 Q* 的新数学求解模型。这引发了关注 AI 安全的研究人员的担忧。

在 Q* 的开发过程中，OpenAI 的研究人员还创建了一个名为“测试时间计算”的变体概念，旨在增强大型语言模型的解决问题能力。这种方法让模型有更多时间考虑用户命令或问题的各个方面。当时，Sutskever 还发表了一篇与这项工作相关的博客文章。

未来，OpenAI 将继续大力推动“Strawberry”的发布，以保持其在 AI 领域的领先地位，并应对来自其他公司的激烈竞争。同时，Orion 作为 OpenAI 的下一个重要大型语言模型，肩负着公司未来发展的重任。它的表现将对 OpenAI 的长期前景产生深远影响。

值得注意的是，随着OpenAI等公司在AI领域不断取得突破，业界对AI安全问题的关注度也日益提升，尤其是随着AI技术逐渐向更复杂的推理能力迈进，“Strawberry”和Q*的研发引发了人们对AI伦理和安全问题的广泛讨论。

基于此，OpenAI 和整个 AI 行业面临的挑战不仅仅是技术突破，更是如何在创新与安全之间取得平衡。未来，随着更多类似“草莓”的 AI 产品问世，AI 发展的方向将更加多元化，对社会各方面产生更大影响。

无论如何，“草莓”的推出将标志着 OpenAI 在 AI 推理能力上的又一次重大进步。无论是改进现有的 GPT-4，还是为未来的猎户座模型提供支持，“草莓”都将发挥关键作用。

RA/SD 衍生者AI训练营。发布者：稻草人，转载请注明出处：https://www.shxcj.com/archives/5539