一、OpenAI 推出新动作
本周四,OpenAI 有两个新动作引发了广泛关注。一方面,OpenAI 发布了推理大模型 o1 的满血版本。该模型最初以预览版形式在 9 月上线,如今的满血版本在速度、性能和准确性上都有显著提升。与预览版本相比,现在的 o1 模型 “思维已经被训练得更加简洁”,思考速度快了约 50%,同时在回答困难现实问题时,出现重大错误的概率减少了 34%。例如,在回答 “列出 2 世纪罗马皇帝的名字、任期和主要成就” 时,o1 模型仅用 14 秒就给出了答案,而预览版则花了 34 秒。此外,o1 模型还解锁了新功能,支持多模态输入,即可以处理图像和文本,用户能够上传图片以辅助问题解答。OpenAI 表示,计划在未来几个月里增加网页浏览、文件上传等功能的支持。
另一方面,OpenAI 推出了每月收费 200 美元的 ChatGPT Pro 订阅服务。ChatGPT Pro 订阅服务允许用户无限量使用 o1 模型,以及 o1 mini 和高级语音模式,同时还能使用 o1 pro 模式。o1 pro 模式将使用更多的计算资源进行深入思考,旨在为最难的问题提供最佳答案。OpenAI 未来也会给这个订阅档次添加更多更强大、计算密集型的功能。这项新服务似乎针对的是那些可能受益于更高速率限制和更多计算时间来得出答案的人,比如研究人员、工程师和其他每天使用研究级智能的个人,为他们提高生产力并处于人工智能进步的前沿提供了一种方法。
二、满血版 o1 大模型的特点
(一)智能水平提升
满血版 o1 大模型相比 o1-preview,在智能水平上有了显著提升。重大错误率降低 34%,使得回答问题的准确性大大提高。在思考速度方面,比预览版快了约 50%,例如在回答 “列出 2 世纪罗马皇帝的名字、任期和主要成就” 时,o1 模型仅用 14 秒就给出了答案,而预览版则花了 34 秒。在数学、编程、科学问题回答准确率上也有明显提高,如 o1 模型在解答 AIME 2024 数学竞赛、博士级科学问题的准确率分别达到 78.3%、75.6%,比 o1-Preview 的准确率分别高出 28.3%,1.5%。
(二)多模态能力
满血版 o1 大模型新增了多模态输入能力,可处理图片和文本内容。在太空数据中心散热问题中,能根据手绘示意图进行推理。例如,研究人员上传一张手绘草图后,o1 能够从草图中识别一些具体的数据并进行推理,在不到 10 秒的时间,不仅成功理解了草图的问题要求,还意识到没有提供的参数,自我推理给出了正确答案。
(三)未来功能规划
OpenAI 计划在未来几个月增加网页浏览、文件上传等功能支持。同时,o1 Pro 还将新增网络浏览、文件上传和增强的 API 支持(例如结构化输出、函数调用和图像理解)功能。此外,OpenAI 希望未来为 ChatGPT Pro 添加更强大的计算密集型生产力功能。
三、ChatGPT Pro 的优势
(一)高价格背后的价值
每月收费 200 美元的 ChatGPT Pro,其价格是 ChatGPT Plus 的 10 倍。这一高价格背后蕴含着巨大的价值。ChatGPT Pro 为用户提供无限制访问最先进的 AI 工具,包括 o1、o1 mini、GPT-4o 和高级语音等。对于那些需要频繁使用人工智能工具进行研究、开发和创新的专业人士来说,这种无限制的访问意味着他们可以更加高效地完成工作,获取更准确、更深入的答案。无论是科研人员在进行复杂的数学计算和科学研究,还是工程师在解决编程难题,ChatGPT Pro 都能为他们提供强大的支持。
(二)o1 pro 模式
o1 pro 模式是 ChatGPT Pro 的一大亮点。它使用更多计算资源深入思考,在数学、科学和编码等领域表现更加出色。与普通的 o1 模型相比,o1 pro 模式能够为最困难的问题提供更好的答案,可靠性更高。在数学方面,o1 pro 模式得分明显高于 o1 和 o1-preview,例如在国际数学奥林匹克预选赛题目(AIME 2024)中,o1 pro 正确率达到 86,高于 o1 版本的 78。在编码问题上,o1 pro 与 o1 在能力上旗鼓相当,但在处理博士级科学问题上,o1 pro 实现了约 3% 的优势。为了突出其可靠性优势,OpenAI 提高了评估门槛,要求只有在四次尝试中四次全部能够正确回答问题才能算作模型解决了问题。即使在这种高标准要求下,o1 pro 模式的表现也明显强于 o1 和 o1-preview。在实际应用中,o1 pro 模式可以帮助用户解决复杂的科学研究问题,如通过设定一系列苛刻的条件筛选出符合条件的蛋白质。同时,对于需要高精度答案的专业领域,如医学研究,OpenAI 向 10 名医学研究人员赠送了免费的 ChatGPT Pro,涵盖孤儿病、癌症、痴呆等研究领域,这也体现了 o1 pro 模式在专业领域的价值。
四、使用人群与未来展望
ChatGPT Pro 可能针对的使用人群主要包括研究人员、工程师以及其他每天使用研究级智能的个人。对于研究人员来说,无论是在进行复杂的数学计算、科学研究,还是在筛选符合特定条件的蛋白质等工作中,ChatGPT Pro 都能提供强大的支持。例如,OpenAI 向 10 名医学研究人员赠送了免费的 ChatGPT Pro,涵盖孤儿病、癌症、痴呆等研究领域,这体现了其在专业领域的价值。对于工程师而言,在解决编程难题等方面,o1 pro 模式能够为最困难的问题提供更好的答案,可靠性更高。
展望未来,OpenAI 将为 ChatGPT Pro 订阅服务添加更强大的计算密集型生产力功能。这意味着用户可以期待更多强大的功能和工具,进一步提高工作效率,处于人工智能进步的前沿。随着技术的不断发展,ChatGPT Pro 有望在更多领域发挥重要作用,为专业人士提供更优质的服务。
RA/SD 衍生者AI训练营。发布者:風之旋律,转载请注明出处:https://www.shxcj.com/archives/7631