效能更优ChatGPT-4o OpenAI推新模型「o1」

kaizi 12 月 07, 2024 395 0

在人工智能（AI）领域持续进化的浪潮中，OpenAI再次突破自我，推出了全新的「o1」系列模型，包括「o1-preview」与「o1-mini」。这一系列不仅仅是语言模型的又一次迭代，更代表着AI解决问题方式的根本性变革，仿佛是从简单的记忆复述跃升至深刻理解的全新境界。

o1模型核心：推理优于回答

据OpenAI透露，该系列模型采用了强化学习训练方式，其核心在于解决复杂的推理问题。OpenAI强调，「o1在回答问题之前会进行周密的思考，并已运用全新的优化算法和为其量身定制的新训练数据集进行了深度训练。」尽管业界早有关于OpenAI将推出名为「Strawberry」新模型的预测，但该公司并未公开透露各模型间的具体差异。

命名革新，彰显重大进步

此次推出的新模型打破了OpenAI以往的命名传统，摒弃了ChatGPT-3、ChatGPT-3.5及ChatGPT-4o的命名方式。OpenAI表示，「这标志着在解决复杂推理任务上取得了显著进展，开启了AI能力的新篇章。」因此，他们决定重置计数，将这一系列命名为「OpenAI o1」。

「思维链」推理：新模型的关键特色

OpenAI着重指出，这些新模型的关键特色在于采用了「思维链」（chain-of-thought）推理方式。在给出最终答案前，模型会逐步进行分段推理分析，这不仅提升了回答的精确度，还降低了潜在的「越狱」技术风险。通过更多的时间和步骤来检查生成的结果，系统能够更容易地识别和阻止违规行为。测试结果显示，即便是最小的o1模型，也在多个关键领域超越了顶尖的GPT-4o，甚至在博士级别的挑战中也展现出了卓越表现。此外，内部测试还显示，该模型在程序设计、微积分和数据分析等领域相较于GPT-4o有显著改进，但在创意写作等创意任务上的进步相对有限。

未来规划与功能拓展

OpenAI透露，未来将进一步拓展该系列模型的能力，包括增加网页搜索功能和增强多模态交互功能等。同时，模型将随时间调整以满足OpenAI的最低安全标准，并加强对「越狱」行为的防范以及模型自主问题的解决。

分阶段发布与免费策略

尽管ChatGPT Plus和Team用户已可体验o1-preview和o1-mini，但部分用户反映尚未看到新模型，这表明模型可能正在分阶段发布。Enterprise和Edu用户将于下周开放使用。OpenAI表示，该系列模型的最小版本最终将免费提供，且API价格相比o1-preview降低了80%。然而，目前用户每周仅有30次消息限额（o1-mini为50次），因此需谨慎选择提示内容。

标签

相关推荐