9月12日晚,OpenAI揭晓神秘新作——o1模型,标志着其下一代“推理”系列的首秀。o1以猎户座(Orion)之名,展现超越人类的速度,应对更复杂的疑问挑战。相较于前代,o1在编程和多步骤难题解决上更胜一筹,不过,这提升伴随着更高的成本与稍缓的响应速度。OpenAI将o1的初次亮相定义为“预览版”,一个尚处雏形的智者,并同步推出了小巧经济版o1-mini。
对于急切尝鲜的ChatGPT Plus用户及团队,o1预览版与o1-mini的大门已敞开,企业与教育界则需静候至下周。免费用户何时能拥抱o1-mini,仍在未定之天。谈及费用,o1的API使用门槛显著抬高,输入与输出的计费标准分别是每百万token 15美元与60美元,远超GPT-4o的5美元与15美元。
OpenAI的研究领头人Jerry Tworek揭秘,o1得益于创新优化算法与定制数据集的滋养,采用“思维链”模拟人类分步解题思路,精准度跃升,虽未根除但显著减少了模型的“幻觉”现象。
o1与GPT-4o的分水岭,在于前者在编程、数学等高难领域的碾压性优势,且能清晰展示思考轨迹。其在国际数学奥林匹克资格考中一展锋芒,成绩由GPT-4o的13%飞跃至83%。此外,o1在Codeforces编程竞赛中,已迈入顶尖选手行列,OpenAI预告,o1未来的迭代将有望在物理、化学、生物等高阶测试中,媲美博士生水平。