字节跳动Seed团队推出形式化数学推理专用模型Seed Prover 1.5

智通财经APP获悉,12月24日,字节跳动Seed团队宣布推出形式化数学推理专用模型Seed Prover 1.5。通过大规模的Agentic RL训练,其推理能力和推理效率宣称取得显著进步。
据介绍,相比上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到此前IMO评分标准的金牌分数线。
针对北美本科级别数学竞赛Putnam,Seed Prover 1.5用时9小时,对12道Putnam 2025赛题中的11道生成了可编译验证的Lean代码。
更系统的评估中,Seed Prover 1.5在完整的Putnam历史评估集上解决了88%的问题,在代表硕士数学难度的Fate-H和代表博士生数学难度的Fate-X评估集上,分别解决了80%和33%的问题,刷新了形式化数学推理模型在这几个评测集上的SOTA表现。
Seed Prover 1.5的技术报告已对外公开,后续将开放API,邀请感兴趣的数学和AI研究者体验该模型。
(:贺