微软联合清北推出rStar-Math技术,数学推理能力赶超OpenAI o1
来源:今日头条 发表于2025-02-21 10:32:08 编辑:张易川
摘要: 微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上

  微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上,由微软、北京大学和清华大学的八位作者共同完成。

  rStar-Math核心在于,让小模型具备深度思考的能力,利用蒙特卡罗树搜索,这种方法模拟人类的 “深度思考”,通过逐步细化数学问题的解决方案来帮助小型模型自我演进。

  在测试中,rStar-Math 技术被应用于多个小型开源模型,包括微软的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15亿参数模型)和 Qwen-7B(70亿参数模型)。测试结果显示,所有参与的模型性能都有所提升,其中在 MATH 基准测试中,rStar-Math 甚至超越了 OpenAI OpenAI o1-preview。

  rStar-Math除了基准测试成绩亮眼,对比优势也十分明显。它能显著提升小型语言模型的推理能力,在模型规模远小于竞争对手的情况下,超越了许多现有的 System 2 基线方法。它在不同类型的数学基准测试中都具有很强的泛化能力,在 Olympiad Bench、College Math 和高考数学等测试中均取得了新的领先成绩。

  微软通过 rStar-Math 展示了小型模型的潜力,强调了高效能的方向。

  论文地址:https://arxiv.org/pdf/2501.04519

投稿邮箱:qingjuedu@163.com
相关推荐
“全世界学历最高的Labubu来了”!清华副校长为其“拨
“全世界学历最高的Labubu来了”!清华副校长为其“拨

原标题:全世界学历最高的Labubu来了!清华副校长为其拨穗 6月23日上午,全世

快资讯2025-06-23 19:55:30

华中科技大学宣布获个人匿名捐赠 1.8 亿元人民币
华中科技大学宣布获个人匿名捐赠 1.8 亿元人民币

原标题:华中科技大学宣布获个人匿名捐赠 1.8 亿元人民币 6 月 21 日消息,今天

快资讯2025-06-22 10:21:49

延边大学食堂阿姨毕业典礼演讲全程脱稿听哭毕业生,
延边大学食堂阿姨毕业典礼演讲全程脱稿听哭毕业生,

原标题:延边大学食堂阿姨毕业典礼演讲全程脱稿听哭毕业生,当事人:我只是

快资讯2025-06-22 10:18:02

王皓考编,成绩公布,排名第一
王皓考编,成绩公布,排名第一

原标题:王皓考编,成绩公布,排名第一 据北京市体育局官网,北京市先农坛

快资讯2025-06-20 18:37:19

2026年两大权威世界大学排名公布,“清北之争”备受关
2026年两大权威世界大学排名公布,“清北之争”备受关

原标题:2026年两大权威世界大学排名公布,清北之争备受关注 6月19日,国际高

快资讯2025-06-19 13:57:39

深圳一小区房屋发生沉降!25栋楼被封控,邻近学校停
深圳一小区房屋发生沉降!25栋楼被封控,邻近学校停

原标题:深圳一小区房屋发生沉降!25栋楼被封控,邻近学校停课1天 6月16日 深

快资讯2025-06-18 14:06:41

江西瑞金一中学老师要求学生下跪写检讨?官方通报:
江西瑞金一中学老师要求学生下跪写检讨?官方通报:

原标题:江西瑞金一中学老师要求学生下跪写检讨?官方通报:存在体罚行为,

快资讯2025-06-16 20:01:29

又破世界纪录!18岁杭州学子实现射击世界杯三连冠
又破世界纪录!18岁杭州学子实现射击世界杯三连冠

原标题:又破世界纪录!18岁杭州学子实现射击世界杯三连冠 近日,在2025国际

快资讯2025-06-15 20:03:25

大学上新29种专业!来认识蓄势起飞的“未来科技显眼
大学上新29种专业!来认识蓄势起飞的“未来科技显眼

原标题:大学上新29种专业!来认识蓄势起飞的未来科技显眼包 2025年高考刚刚

快资讯2025-06-12 14:59:24

毕业季内蒙古多地景区送福利
毕业季内蒙古多地景区送福利

原标题:毕业季内蒙古多地景区送福利 记者6月10日从内蒙古文旅厅获悉,全区

快资讯2025-06-11 14:44:39