微软联合清北推出rStar-Math技术,数学推理能力赶超OpenAI o1
来源:今日头条 发表于2025-02-21 10:32:08 编辑:张易川
摘要: 微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上

  微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上,由微软、北京大学和清华大学的八位作者共同完成。

  rStar-Math核心在于,让小模型具备深度思考的能力,利用蒙特卡罗树搜索,这种方法模拟人类的 “深度思考”,通过逐步细化数学问题的解决方案来帮助小型模型自我演进。

  在测试中,rStar-Math 技术被应用于多个小型开源模型,包括微软的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15亿参数模型)和 Qwen-7B(70亿参数模型)。测试结果显示,所有参与的模型性能都有所提升,其中在 MATH 基准测试中,rStar-Math 甚至超越了 OpenAI OpenAI o1-preview。

  rStar-Math除了基准测试成绩亮眼,对比优势也十分明显。它能显著提升小型语言模型的推理能力,在模型规模远小于竞争对手的情况下,超越了许多现有的 System 2 基线方法。它在不同类型的数学基准测试中都具有很强的泛化能力,在 Olympiad Bench、College Math 和高考数学等测试中均取得了新的领先成绩。

  微软通过 rStar-Math 展示了小型模型的潜力,强调了高效能的方向。

  论文地址:https://arxiv.org/pdf/2501.04519

投稿邮箱:qingjuedu@163.com
相关推荐
此地成立“烧烤研究院”,正编写教材,预计明年招生
此地成立“烧烤研究院”,正编写教材,预计明年招生

原标题:此地成立烧烤研究院,正编写教材,预计明年招生 据岳阳发布,近日

快资讯2025-07-21 20:22:50

教育部发布留学预警!
教育部发布留学预警!

原标题:教育部发布留学预警! 近期,菲律宾治安不靖,针对中国公民犯罪多

快资讯2025-07-19 14:37:53

暑期青少年扎堆整容,专家提醒:未成年人整容风险大
暑期青少年扎堆整容,专家提醒:未成年人整容风险大

原标题:暑期青少年扎堆整容,专家提醒:未成年人整容风险大 正值暑假,不

快资讯2025-07-16 14:55:56

择期宣判!“湘潭大学宿舍投毒案”二审:被告人道歉
择期宣判!“湘潭大学宿舍投毒案”二审:被告人道歉

原标题:择期宣判!湘潭大学宿舍投毒案二审:被告人道歉,但不承认投毒是为

快资讯2025-07-11 19:54:03

苏州琅文高级中学 | 启程未来精英,重书人生篇章
苏州琅文高级中学 | 启程未来精英,重书人生篇章

中考结束后,家长是否在为孩子的升学而发愁?普通分数家庭其实不用太多的焦

快资讯2025-07-11 11:14:02

福州全市学校因台风丹娜丝停课一天,教育局:正商定
福州全市学校因台风丹娜丝停课一天,教育局:正商定

原标题:福州全市学校因台风丹娜丝停课一天,教育局:正商定后续复课安排

快资讯2025-07-09 19:36:44

青岛大学凌晨通报“宿管人员离世”后,学生透露:事
青岛大学凌晨通报“宿管人员离世”后,学生透露:事

原标题:青岛大学凌晨通报宿管人员离世后,学生透露:事发区域正在装空调​

快资讯2025-07-07 20:07:43

丽江失联的20岁女大学生已确认身亡,救援队:疑似坠
丽江失联的20岁女大学生已确认身亡,救援队:疑似坠

原标题:丽江失联的20岁女大学生已确认身亡,救援队:疑似坠崖 经过6天的寻

快资讯2025-07-07 20:03:15

山东一高校因高温暂停期末考试,下学期开学继续考
山东一高校因高温暂停期末考试,下学期开学继续考

原标题:山东一高校因高温暂停期末考试,下学期开学继续考 7月5日晚,多名网

快资讯2025-07-06 16:22:51

芝加哥枪击案频发,至少23人中弹,两人死亡
芝加哥枪击案频发,至少23人中弹,两人死亡

原标题:芝加哥枪击案频发,至少23人中弹,两人死亡 警方表示,在夏季的第一

快资讯2025-06-30 18:16:52