微软联合清北推出rStar-Math技术,数学推理能力赶超OpenAI o1
来源:今日头条 发表于2025-02-21 10:32:08 编辑:张易川
摘要: 微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上

  微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上,由微软、北京大学和清华大学的八位作者共同完成。

  rStar-Math核心在于,让小模型具备深度思考的能力,利用蒙特卡罗树搜索,这种方法模拟人类的 “深度思考”,通过逐步细化数学问题的解决方案来帮助小型模型自我演进。

  在测试中,rStar-Math 技术被应用于多个小型开源模型,包括微软的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15亿参数模型)和 Qwen-7B(70亿参数模型)。测试结果显示,所有参与的模型性能都有所提升,其中在 MATH 基准测试中,rStar-Math 甚至超越了 OpenAI OpenAI o1-preview。

  rStar-Math除了基准测试成绩亮眼,对比优势也十分明显。它能显著提升小型语言模型的推理能力,在模型规模远小于竞争对手的情况下,超越了许多现有的 System 2 基线方法。它在不同类型的数学基准测试中都具有很强的泛化能力,在 Olympiad Bench、College Math 和高考数学等测试中均取得了新的领先成绩。

  微软通过 rStar-Math 展示了小型模型的潜力,强调了高效能的方向。

  论文地址:https://arxiv.org/pdf/2501.04519

投稿邮箱:qingjuedu@163.com
相关推荐
100亿!《哪吒2》背后是一个“新系统”的胜利
100亿!《哪吒2》背后是一个“新系统”的胜利

原标题:100亿!《哪吒2》背后是一个新系统的胜利 100亿! 《哪吒2》到底做对

快资讯2025-02-14 19:13:38

真奇葩!收700多元作业打印费,山西太原一中学冲上热
真奇葩!收700多元作业打印费,山西太原一中学冲上热

原标题:真奇葩!收700多元作业打印费,山西太原一中学冲上热搜 在信息传播

快资讯2025-02-14 18:50:48

教师唐某某,双开,已采取刑事强制措施!
教师唐某某,双开,已采取刑事强制措施!

原标题:教师唐某某,双开,已采取刑事强制措施! 据百色融媒微信公众号消

快资讯2025-02-13 19:19:06

《哪吒2》火到国外,激活一个高校专业,动画专业择校
《哪吒2》火到国外,激活一个高校专业,动画专业择校

原标题:《哪吒2》火到国外,激活一个高校专业,动画专业择校策略 近年来,

快资讯2025-02-12 20:30:03

比起 AI,教师的“超能力”才是真正的硬通货!
比起 AI,教师的“超能力”才是真正的硬通货!

原标题:比起 AI,教师的超能力才是真正的硬通货! 人工智能来了,教师要下

快资讯2025-02-11 18:57:43

Deepseek 好用吗?深圳师生感叹:很好很强大!
Deepseek 好用吗?深圳师生感叹:很好很强大!

原标题:Deepseek 好用吗?深圳师生感叹:很好很强大! 近段时间以来,深圳不

快资讯2025-02-10 18:46:49

丘成桐任院长!知名大学,成立新学院!
丘成桐任院长!知名大学,成立新学院!

原标题:丘成桐任院长!知名大学,成立新学院! 2月6日,香港中文大学宣布正

快资讯2025-02-08 10:16:38

惊爆!上海某国际高中疑遭全美高校拉黑!
惊爆!上海某国际高中疑遭全美高校拉黑!

原标题:惊爆!上海某国际高中疑遭全美高校拉黑! 学术造假风波,一波未平

快资讯2025-02-07 20:00:58

成都6名学生收到剑桥offer,大部分是理工学科
成都6名学生收到剑桥offer,大部分是理工学科

原标题:成都6名学生收到剑桥offer,大部分是理工学科 1月30日,剑桥大学放榜

快资讯2025-02-06 19:29:07

全国首家!985大学,成立新学院!
全国首家!985大学,成立新学院!

原标题:全国首家!985大学,成立新学院! 1月22日 ,西安交通大学技术经理人

快资讯2025-01-24 19:17:19