Anthropic新模型将“推理模式”与“标准模式”混合:提高数学、物理等方面的表
来源:今日头条 发表于2025-02-26 10:31:02 编辑:张易川
摘要: Anthropic周一发布名为Claude 3.7 Sonnet的模型,称这种混合型模型同时具备推理模式(停下来思考复杂答案)与标准模式(实时生成答案)的能力。 Anthropic称,Claud

  Anthropic周一发布名为Claude 3.7 Sonnet的模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与标准模式(实时生成答案)的能力。

  Anthropic称,Claude 3.7 Sonnet是市面上唯一的此类“混合”模型,并将立即投入使用。Kaplan将其比作人类大脑的运行方式:有的问题需要深度思考,有的问题需要快速作答。但Anthropic希望将这两种能力整合在同一个模型中,而不是完全分开。

  在标准模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升级版。

  在扩展思维模式下,它会在回答前进行自我反思,从而提高其在数学、物理、指令遵循、编码和许多其他任务上的表现。

  在开发推理模型时,Anthropic对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映企业实际如何使用 LLM 的现实任务。

  早期测试表明,Claude 在编码能力方面全面领先:Cursor 指出,Claude 在实际编码任务中再次名列前茅,在处理复杂代码库和高级工具使用等领域都有显著改进。Cognition 发现,在规划代码更改和处理全栈更新方面,Claude 远胜于任何其他模型。Vercel 强调了 Claude 在复杂代理工作流程中的精确度,而 Replit 已成功部署 Claude 从头开始构建复杂的 Web 应用程序和仪表板,而其他模型则停滞不前。在 Canva 的评估中,Claude 可生成具有卓越设计品味的生产就绪代码,并减少了错误。

  Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学方面提供了显著的提升。除了传统的基准测试之外,它甚至在Pokémon 《精灵宝可梦》游戏测试中超越了所有以前的模型。

  与此同时,媒体报道称,Anthropic即将完成一轮35亿美元的融资,公司估值将达到615亿美元。公司本轮融资的最初目标为20亿美元,但在谈判期间成功说服投资者增加投资。本轮融资的参与者包括Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners,总部位于阿布扎比的投资公司MGX正在洽谈参与事宜。

  在此此前,亚马逊已向Anthropic累计投资80亿美元,而谷歌母公司Alphabet已向其投资20亿美元。

投稿邮箱:qingjuedu@163.com
相关推荐
这不对劲儿!教育各家AI功能越来越像了
这不对劲儿!教育各家AI功能越来越像了

来源| 作者|TCOH 编者按: 本文为约稿。作者TCOH为教育行业资深从业者。 过去一

快资讯49分钟前

剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元
剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元

12月4日消息,近日,奇梦岛(NASDAQ:HERE,量子之歌前身)披露了2026财年第一季度

快资讯8小时前

国内首款AI助盲眼镜发布,可实现避障、找物读物、语
国内首款AI助盲眼镜发布,可实现避障、找物读物、语

12月4日消息,杭州瞳行科技公司于本周正式发布国内首款AI助盲眼镜。 据介绍,

快资讯8小时前

乐队鼓手创办的职业规划平台融资500万美元,已服务
乐队鼓手创办的职业规划平台融资500万美元,已服务

12月4日消息,一体化职业规划平台Find Your Grind宣布完成500万美元A轮融资,本轮

快资讯8小时前

清华大学具身智能与机器人研究院成立,挂靠科研院
清华大学具身智能与机器人研究院成立,挂靠科研院

12月3日消息,11月30日,清华大学具身智能与机器人研究院成立。 清华大学校长

快资讯2025-12-03 22:31:11

可灵AI发布“可灵O1”:整合文本、图像、音频等模态
可灵AI发布“可灵O1”:整合文本、图像、音频等模态

12月3日消息, 快手旗下可灵AI正式发布可灵O1,该产品定位为大一统的多模态创

快资讯2025-12-03 22:31:01

得力上海品牌旗舰店启幕:以“超级体验”重塑文具行
得力上海品牌旗舰店启幕:以“超级体验”重塑文具行

2025年11月29日,得力上海品牌旗舰店(deli world)在上海静安大悦城盛大开业。这家

快资讯2025-12-03 17:56:06

2025"燃•朗文少年"青少年英语口语演讲活动圆满收官
2025"燃•朗文少年"青少年英语口语演讲活动圆满收官

六强少年闪耀北京舞台,中国印尼跨国联动呈现AI时代的未来表达力 由全球教育

快资讯2025-12-03 15:25:32

千问接入“阿里最强学习大模型”:拍题更准、讲题更
千问接入“阿里最强学习大模型”:拍题更准、讲题更

12月3日消息,阿里千问面向学习场景发布拍题答疑、作业批改两项重要更新。通

快资讯2025-12-03 14:31:10

首款“豆包AI手机”售罄,二手平台最高加价1500元
首款“豆包AI手机”售罄,二手平台最高加价1500元

12月3日消息,首款搭载豆包手机助手的手机产品努比亚M153目前已在中兴商城售

快资讯2025-12-03 14:31:01