谷歌主办的首届大模型对抗赛:国际象棋比赛中Grok 4表现最好
来源:今日头条 发表于2025-08-06 18:31:15 编辑:张易川
摘要: 8月6日消息,谷歌发起的首届大模型对抗赛引发了广泛关注。此次比赛于8月5日至7日在 Kaggle Game Arena 举行,汇聚了包括 DeepSeek、Kimi 等在内的八款顶尖 AI 模

  8月6日消息,谷歌发起的首届大模型对抗赛引发了广泛关注。此次比赛于8月5日至7日在 Kaggle Game Arena 举行,汇聚了包括 DeepSeek、Kimi 等在内的八款顶尖 AI 模型,竞争将在策略游戏(如国际象棋和其他游戏中)中展开对决。

  第一轮比赛,Grok 4 表现最好,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。

  Kaggle Game Arena是谷歌推出的一个全新的、公开的基准测试平台。此次参赛的模型包括 OpenAI 的 o4-mini、DeepSeek-R1、Kimi K2Instruct、Gemini2.5Pro(谷歌)、Claude Opus4(Anthropic)、Grok4(xAI)及 Gemini2.5Flash 等,每一款模型都代表了当前 AI 领域的最前沿技术。组织方特别邀请了世界顶级国际象棋专家进行解说,为比赛增添了专业性与观赏性。

  截至目前,大语言模型在象棋对弈中暴露出的问题包括:全局棋盘视觉化能力不足、棋子间互动关系理解有限……

  至于Grok 4 表现最好,马斯克的解释是:“国际象棋很简单,Grok 没花费太多力气。”

  马斯克认为,毫无疑问,Grok 的推理能力就是强。

投稿邮箱:qingjuedu@163.com
相关推荐
研究生清退潮持续,7月两校公告除名多人!
研究生清退潮持续,7月两校公告除名多人!

原标题:研究生清退潮持续,7月两校公告除名多人! 25年下半年,又有两所院

快资讯21小时前

空军使用多架运-20送新飞行学员赴空军航空大学报到,
空军使用多架运-20送新飞行学员赴空军航空大学报到,

原标题:空军使用多架运-20送新飞行学员赴空军航空大学报到,女飞行学员平均

快资讯2025-08-03 19:02:03

京东宣布奖励快递员等一线员工子女考上大学:发钱、
京东宣布奖励快递员等一线员工子女考上大学:发钱、

原标题:京东宣布奖励快递员等一线员工子女考上大学:发钱、优先就业 据了

快资讯2025-07-31 19:42:41

西湖大学2025年走出浙江招生,收获满满,隐藏的原因揭
西湖大学2025年走出浙江招生,收获满满,隐藏的原因揭

原标题:西湖大学2025年走出浙江招生,收获满满,隐藏的原因揭秘 西湖大学作

快资讯2025-07-27 15:29:38

此地成立“烧烤研究院”,正编写教材,预计明年招生
此地成立“烧烤研究院”,正编写教材,预计明年招生

原标题:此地成立烧烤研究院,正编写教材,预计明年招生 据岳阳发布,近日

快资讯2025-07-21 20:22:50

教育部发布留学预警!
教育部发布留学预警!

原标题:教育部发布留学预警! 近期,菲律宾治安不靖,针对中国公民犯罪多

快资讯2025-07-19 14:37:53

暑期青少年扎堆整容,专家提醒:未成年人整容风险大
暑期青少年扎堆整容,专家提醒:未成年人整容风险大

原标题:暑期青少年扎堆整容,专家提醒:未成年人整容风险大 正值暑假,不

快资讯2025-07-16 14:55:56

择期宣判!“湘潭大学宿舍投毒案”二审:被告人道歉
择期宣判!“湘潭大学宿舍投毒案”二审:被告人道歉

原标题:择期宣判!湘潭大学宿舍投毒案二审:被告人道歉,但不承认投毒是为

快资讯2025-07-11 19:54:03

苏州琅文高级中学 | 启程未来精英,重书人生篇章
苏州琅文高级中学 | 启程未来精英,重书人生篇章

中考结束后,家长是否在为孩子的升学而发愁?普通分数家庭其实不用太多的焦

快资讯2025-07-11 11:14:02

福州全市学校因台风丹娜丝停课一天,教育局:正商定
福州全市学校因台风丹娜丝停课一天,教育局:正商定

原标题:福州全市学校因台风丹娜丝停课一天,教育局:正商定后续复课安排

快资讯2025-07-09 19:36:44