“北极星”基础教育大模型评测场V1.0及榜单正式发布
来源:今日头条 发表于2025-07-12 22:30:50 编辑:张易川
摘要: 7月12日消息,北京师范大学智能技术与教育应用教育部工程研究中心(以下简称工程研究中心)发布北极星基础教育大模型评测场V1.0及榜单。 北极星由北京师

  7月12日消息,北京师范大学智能技术与教育应用教育部工程研究中心(以下简称“工程研究中心”)发布“北极星”基础教育大模型评测场V1.0及榜单。

  “北极星”由北京师范大学智能技术与教育应用教育部工程研究中心、北京教育科学研究院、‌北京智源人工智能研究院联合建设,是一款含有基础教育特色的大模型评测场。

  在团体标准《人工智能 基础教育大模型评测指标和方法》(标准编号:T/CESA 1395-2025)的指导下,“北极星”具有紧扣新课标、聚焦教育应用、多学科多场景的特点,更加关注启发引导、素养导向、情境创设等能力评估。

  目前“北极星”评测场已覆盖初中“语文/数学/英语/物理/化学/生物/历史/地理/信息技术”9门学科、“备/教/练/考/评/管”6大教育场景,支持110多个维度的评测。

  据官方介绍,现有大模型大多数能力离实际应用尚有差距,例如解题性能会因题目改写受到较大影响,实验探究方面效果欠佳;智能出题方面,大模型题目和解析的准确性仍有待提升。经过测评,“北极星”评测结果与具备丰富教学经验的资深教师越来越相近。

  “北极星”V1.0版本已正式上线(www.bnueval.com),同时其全面评测50多个主流大模型,评测榜单通过网站向公众公布。

  对于接下来的布局思路,据介绍“北极星”基础教育大模型评测场将继续迭代更新,以更全面的评测维度、更科学的评测方法推动基础教育大模型应用安全、健康发展。

投稿邮箱:qingjuedu@163.com
相关推荐
这不对劲儿!教育各家AI功能越来越像了
这不对劲儿!教育各家AI功能越来越像了

来源| 作者|TCOH 编者按: 本文为约稿。作者TCOH为教育行业资深从业者。 过去一

快资讯31分钟前

剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元
剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元

12月4日消息,近日,奇梦岛(NASDAQ:HERE,量子之歌前身)披露了2026财年第一季度

快资讯8小时前

国内首款AI助盲眼镜发布,可实现避障、找物读物、语
国内首款AI助盲眼镜发布,可实现避障、找物读物、语

12月4日消息,杭州瞳行科技公司于本周正式发布国内首款AI助盲眼镜。 据介绍,

快资讯8小时前

乐队鼓手创办的职业规划平台融资500万美元,已服务
乐队鼓手创办的职业规划平台融资500万美元,已服务

12月4日消息,一体化职业规划平台Find Your Grind宣布完成500万美元A轮融资,本轮

快资讯8小时前

清华大学具身智能与机器人研究院成立,挂靠科研院
清华大学具身智能与机器人研究院成立,挂靠科研院

12月3日消息,11月30日,清华大学具身智能与机器人研究院成立。 清华大学校长

快资讯2025-12-03 22:31:11

可灵AI发布“可灵O1”:整合文本、图像、音频等模态
可灵AI发布“可灵O1”:整合文本、图像、音频等模态

12月3日消息, 快手旗下可灵AI正式发布可灵O1,该产品定位为大一统的多模态创

快资讯2025-12-03 22:31:01

得力上海品牌旗舰店启幕:以“超级体验”重塑文具行
得力上海品牌旗舰店启幕:以“超级体验”重塑文具行

2025年11月29日,得力上海品牌旗舰店(deli world)在上海静安大悦城盛大开业。这家

快资讯2025-12-03 17:56:06

2025"燃•朗文少年"青少年英语口语演讲活动圆满收官
2025"燃•朗文少年"青少年英语口语演讲活动圆满收官

六强少年闪耀北京舞台,中国印尼跨国联动呈现AI时代的未来表达力 由全球教育

快资讯2025-12-03 15:25:32

千问接入“阿里最强学习大模型”:拍题更准、讲题更
千问接入“阿里最强学习大模型”:拍题更准、讲题更

12月3日消息,阿里千问面向学习场景发布拍题答疑、作业批改两项重要更新。通

快资讯2025-12-03 14:31:10

首款“豆包AI手机”售罄,二手平台最高加价1500元
首款“豆包AI手机”售罄,二手平台最高加价1500元

12月3日消息,首款搭载豆包手机助手的手机产品努比亚M153目前已在中兴商城售

快资讯2025-12-03 14:31:01