阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点
来源:搜狐 发表于2024-07-11 11:00:20 编辑:沫晓朵
摘要: 在2024世界人工智能大会启明创投创业与投资论坛上,阶跃星辰创始人、CEO姜大昕发表了演讲,分享了对于大模型发展现状与趋势的观察与思考。在演讲中,

  在2024世界人工智能大会启明创投·创业与投资论坛上,阶跃星辰创始人、CEO姜大昕发表了演讲,分享了对于大模型发展现状与趋势的观察与思考。在演讲中,姜大昕重点阐述了一个核心观点:探索AGI路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达AGI。

  近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚未形成共识,但阶跃星辰认为,参数量接下来再提高一个数量级是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在随着参数量、数据量和计算量的增加呈幂次方增长。在此发展过程中,万亿参数量已经成为一个基本的入门门槛。

  正是基于这样的认知,阶跃星辰很早便启动了万亿参数模型的训练。从千亿到万亿,模型的参数规模提升了一个量级,难度也提升了十倍以上。为此,阶跃星辰加大资源投入,尤其在系统和算法上积极探索,最终走通了万亿参数 MoE 大模型训练的道路。在 WAIC 2024 上,阶跃星辰发布了全新的 Step-2 万亿参数语言大模型正式版。根据从逻辑推理、世界知识、数学和编程等多个维度进行的权威测试,Step-2 模型能力都已全面接近国际主流模型,在部分测试集甚至实现了超越。

投稿邮箱:qingjuedu@163.com
相关推荐
这不对劲儿!教育各家AI功能越来越像了
这不对劲儿!教育各家AI功能越来越像了

来源| 作者|TCOH 编者按: 本文为约稿。作者TCOH为教育行业资深从业者。 过去一

快资讯46分钟前

剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元
剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元

12月4日消息,近日,奇梦岛(NASDAQ:HERE,量子之歌前身)披露了2026财年第一季度

快资讯8小时前

国内首款AI助盲眼镜发布,可实现避障、找物读物、语
国内首款AI助盲眼镜发布,可实现避障、找物读物、语

12月4日消息,杭州瞳行科技公司于本周正式发布国内首款AI助盲眼镜。 据介绍,

快资讯8小时前

乐队鼓手创办的职业规划平台融资500万美元,已服务
乐队鼓手创办的职业规划平台融资500万美元,已服务

12月4日消息,一体化职业规划平台Find Your Grind宣布完成500万美元A轮融资,本轮

快资讯8小时前

清华大学具身智能与机器人研究院成立,挂靠科研院
清华大学具身智能与机器人研究院成立,挂靠科研院

12月3日消息,11月30日,清华大学具身智能与机器人研究院成立。 清华大学校长

快资讯2025-12-03 22:31:11

可灵AI发布“可灵O1”:整合文本、图像、音频等模态
可灵AI发布“可灵O1”:整合文本、图像、音频等模态

12月3日消息, 快手旗下可灵AI正式发布可灵O1,该产品定位为大一统的多模态创

快资讯2025-12-03 22:31:01

得力上海品牌旗舰店启幕:以“超级体验”重塑文具行
得力上海品牌旗舰店启幕:以“超级体验”重塑文具行

2025年11月29日,得力上海品牌旗舰店(deli world)在上海静安大悦城盛大开业。这家

快资讯2025-12-03 17:56:06

2025"燃•朗文少年"青少年英语口语演讲活动圆满收官
2025"燃•朗文少年"青少年英语口语演讲活动圆满收官

六强少年闪耀北京舞台,中国印尼跨国联动呈现AI时代的未来表达力 由全球教育

快资讯2025-12-03 15:25:32

千问接入“阿里最强学习大模型”:拍题更准、讲题更
千问接入“阿里最强学习大模型”:拍题更准、讲题更

12月3日消息,阿里千问面向学习场景发布拍题答疑、作业批改两项重要更新。通

快资讯2025-12-03 14:31:10

首款“豆包AI手机”售罄,二手平台最高加价1500元
首款“豆包AI手机”售罄,二手平台最高加价1500元

12月3日消息,首款搭载豆包手机助手的手机产品努比亚M153目前已在中兴商城售

快资讯2025-12-03 14:31:01