北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元
来源:青橘网 发表于2025-07-28 20:00:25 编辑:沫晓朵
摘要: 在人工智能领域,大语言模型的训练与推理成本一直是限制技术普及的关键因素之一。近日,北京大学人工智能研究院助理教授张牧涵团队在鲲鹏昇腾科教

  在人工智能领域,大语言模型的训练与推理成本一直是限制技术普及的关键因素之一。近日,北京大学人工智能研究院助理教授张牧涵团队在鲲鹏昇腾科教创新卓越中心(简称“卓越中心”)提供的算力支持下,成功研发出一套高效的大模型训练推理架构,实现了百万tokens输入成本低至1元,为产业提供了高效能、低成本的解决方案。

  此研究成果包括三项关键技术创新。首先,目前广泛使用的相对位置编码存在较大的稀疏性,团队通过将每个注意力头中的位置信息和非位置信息分离,对位置编码进行了低秩压缩,仅使用3%的位置信息,即可维持原有表达能力。该方法通过优化昇腾硬件的flash-attention算子,使得注意力头的参数得到更高效利用。

  第二,非位置编码信息在原始模型中通常处于被抑制状态。通过将位置编码与非位置编码分离,非位置编码得到了较大的压缩空间。团队采用了联合KV的低秩压缩方法,仅保留12.5%的KV Cache即可维持原始模型的能力。这一方法能够有效利用昇腾硬件高效的计算能力,减轻访存压力,显著提升推理效率。

  最后,基于昇腾硬件在出色的并行计算能力,团队实现的Recurrent Decoding(RD)技术通过替换LM-head提升了训练数据利用率并加速了推理。在训练阶段,RD通过将解码出的多个tokens与target tokens进行对比,实现了训练数据的高效利用;在推理阶段,结合投机推理显著提高了tokens的采样通过率,进而提升了推理速度。

  这一成果得到了学术界的广泛关注,不仅为科研提供了可复用的高效架构,也为AI大模型在企业中的应用大幅降低了成本。自去年6月成立以来,北京大学与华为在产业前沿课题的联合攻关持续推进,本次成果验证了昇腾算力平台支撑尖端科研的技术实力。卓越中心将继续深入开展大模型关键技术创新,为构建中国技术生态提供坚实支撑。

投稿邮箱:qingjuedu@163.com
相关推荐
这不对劲儿!教育各家AI功能越来越像了
这不对劲儿!教育各家AI功能越来越像了

来源| 作者|TCOH 编者按: 本文为约稿。作者TCOH为教育行业资深从业者。 过去一

快资讯31分钟前

剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元
剥离教育等业务后,奇梦岛2026财年Q1靠潮玩实现1.27亿元

12月4日消息,近日,奇梦岛(NASDAQ:HERE,量子之歌前身)披露了2026财年第一季度

快资讯8小时前

国内首款AI助盲眼镜发布,可实现避障、找物读物、语
国内首款AI助盲眼镜发布,可实现避障、找物读物、语

12月4日消息,杭州瞳行科技公司于本周正式发布国内首款AI助盲眼镜。 据介绍,

快资讯8小时前

乐队鼓手创办的职业规划平台融资500万美元,已服务
乐队鼓手创办的职业规划平台融资500万美元,已服务

12月4日消息,一体化职业规划平台Find Your Grind宣布完成500万美元A轮融资,本轮

快资讯8小时前

清华大学具身智能与机器人研究院成立,挂靠科研院
清华大学具身智能与机器人研究院成立,挂靠科研院

12月3日消息,11月30日,清华大学具身智能与机器人研究院成立。 清华大学校长

快资讯2025-12-03 22:31:11

可灵AI发布“可灵O1”:整合文本、图像、音频等模态
可灵AI发布“可灵O1”:整合文本、图像、音频等模态

12月3日消息, 快手旗下可灵AI正式发布可灵O1,该产品定位为大一统的多模态创

快资讯2025-12-03 22:31:01

得力上海品牌旗舰店启幕:以“超级体验”重塑文具行
得力上海品牌旗舰店启幕:以“超级体验”重塑文具行

2025年11月29日,得力上海品牌旗舰店(deli world)在上海静安大悦城盛大开业。这家

快资讯2025-12-03 17:56:06

2025"燃•朗文少年"青少年英语口语演讲活动圆满收官
2025"燃•朗文少年"青少年英语口语演讲活动圆满收官

六强少年闪耀北京舞台,中国印尼跨国联动呈现AI时代的未来表达力 由全球教育

快资讯2025-12-03 15:25:32

千问接入“阿里最强学习大模型”:拍题更准、讲题更
千问接入“阿里最强学习大模型”:拍题更准、讲题更

12月3日消息,阿里千问面向学习场景发布拍题答疑、作业批改两项重要更新。通

快资讯2025-12-03 14:31:10

首款“豆包AI手机”售罄,二手平台最高加价1500元
首款“豆包AI手机”售罄,二手平台最高加价1500元

12月3日消息,首款搭载豆包手机助手的手机产品努比亚M153目前已在中兴商城售

快资讯2025-12-03 14:31:01