北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元
来源:青橘网 发表于2025-07-28 20:00:25 编辑:沫晓朵
摘要: 在人工智能领域,大语言模型的训练与推理成本一直是限制技术普及的关键因素之一。近日,北京大学人工智能研究院助理教授张牧涵团队在鲲鹏昇腾科教

  在人工智能领域,大语言模型的训练与推理成本一直是限制技术普及的关键因素之一。近日,北京大学人工智能研究院助理教授张牧涵团队在鲲鹏昇腾科教创新卓越中心(简称“卓越中心”)提供的算力支持下,成功研发出一套高效的大模型训练推理架构,实现了百万tokens输入成本低至1元,为产业提供了高效能、低成本的解决方案。

  此研究成果包括三项关键技术创新。首先,目前广泛使用的相对位置编码存在较大的稀疏性,团队通过将每个注意力头中的位置信息和非位置信息分离,对位置编码进行了低秩压缩,仅使用3%的位置信息,即可维持原有表达能力。该方法通过优化昇腾硬件的flash-attention算子,使得注意力头的参数得到更高效利用。

  第二,非位置编码信息在原始模型中通常处于被抑制状态。通过将位置编码与非位置编码分离,非位置编码得到了较大的压缩空间。团队采用了联合KV的低秩压缩方法,仅保留12.5%的KV Cache即可维持原始模型的能力。这一方法能够有效利用昇腾硬件高效的计算能力,减轻访存压力,显著提升推理效率。

  最后,基于昇腾硬件在出色的并行计算能力,团队实现的Recurrent Decoding(RD)技术通过替换LM-head提升了训练数据利用率并加速了推理。在训练阶段,RD通过将解码出的多个tokens与target tokens进行对比,实现了训练数据的高效利用;在推理阶段,结合投机推理显著提高了tokens的采样通过率,进而提升了推理速度。

  这一成果得到了学术界的广泛关注,不仅为科研提供了可复用的高效架构,也为AI大模型在企业中的应用大幅降低了成本。自去年6月成立以来,北京大学与华为在产业前沿课题的联合攻关持续推进,本次成果验证了昇腾算力平台支撑尖端科研的技术实力。卓越中心将继续深入开展大模型关键技术创新,为构建中国技术生态提供坚实支撑。

投稿邮箱:qingjuedu@163.com
相关推荐
西湖大学2025年走出浙江招生,收获满满,隐藏的原因揭
西湖大学2025年走出浙江招生,收获满满,隐藏的原因揭

原标题:西湖大学2025年走出浙江招生,收获满满,隐藏的原因揭秘 西湖大学作

快资讯2025-07-27 15:29:38

此地成立“烧烤研究院”,正编写教材,预计明年招生
此地成立“烧烤研究院”,正编写教材,预计明年招生

原标题:此地成立烧烤研究院,正编写教材,预计明年招生 据岳阳发布,近日

快资讯2025-07-21 20:22:50

教育部发布留学预警!
教育部发布留学预警!

原标题:教育部发布留学预警! 近期,菲律宾治安不靖,针对中国公民犯罪多

快资讯2025-07-19 14:37:53

暑期青少年扎堆整容,专家提醒:未成年人整容风险大
暑期青少年扎堆整容,专家提醒:未成年人整容风险大

原标题:暑期青少年扎堆整容,专家提醒:未成年人整容风险大 正值暑假,不

快资讯2025-07-16 14:55:56

择期宣判!“湘潭大学宿舍投毒案”二审:被告人道歉
择期宣判!“湘潭大学宿舍投毒案”二审:被告人道歉

原标题:择期宣判!湘潭大学宿舍投毒案二审:被告人道歉,但不承认投毒是为

快资讯2025-07-11 19:54:03

苏州琅文高级中学 | 启程未来精英,重书人生篇章
苏州琅文高级中学 | 启程未来精英,重书人生篇章

中考结束后,家长是否在为孩子的升学而发愁?普通分数家庭其实不用太多的焦

快资讯2025-07-11 11:14:02

福州全市学校因台风丹娜丝停课一天,教育局:正商定
福州全市学校因台风丹娜丝停课一天,教育局:正商定

原标题:福州全市学校因台风丹娜丝停课一天,教育局:正商定后续复课安排

快资讯2025-07-09 19:36:44

青岛大学凌晨通报“宿管人员离世”后,学生透露:事
青岛大学凌晨通报“宿管人员离世”后,学生透露:事

原标题:青岛大学凌晨通报宿管人员离世后,学生透露:事发区域正在装空调​

快资讯2025-07-07 20:07:43

丽江失联的20岁女大学生已确认身亡,救援队:疑似坠
丽江失联的20岁女大学生已确认身亡,救援队:疑似坠

原标题:丽江失联的20岁女大学生已确认身亡,救援队:疑似坠崖 经过6天的寻

快资讯2025-07-07 20:03:15

山东一高校因高温暂停期末考试,下学期开学继续考
山东一高校因高温暂停期末考试,下学期开学继续考

原标题:山东一高校因高温暂停期末考试,下学期开学继续考 7月5日晚,多名网

快资讯2025-07-06 16:22:51