北大团队突破边缘侧大语言模型推理加速技术-icspec

北大团队突破边缘侧大语言模型推理加速技术

来源:李智衍发布时间:2025-07-03

分享至微信

据最新研究显示，北京大学集成电路学院孙广宇团队在面向边缘侧大语言模型（LLM）推理加速的DRAM近存计算架构领域取得重大突破。团队基于混合键合工艺，设计出名为H2-LLM的全新架构，成功解决了传统DRAM近存计算在边缘设备上算力受限的问题。该架构通过提出通用近存计算模板和“以数据为中心”的数据流抽象，结合设计空间探索框架，实现了2.72倍的性能提升和1.48倍的能效提升。

大语言模型作为人工智能领域的关键技术突破，凭借强大的语言理解与生成能力，在问题推理、聊天助手、代码补全等任务中表现出色。然而，如何在边缘设备上实现高效的大语言模型推理，满足用户对数据隐私和个性化需求，同时提供流畅体验，仍是当前亟待解决的重要课题。

这项研究成果由北京大学与上海交通大学、东南大学、后摩智能及阿里巴巴达摩院联合完成，发表在第52届计算机体系结构国际研讨会（ISCA）上，并获得最佳论文奖。这是国内学术机构首次在ISCA获此殊荣。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：李智衍，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

李智衍

开创IC领域，共创美好未来!

神秘半导体企业新凯来曝光：订单超百亿

长安汽车联手斯达半导体，SiC功率模块项目投产

芯原股份上半年营收增长，净利亏损3.2亿元

查看更多

icspec【芯片求购】
https://www.icspec.com/inquiry/index/1/0

icspec【规格书】
https://www.icspec.com/

相关文章

马来西亚公司推出语言模型，DeepSeek提供技术支持

2025-08-13

哈工大团队研发高性能铋化镁基热电制冷器件

2025-08-23

英伟达推出开源机器人视觉推理模型

2025-08-12

国内AI发展四大瓶颈待突破，算力芯片与大模型成重点

1 天前

中国团队推出低成本AI模型，登上《自然》封面

5 天前

热门搜索

思波微完成天使轮融资传长鑫和长存启用国产EDA 荣耀在印度遭大立光专利诉讼华为台积电中芯国际联发科高通英特尔