DeepSeek第三弹:开源DeepGEMM!

作者:秋白 来源: 快科技 2025-02-26 13:19 阅读(

  2月26日消息,今天上午9点,DeepSeek继续履行开源周承诺,发布了开源DeepGEMM。该帖子一经转发,立即引来了2.1万阅读量,足以见其在国内外受到追捧的热度。

  据了解,DeepGEMM是一个专注于为FP8高效通用矩阵乘法(GEMM)库,支持普通及混合专家(MoE)分组的矩阵计算需求,可动态优化资源分配以提升算力效率。

  该库基于CUDA开发,采用轻量级即时编译(JIT)模块,在运行时动态编译内核,无需预先编译安装。

  值得一提的是,DeepGEMM设计目标是为DeepSeek-V3/R1模型的训练与推理提供简洁高效的底层支持,尤其针对Hopper架构GPU(如H800)优化,兼顾高性能与低成本。

  作为开源周的第三项成果,DeepGEMM的发布延续了DeepSeek此前开源模型与工具(如FlashMLA)的策略,进一步降低高性能计算技术的应用门槛。

  另外,本次开源属于DeepSeek“开源周”(2月24日-28日)的第三项项目,此前已发布FlashMLA(高效解码内核)和DeepEP(专家并行通信库)。

DeepSeek第三弹:开源DeepGEMM!
DeepSeek第三弹:开源DeepGEMM!

页面链接:   https://news.znds.com/article/news/67872.html

下一篇
2月26日消息,在日前的通州·全球发展论坛(2025年春季)“DeepSeek中国人工智能、跳跃式发展与全球2050目标”主题研讨会上,中国人民大学重阳金融研究院院长王文发布了《大跳跃:美国…