DeepSeek 开源 TileKernels:大型模型训练与推理的 GPU 内核库

Gate News 消息,4月23日——DeepSeek 已在 MIT 许可下开源了 TileKernels,这是一款使用 TileLang 编写的 GPU 内核库,面向大型语言模型的训练与推理。TileLang 是 tile-ai 团队开发的领域专用语言,用于在 Python 中表达高性能 GPU 内核。DeepSeek 表示,该库中的大多数内核已接近在计算密度与内存带宽方面的硬件性能上限,其中部分内容已部署到内部的训练与推理操作中。

该库包含六类内核:MoE (专家混合) 的门控与路由,包括 Top-k 专家选择、token 到专家的映射,以及带权重归一化的融合 expand/shrink;量化支持 FP8、FP4 和 E5M6 格式,提供按 token、按块和按通道的量化,并包含融合的 SwiGLU+量化操作;批量转置;Engram 门控,融合 RMSNorm 的前向/反向传播与权重梯度归约;Manifold HyperConnection,使用 Sinkhorn 归一化并进行混合的 split/apply;以及将底层内核封装为可训练层的高级 autograd 接口。

Engram 和 Manifold HyperConnection 是 DeepSeek 模型架构的专有组件,其实现细节首次向公众披露。该库需要 NVIDIA SM90 或 SM100 架构的 GPU (H100/H200 或 Blackwell 系列),CUDA Toolkit 13.1 或更高版本,以及 PyTorch 2.10 或更高版本。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Oobit 推出支持直接使用 USDT 支付的 AI 代理 Visa 卡

据 The Block 称,Oobit 一家由 Tether 支持的钱包初创公司今天推出虚拟“Agent Cards(代理卡)”,使 AI 代理能够直接在 Visa 支持的商户处使用 USDT 消费,无需进行货币转换或逐笔批准。每张卡都分配给单个代理,并包含消费限额

GateNews1小时前

新韩信用卡在 Solana 测试网上测试稳定币支付

据 The Block 称,韩国新韩卡(Shinhan Card)周四宣布与 Solana Foundation 达成合作,计划在 Solana 区块链上构建稳定币支付系统。该公司今年正在开展一个面向真实支付场景的先进概念验证,重点关注客户之间的

GateNews1小时前

富兰克林邓普顿的美国政府货币基金 AUM 达到 19.8 亿美元,成为 Stellar 上第二大 RWA

根据富兰克林邓普顿(Franklin Templeton),富兰克林链上美国政府货币基金(Franklin OnChain U.S. Government Money Fund,FOBXX)截至 2026 年 4 月,其管理资产规模已达到 19.8 亿美元。该基金在 Stellar 网络上以 BENJI 代币形式运作,已成为区块链上第二大现实世界资产(RWA)

GateNews1小时前

AethirClaw 于 4 月 30 日推出 CARA,可在 5 分钟内部署的预配置加密 AI 智能体

根据 AethirClaw 于 4 月 30 日的官方公告,该公司推出 CARA,这是一款运行在 Aethir 去中心化 GPU 基础设施上的预配置加密 AI 代理。该平台包含 50 多项内置技能,覆盖实时市场监测、鲸鱼钱包追踪、链上

GateNews2小时前

Kelp 两周后全面升级跨链桥、ether.fi 同步加固 WeETH

4月18日 rsETH 跨链桥遭駭后两周,Kelp 于4/29完成升级:验证者4/4、区块确认64、拓扑采用 hub-and-spoke,跨链消息必须经由以太主网中转。ether.fi 亦同步强化 weETH,并加入 DeFi United 捐赠5,000 ETH。DeFi United 动员逾70,000 ETH救援资金,Aave 等市场利率显著下降;但攻击者仍持有约107,000 rsETH待清算,需治理与委员会式流程回收。

鏈新聞abmedia2小时前
评论
0/400
暂无评论