王炸！DeepSeek发布收官 “开源周”都发布了什么？

来源：中国基金报

媒体

2025-02-28 16:14:49

（原标题：王炸！DeepSeek发布收官 “开源周”都发布了什么？）

2月28日，在“开源周”第五天，DeepSeek宣布开源Fire-Flyer文件系统（3FS），以及基于3FS的数据处理框架Smallpond。

Fire-Flyer文件系统（3FS）是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统，是所有DeepSeek数据访问的助推器。

其特点有：180节点集群中的聚合读取吞吐量为6.6TiB/s；25节点集群中GraySort基准测试的吞吐量达3.66TiB/min；每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s；具有强一致性语义的分解架构；在V3/R1中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。

Smallpond是轻量级的数据处理框架，其特点是基于DuckDB的高性能数据处理可扩展性，能够处理PB级别数据集无需持续运行的服务，以及操作简便。

至此，DeepSeek为期五天的“开源周”活动正式收官。

2月21日，DeepSeek宣布，从2月24日起将开源5个代码库，以完全透明的方式与全球开发者社区分享他们的研究进展。

2月24日，DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核，并针对可变长度序列进行了优化，现已投入生产。

2月25日，DeepSeek宣布开源DeepEP，即首个用于MoE模型训练和推理的开源EP通信库。

2月26日，DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局，完全即时编译，可为V3/R1模型的训练和推理提供强大支持等。

2月27日，DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题。

开年以来，DeepSeek持续火热。QuestMobile数据显示，自上线以来至2月9日，DeepSeek App的累计下载量已超1.1亿次，周活跃用户规模最高近9700万个。

日前，有消息称，原计划今年5月发布的DeepSeek-R2模型正在加速开发，或将提前发布。新模型有望能生成更好的代码，并使用英语之外的语言进行推理。对此，DeepSeek母公司幻方量化回应称，以官方消息为准。

印度科技服务商Zensar的首席运营官认为，DeepSeek-R2模型的发布或将成为AI行业的关键时刻。DeepSeek成功打造了具有高性价比的AI模型，将促使全球公司加速研发进程，打破目前少数企业垄断的格局。

目前，OpenAI、谷歌、xAI、Anthropic、阿里等已相继上新深度推理/深度思考模型。字节跳动旗下AI助手豆包也被传正在小范围测试深度思考模型的不同实验版本，且接入的不是DeepSeek模型。

特别推荐

盘后，重大调整落地！

证券之星资讯

2026-06-18

打新必看 | 节后6月22日两只新股申购

证券之星资讯

2026-06-18

天康生物溢价“逆势”收购背后：业绩承压与子公司上市遇阻两大风险交织

证券之星资讯

2026-06-18

首页股票财经基金导航

举报专区联系我们

王炸！DeepSeek发布收官 “开源周”都发布了什么？

相关个股

相关阅读

特别推荐