当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

3周前 (02-25)Deepseek最新资讯52

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File)...

DeepSeek本地部署,谁借“信息差”割韭菜?“解决”服务器繁忙从一分到百万元

DeepSeek本地部署,谁借“信息差”割韭菜?“解决”服务器繁忙从一分到百万元

“这本质上就是‘信息差’生意。”北京商报记者丨卢扬 程靓AI浪潮下,随着现象级应用DeepSeek爆火,市场上也兴起了“信息差”生意。临近“3·15”,有消费者反映,在本地部署DeepSeek时,容易...

国家广电总局广科院、当虹科技等单位发起成立DeepSeek传媒行业应用创新联盟

国家广电总局广科院、当虹科技等单位发起成立DeepSeek传媒行业应用创新联盟

证券时报e公司讯,2月11日举办的DeepSeek大模型传媒行业应用研讨会上,当虹科技与国家广电总局广科院等多家单位联合发起成立DeepSeek传媒行业应用创新联盟,共同迈进“DeepSeek+传媒应...

“调用量太大,经常造成网络拥堵”!DeepSeek推出新优惠,普通用户依然免费

“调用量太大,经常造成网络拥堵”!DeepSeek推出新优惠,普通用户依然免费

中国商报(记者 赵熠如)2月26日,DeepSeek宣布推出错峰优惠活动。即日起,北京时间每日00:30至08:30的夜间空闲时段,API(应用程序编程接口,通常用于应用开发)调用价格大幅下调:Dee...

什么是“具身智能”?DeepSeek和专家分别如何解读

什么是“具身智能”?DeepSeek和专家分别如何解读

过去一年,我国新质生产力发展步伐明显加快。我国在全球创新指数中的排名上升到第11位,是十年来全球创新力提升最快的经济体。而今年的《政府工作报告》,对培育壮大新兴产业、未来产业,推动传统产业改造提升,激...

关于DeepSeek V3/R1 Decoding吞吐极限的估计

关于DeepSeek V3/R1 Decoding吞吐极限的估计

经历了一周DeepSeek的打脸活动后,周六 DeepSeek终于开大放出来了自身的推理系统水平,DeepSeek:DeepSeek-V3 / R1 推理系统概览 。在这个结论放出来之前,没...