当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

6个月前 (02-25)Deepseek最新资讯352

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

接入DeepSeek,医院起飞!

接入DeepSeek,医院起飞!

DeepSeek 由中国AI初创公司杭州深度求索人工智能基础技术研究有限公司研发,其近期发布的 R1 和 V3 模型在人工智能领域引发了广泛关注。DeepSeek作为当前最热门话题之一。多家医院正式接...

国家知识产权局:严打抢注“DeepSeek”等相关商标申请行为

国家知识产权局:严打抢注“DeepSeek”等相关商标申请行为

中新经纬4月24日电 国新办24日就2024年中国知识产权强国建设有关情况举行新闻发布会。国家知识产权局局长申长雨在会上表示,严厉打击抢注“DeepSeek”等相关商标申请行为,持续强化知识产权保护,...

国家超算互联网平台宣布AI生态伙伴加速计划DeepSeek API接口免费使用

国家超算互联网平台宣布AI生态伙伴加速计划DeepSeek API接口免费使用

近日国家超算互联网平台宣布推出“AI生态伙伴加速计划”计划的核心内容包括提供3个月DeepSeek API接口免费使用“超算”+AI推动产业化进程2023年中国科技部启动国家超算互联网部署工作促进超算...

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?每次新技术浪潮涌来,总有人说财务会被取代。但工具再先进,还是要看在什么人手里。DeepSeek不会让财务这个职业消失,但一定会加剧两极分...

AI冲击波来了!多家险企宣布接入DeepSeek

AI冲击波来了!多家险企宣布接入DeepSeek

国产开源大模型DeepSeek一经发布,就以其训练成本、推理能力等方面的优异表现,在国内外引起强烈反响。近日,各家保险公司密集在官微宣布,已接入DeepSeek。那么,目前DeepSeek在保险领域的...

赵满意:DeepSeek浪潮下AI大模型赋能产业发展

赵满意:DeepSeek浪潮下AI大模型赋能产业发展

5月10日,由中国企业改革与发展研究会主办,中企研数字经济与数据资产工作委员会、企业观察报社承办的央企AI+大模型应用论坛在北京举办。论坛上,华为技术有限公司北京昇腾创新中心负责人赵满意以《DeepS...