当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2周前 (02-25)Deepseek最新资讯51

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

车企“抢滩”DeepSeek背后:角力智能座舱,降低投资成本

车企“抢滩”DeepSeek背后:角力智能座舱,降低投资成本

DeepSeek掀起的技术革命正在席卷汽车行业。截至目前,超过20家车企宣布接入DeepSeek模型,涵盖了比亚迪、吉利、奇瑞、岚图、长城、理想汽车等主流品牌。这一情况与2023年ChatGPT爆火时...

从0到1玩转DeepSeek,小白也能秒变AI高手

从0到1玩转DeepSeek,小白也能秒变AI高手

一、DeepSeek 初印象在人工智能飞速发展的今天,各类 AI 工具层出不穷,而 DeepSeek 无疑是其中备受瞩目的新星 。它以强大的功能和对零基础用户的友好度,迅速在 AI 领域崭露头角,成为...

亚信科技与清华AIR联合发布《DeepSeek赋能自智网络高阶演进评测报告

亚信科技与清华AIR联合发布《DeepSeek赋能自智网络高阶演进评测报告

2025年2月28日,亚信科技与清华大学智能产业研究院(AIR)联合发布《DeepSeek赋能自智网络高阶演进评测报告》中英文版。该报告为通信行业首份系统性评估DeepSeek等基础大模型对自智网络应...

“AI公务员”来了?济南这里上线DeepSeek

“AI公务员”来了?济南这里上线DeepSeek

近日,深圳市福田区宣布已成功上线基于DeepSeek技术开发的70名“数智员工”,全面覆盖政务服务全链条。这意味着首批“AI公务员”正式上岗,政务智能化转型迈出了重要一步。近日,山东首个全国产芯“满血...

专访学而思CTO田密:接入DeepSeek改变的不只是产品

专访学而思CTO田密:接入DeepSeek改变的不只是产品

开源的DeepSeek大模型火了,在线教育行业也因此卷起千层浪花。近期,学而思、网易有道、中公教育、猿辅导、作业帮等头部企业密集宣布接入DeepSeek大模型,这引发了业界广泛关注。DeepSeek为...

DeepSeek带动对冲基金快速涌入中国股市

DeepSeek带动对冲基金快速涌入中国股市

据彭博社16日报道,中国人工智能公司DeepSeek的技术突破,正促使股票资金从印度回流到中国。彭博社称,随着DeepSeek推动中国科技行业形势看涨,以及中国将出台更多利好经济措施的预期,全球对冲基...