当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

3周前 (02-24)Deepseek最新资讯45

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

信阳市审计局举办DeepSeek专题大数据审计论坛

信阳市审计局举办DeepSeek专题大数据审计论坛

为深入践行科技强审理念,推动审计工作提质增效,2月20日,市审计局举办以人工智能为主题的大数据审计论坛,探讨人工智能技术在审计领域的最新进展及其实际应用。  该局三名年轻大数据审计能手潜心研究、精心准...

仙乐健康:接入DeepSeek大模型 布局智能配方设计

仙乐健康:接入DeepSeek大模型 布局智能配方设计

仙乐健康(300791)近日宣布已完成DeepSeek大模型的战略接入,仙乐健康旨在通过接入DeepSeek打造独有的智能配方设计系统。...

DeepSeek:为调查女神写的诗歌

DeepSeek:为调查女神写的诗歌

女神节她力量放光芒2025/03/08HAPPY WOMEN'S DAY蛇年伊始国产人工智能大模型DeepSeek迅速火爆出圈、霸屏网络科技前沿跃动智慧之光统计调查人亦是追光者今年正值第四次全...

安卓首家接入DeepSeek背后:看见女性力量

安卓首家接入DeepSeek背后:看见女性力量

在人类社会的历史进程中,女性的力量从来不容小觑,她们以不同的方式在各个领域诠释着自身价值。今天,我们将目光投向科技领域:中国科技部最新统计显示,我国女性科技工作者总量达4260万人,在科研人员总量中占...

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?思考和行动过程用户希望了解DeepSeek在医疗诊断中的具体应用。DeepSeek是一款开源的人工智能模型,具备强大的自然语言处理和数据分析能力,可能在医...

DeepSeek在多个领域拥有巨大应用潜力

DeepSeek在多个领域拥有巨大应用潜力

本报讯记者张守营报道近日,由资深人工智能应用专家卢森煌撰写的《高效使用DeepSeek》正式出版。本书被誉为“保姆级”DeepSeek使用指南,旨在帮助个人和企业零基础掌握AI工具的高效应用方法,覆盖...