当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

deepseek出来不久,很多人就开始出教程,你感觉是真的吗?

deepseek出来不久,很多人就开始出教程,你感觉是真的吗?

用来忽悠小白割第一茬韭菜。不要去交费就好。免费学。写评论今天passion河南 4小时前在deepseek出来没多久,很多人就开始出教程了 标题:deepseek全网最详细教程,deepseek本地...

DeepSeek写材料提示词100条

DeepSeek写材料提示词100条

DeepSeek写材料提示词100条 1常用模板生成1、生成一份标准的......会议通知模板2、撰写关于......工作的请示报告框架3、创建一份年度工作总结模板(包含成绩、不足、计划)4...

政通智合·数聚泉城 共创政务AI新场景 山东移动DeepSeek政务场景共创沙龙举办

政通智合·数聚泉城 共创政务AI新场景 山东移动DeepSeek政务场景共创沙龙举办

3月7日,山东移动与华为联合举办DeepSeek政务场景共创沙龙。本次沙龙以“政通智合·数聚泉城 共创政务AI新场景”为主题,邀请省市大数据局等相关政府单位的领导及专家齐聚泉城济南,在DeepSeek...

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

2月24日,中电万维应兰州市数据局要求,将DeepSeek人工智能大模型接入兰州市政府门户网站,打造DeepSeek在兰州市的首个应用场景。万维迅速组建DeepSeek专项协同攻坚队,55小时内圆满完...

编辑谈DeepSeek丨数智化浪潮中编辑的“智能觉醒”与转型

编辑谈DeepSeek丨数智化浪潮中编辑的“智能觉醒”与转型

  当前,数字洪流与人工智能技术正重构着当代出版业的面貌,出版人也正站在千年出版文明与智能革命的交汇点上。山东出版(601019)集团提出的“数智五化”战略,正如一把打开未来之门的钥匙,在内容生产及形...

ST易联众:公司“智鼎云帆大模型平台”已接入DeepSeek,与DeepSeek已完成适配

ST易联众:公司“智鼎云帆大模型平台”已接入DeepSeek,与DeepSeek已完成适配

每经AI快讯,有投资者在投资者互动平台提问:请问公司和deepseek的合作需要付费给deepseek嘛还是单纯的调用免费的资源?ST易联众(300096.SZ)3月4日在投资者互动平台表示,公司继2...