当前位置：首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布

2周前 (08-12)Deepseek最新资讯101

　　快科技8月12日消息，ChatGPT-5已经发布，那么国产大模型DeepSeek大版本更新也就不远了。

　　从网友向DeepSeek提出的问题看，该模型给出的答案是，DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

　　在这样的背景下，国产算力链多家公司股价出现了大涨，比如寒武纪直接今天20cm涨停，股价创历史新高，市值突破3550亿元。

　　按照之前的说法，DeepSeek-R2大模型将会采用一种更先进的混合专家模型（MoE），其结合了更加智能的门控网络层（Gating Network）以优化高负载推理任务的性能。

　　有分析师预计，DeepSeek-R2的定价可能显著低于OpenAI同类产品，预示着其可能颠覆现有AI服务的定价模式。

　　此外，还有相关消息显示，DeepSeek-R2预计比GPT-4成本下降97%；并且是在昇腾卡上做的训练，主打一个全方位全产业链的自主可控。

　　据相关人士透露的情况，DeepSeek-R2的总参数量可能会达到1.2万亿，比DeepSeek-R1的6710亿参数增加大约一倍。

　　据华为实验室统计，这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的，还有待观察，但看起来确实更强大、更自主了。原文出处：基于华为昇腾训练性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布，感谢原作者，侵权必删！

标签: deepseek

返回列表

　　天眼查App显示，deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利近日公布。摘要显示，该发明涉及人工智能领域，有益效果在于将...

　　[中国，深圳，2025年8月15日]以“鲲鹏昇腾无处不在，成就商业好生意”为主题的2025华为深圳政企&恒扬数据新品推介会暨展车体验活动成功举办，百余位行业嘉宾齐聚一堂，共同探...

　　在这背后，并非其技术力量不足，而是当前的应用形态仍停留在“工具赋能”的初级阶段，大模型的潜力被束缚在碎片化场景中，未能转化为重构生产逻辑的核心动能。　　正如360集...

　　根据工作需要及建设符合相关数据安全要求。丹东市公安局拟采购 2 套适合中（小）场景应用的 DeepSeek 70B 运行环境。...

　　8月2日，浙江大学脑机智能全国重点实验室发布新一代神经拟态类脑计算机—Darwin Monkey（以下简称“悟空”）。“悟空”支持的脉冲神经元规模超过20亿，神经突触超过千亿，其神经元...

　　近日，国内顶级量化私募机构幻方量化陷入一场牵涉金额高达1.18亿元的返佣案件。此案涉及幻方量化市场总监李橙，时间跨度长达六年。案件曝光后，幻方量化作为大模型DeepSeek的母公司，其...

基于华为昇腾训练 性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布