当前位置:首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

2周前 (08-12)Deepseek最新资讯101

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

  从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

  在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

  按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

  此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

  据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

  据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。原文出处:基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布,感谢原作者,侵权必删!

标签: deepseek

“基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布” 的相关文章

deepseek关联公司公布大语言模型部署方法专利

deepseek关联公司公布大语言模型部署方法专利

  天眼查App显示,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利近日公布。摘要显示,该发明涉及人工智能领域,有益效果在于将...

恒扬数据携手华为发布智能计算新品 共筑算力新生态

恒扬数据携手华为发布智能计算新品 共筑算力新生态

  [中国,深圳,2025年8月15日]以“鲲鹏昇腾无处不在,成就商业好生意”为主题的2025华为深圳政企&恒扬数据新品推介会暨展车体验活动成功举办,百余位行业嘉宾齐聚一堂,共同探...

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

  在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。   正如360集...

146 万、丹东市公安局 DeepSeek 70B 部署大单

146 万、丹东市公安局 DeepSeek 70B 部署大单

  根据工作需要及建设符合相关数据安全要求。丹东市公安局拟采购 2 套适合中(小)场景应用的 DeepSeek 70B 运行环境。...

突破性进展!国际首台,“悟空”研制成功

突破性进展!国际首台,“悟空”研制成功

  8月2日,浙江大学脑机智能全国重点实验室发布新一代神经拟态类脑计算机—Darwin Monkey(以下简称“悟空”)。“悟空”支持的脉冲神经元规模超过20亿,神经突触超过千亿,其神经元...

DeepSeek母公司员工套取上亿元被抓,幻方量化称为个人行为

DeepSeek母公司员工套取上亿元被抓,幻方量化称为个人行为

  近日,国内顶级量化私募机构幻方量化陷入一场牵涉金额高达1.18亿元的返佣案件。此案涉及幻方量化市场总监李橙,时间跨度长达六年。案件曝光后,幻方量化作为大模型DeepSeek的母公司,其...