当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek -V3.1让国产算力迎新机遇

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

  就此,速途研究院院长丁道师告诉《中国经营报》记者,这次版本的升级,性能更强大了,更好用了。但核心还不是这些升值,而是针对国产芯片的优化,这个才是重中之重。

  爱分析首席李喆告诉本报记者,V3.1版本融合了大语言模型和推理模型,做了Agent适配和国产芯片适配。整体来看,模型能力本身没有大提升,主要是工程化方面做了很多优化,更适合在模型之上开发各类应用。

  丁道师认为,英伟达芯片不安全了,我们就要开启国产化了,在这个背景下,DeepSeek进行了这次大升级。“所以说要把这些背景全部结合起来看,才能一目了然看到这一次升级的本质,就是说现在我国大模型人工智能产业要实现自主可控,要不被美国的产品卡脖子,我们就需要在模型、芯片、算法等多个层面实现自主突破,这样就能理解此次DeepSeek的升级,以及华为芯片的升级之所以备受关注的原因所在了,这背后是整个国家战略的支撑。”

  据了解,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片,实现“低卡高能”部署,带动全产业链发展。在政策推动下,其与昇腾组合切入关键领域,打破垄断,对国产算力及AI产业发展意义重大。

  根据中研网预测,2025年中国AI算力市场达1200亿元。华西证券表示,DeepSeek-V3.1通过技术迭代带动芯片、服务器和云服务的联动优化。国产算力链条呈现出“外部受阻、内部加速”的格局,标志着中国大模型生态正在进入自主化与规模化并进的新阶段。

  近日,硅谷顶级风投a16z发布了新一期的AI应用百大榜单。ChatGPT依旧稳坐第一,但这个宝座越来越不稳固了。Google的Gemini用户数已经追到它的一半,它俩现在是两大顶级的新一代人工智能平台。

  马斯克的Grok靠着一款二次元虚拟伴侣Ani,硬是从0发展到2000万月活。DeepSeek在今年年初爆火后,月活跃用户出现下降,移动端下降了22%,网页端达到了40%。不过其他国产应用表现继续亮眼,移动端Top 50的应用中,预计有22款是由中国团队开发的应用。

  在前20名里,阿里的夸克、字节的豆包、月之暗面的Kimi同时上榜。其中,Kimi作为新兴创业团队的一款产品,能和ChatGPT、Gemini这些巨头产品同台竞争,已经说明了国内用户对中文大模型的强烈需求。

  “DeepSeek -V3.1的优势是继续降低了token使用量,降低使用成本。性能与效果层面,V3.1和其他基模无显著差异。后续各家基模能力上不会有特别大差别deepseek,大概率都围绕着如何降低使用成本、提升使用体验和输出稳定性方面进行不断优化。新一轮模型价格战要开始了。”李喆说。

  要论2024年国内最风光的AI明星,DeepSeek认第二,可能没人敢认第一。QuestMobile数据显示,去年一季度它的下载量冲到8111万次,相当于每16个中国人就有1人装了其APP,比当年微信刚出朋友圈还火。

  不过,后来有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

  比如,Kimi K2就用了MOE架构,总参数1T,激活参数32B。另外,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。原文出处:DeepSeek -V3.1让国产算力迎新机遇,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek -V3.1让国产算力迎新机遇” 的相关文章

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网

  :V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。   这次最明显的变化是,DeepSeek在官方APP...

Deepseek推荐全国旅游百强区第12名:贵州贵阳市南明区

Deepseek推荐全国旅游百强区第12名:贵州贵阳市南明区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

万马科技(300698.SZ):已全面开展包括R1在内的DeepSeek全系列模

万马科技(300698.SZ):已全面开展包括R1在内的DeepSeek全系列模

  (300698.SZ)于投资者互动平台表示,公司“遨云”自动驾驶综合解决方案具有高度的兼容性和扩展性,构建高效生态协同。公司已全面开展包括R1在内的DeepSeek全系列模型适配工作d...

DeepSeek母公司总监涉收券商回佣被查,6年非法套取1.18亿元

DeepSeek母公司总监涉收券商回佣被查,6年非法套取1.18亿元

  DeepSeek母公司幻方量化市场总监李橙卷入腐败案,涉案金额达到1.18亿元,目前已在协助调查。   据21经济网10日报道,去年11月,幻方量化市场总监李橙因涉及...

C罗香港比赛 到底哪里还有票😫 想要官方票1990 2490 2990都可以

C罗香港比赛 到底哪里还有票😫 想要官方票1990 2490 2990都可以

  主要去年就是这么搞的,最后还来不了了,不过其实也是一种卖票的手段,正常操作,之前抖音还直播卖票来着,虎扑应该可以搜到,我没截图   主要去年就是这么搞的,最后还来不了...

中国创新药“DeepSeek”时刻已至,上银医疗健康混合A近一年收益率57.49

中国创新药“DeepSeek”时刻已至,上银医疗健康混合A近一年收益率57.49

  今年以来,A股医药板块在历经三年多深度调整后迎来显著反转,成为震荡市中表现最为亮眼的板块之一。Wind数据显示,截至7月末,中证医疗指数今年以来上涨12.73%,中证创新药30指数同期...