当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

5个月前 (03-25)DeepSeek技术交流372

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

航天宏图:“天权”大模型产品矩阵均已全面接入DeepSeek大模型

航天宏图:“天权”大模型产品矩阵均已全面接入DeepSeek大模型

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...

DeepSeek热度狂飙,运营商、手机厂抢着用!

DeepSeek热度狂飙,运营商、手机厂抢着用!

近期,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。记者从工业和信息化部了解到,三家基础电信企业已全面接入国产开源大模型DeepSeek。除了运营商的云平台...

中国石油大学(华东)“i石大”版满血DeepSeek正式上线

中国石油大学(华东)“i石大”版满血DeepSeek正式上线

2月26日,中国石油大学(华东)宣布,属于石大人自己的“i石大”版满血DeepSeek大模型——AI智能助手正式上线。石大师生可通过学校微信企业号或直接点击PC端链接进入使用,随时随地体验DeepSe...

DeepSeek赋能,美的空调开启AI智能新篇

DeepSeek赋能,美的空调开启AI智能新篇

2025年初,中国人工智能大模型 DeepSeek火遍全球,让全世界看到了中国AI技术的巨大潜力。国内家电行业也迅速乘上了这股东风,持续探索人工智能大模型与智能家居结合的无限可能性。据悉,家电巨头美的...

DeepSeek 入选2025 十大年度 IP

DeepSeek 入选2025 十大年度 IP

DeepSeek 入选2025 十大年度 IPIT之家 5 月 12 日消息,由中国版权协会、中国文化娱乐行业协会等单位指导,新浪财经、微博等单位联合主办的 2025 世界 IP 经济发展大会暨全球...

神州信息:公司引入国产开源大模型DeepSeek

神州信息:公司引入国产开源大模型DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:公司是否有接入deepseek合作??神州信息(000555.SZ)4月21日在投资者互动平台表示,作为领先的金融科技企业,公司引入国产开源大模型DeepS...