当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

1个月前 (07-10)Deepseek应用场景206

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型

寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型

【寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型】财联社6月26日电,寒武纪在互动平台表示,公司研发的产品是通用型智能芯片,可以适配包括DeepSeek在内的主流开源模型。...

GEO优化是什么?deepseek搜索结果植入有哪些因素决定?

GEO优化是什么?deepseek搜索结果植入有哪些因素决定?

GEO优化(生成式引擎优化)是指通过优化内容结构和数据特征,使品牌信息更易被生成式AI抓取并推荐的技术,其核心是提升内容在AI训练数据和实时检索中的可见度。DeepSeek搜索结果植入主要受四大因素影...

deepseek 32b和70b区别

deepseek 32b和70b区别

Deepseek32B以闪电云算力重塑智能时代,从医疗诊断到智慧城市,其深度学习算法正推动金融、交通等行业的全面革新,让精准决策与高效生活触手可及。内容由AI智能生成有用随着人工智能技术的飞速发展,越...

拉芳家化:2025年初开始在办公流程中使用DeepSeek技术

拉芳家化:2025年初开始在办公流程中使用DeepSeek技术

证券之星消息,拉芳家化(603630)07月17日在投资者关系平台上答复投资者关心的问题。投资者:为评估公司价值,请说明1.是否在办公、研发、客户服务或业务流程中应用AI技术?(a)是(b)否2.若应...

AI钉铛智造深度融合DeepSeek:构建制造业生产智能服务生态共同体

AI钉铛智造深度融合DeepSeek:构建制造业生产智能服务生态共同体

2025 年,人工智能正以不可逆转之势重构全球产业版图,中国工业智能化进程在此浪潮中迎来关键突破。在这一历史性节点上,红壹科技于 1 月 2 日正式发布自主研发的工业大模型 “时光基 AI”,其成功兼...

中公教育携手DeepSeek大模型加速就业服务数字化升级

中公教育携手DeepSeek大模型加速就业服务数字化升级

2025年初,DeepSeek-R1大模型的发布为教育行业带来重大技术革新。中公教育敏锐把握这一机遇,于是完成旗下"云信"垂直大模型与DeepSeek的私有化部署,显著提升了AI在...