当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

3周前 (02-24)Deepseek最新资讯61

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

中国多地政务服务系统接入DeepSeek效率大增

中国多地政务服务系统接入DeepSeek效率大增

考消息网2月20日报道据台湾“中央社”2月19日报道,深度求索(DeepSeek)推出低成本且高效的大型语言模型掀起热潮,中国多地相继宣布政务服务系统接入应用,称可以大幅提升工作效率。以往要花一天时间...

贵阳贵安DeepSeek部署应用新闻发布会举行

贵阳贵安DeepSeek部署应用新闻发布会举行

3月7日,贵阳贵安DeepSeek部署应用新闻发布会举行,全面介绍当前贵阳贵安推进DeepSeek大模型的本地化部署与应用情况。作为全国首个国家大数据综合试验区核心区,自DeepSeek发布后,贵阳贵...

deepseek能用来干啥-deepseek有什么用途

deepseek能用来干啥-deepseek有什么用途

DeepSeek是一款基于人工智能技术的工具,旨在帮助用户高效处理和分析数据、生成内容、优化工作流程等。其应用场景非常广泛,具体功能和使用场景包括但不限于以下几个方面:一、数据分析与可视化数据导入:支...

安徽率先落地DeepSeek满血版,打造“人工智能+政务服务”样板

安徽率先落地DeepSeek满血版,打造“人工智能+政务服务”样板

日前,安徽省率先在全国省级层面完成DeepSeek满血版(671B)本地化部署,推出无差别综窗、公文写作、语音转文字等16个典型应用,并在全省试用推广。“我们已在‘皖政通’推出‘语音转文字’应用,利用...

DeepSeek更懂日常生活-DeepSeek应用场景

DeepSeek更懂日常生活-DeepSeek应用场景

DeepSeek更懂日常生活-DeepSeek应用场景<think> 嗯,今天我在想DeepSeek这个系统在日常生活中的重要应用场景。我之前只听说过它在商业咨询、法律、医疗诊断等方面的...

DeepSeek激活“芯”机遇

DeepSeek激活“芯”机遇

本土AI生态小伙伴正在朝着DeepSeek“集结”时,海外AI芯片商也快速行动起来。位于美国加州的AI芯片厂商 Cerebras已经接入了DeepSeek-R1 大语言模型,其CEO 在接受采访时表示...