当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

3周前 (02-24)Deepseek最新资讯51

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

腾讯理财通接入DeepSeek-R1模型满血版

腾讯理财通接入DeepSeek-R1模型满血版

2月20日,经济观察网获悉,腾讯理财通正式接入DeepSeek-R1模型满血版,同时支持腾讯混元大模型。用户下载腾讯理财通App,首页点击搜索框或股票行情入口即可体验。此前腾讯理财通已上线AI(人工智...

deepseek什么意思主要用来做什么 深入了解DeepSeek:探索未来科技的无限潜力

deepseek什么意思主要用来做什么 深入了解DeepSeek:探索未来科技的无限潜力

标题:深入了解DeepSeek:探索未来科技的无限潜力关键词:DeepSeek,人工智能,智能搜索,数据分析,技术革新,应用场景描述:深入解析DeepSeek的含义与应用,了解它如何革新行业和改善日常...

DeepSeek大火,有人惊喜有人忧——突飞猛进的AI会取代人类创作吗?

DeepSeek大火,有人惊喜有人忧——突飞猛进的AI会取代人类创作吗?

春节期间,对大众来说最惊喜的有二:一个是《哪吒2》,另一个是DeepSeek。DeepSeek一问世就以其卓越的逻辑推理能力和多模态理解能力崭露头角,再次刷新了人们对AI的认知。尤其是DeepSeek...

DeepSeek实战技巧:最强使用攻略,100个精品提示词

DeepSeek实战技巧:最强使用攻略,100个精品提示词

掌握 DeepSeek 这招,1000 神级提示词带你秒变 AI 高手想成为 AI 领域的佼佼者吗?这里有一份 DeepSeek 实战技巧大礼包!涵盖从新手入门到高手进阶的全方位教程,揭秘 99% 的...

海西:举办DeepSeek政务应用培训

海西:举办DeepSeek政务应用培训

怎么恢复误删的 DeepSeek 模型?要恢复误删的 DeepSeek 模型,可以尝试以下步骤:检查版本历史:打开 DeepSeek 界面,查找右上角的时间钟图标,点击进入。在这里,你可以看到之前所有...

股市连续涨停板,四川金顶:未与DeepSeek开展业务合作

股市连续涨停板,四川金顶:未与DeepSeek开展业务合作

微成都报道2月19日晚间,四川金顶(600678.SH)发布股票交易风险提示公告称,在2月17日至2月19日连续3个交易日期间,公司股票收盘价格累计涨幅达33.13%,属于股票交易异常波动,提醒广大投...