当前位置:首页 > Deepseek最新资讯 > 正文内容

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

1周前 (08-14)Deepseek最新资讯95

  Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

  说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

  结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

  就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

  这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

  他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

  最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

  通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。

  最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

  离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众。

  而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。

  从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

  相较于主流的大语言模型,主打开源、小快灵的Mistraldeepseek,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

  同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

  截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。原文出处:被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了,感谢原作者,侵权必删!

标签: deepseek

“被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了” 的相关文章

中钢洛耐举办DeepSeek应用专题交流会

中钢洛耐举办DeepSeek应用专题交流会

  为深入贯彻宝武“2526”工程战略部署,加速DeepSeek技术在企业场景的落地应用,中钢洛耐于7月30日举办“中钢集团DS推广应用以及竞赛案例交流会”,交流会聚焦DeepSeek平台...

DeepSeek算力租赁业务估值或超百亿,北交所AI板块扩容在即

DeepSeek算力租赁业务估值或超百亿,北交所AI板块扩容在即

  据接近交易人士透露,深度求索算力租赁业务上市前估值已突破80亿元,预计发行后市值将超百亿。北交所相关负责人表示:“该企业上市将显著提升交易所科技属性,吸引更多硬科技企业关注。”...

奥尔特曼:DeepSeek和Kimi是OpenAI开源的重要原因

奥尔特曼:DeepSeek和Kimi是OpenAI开源的重要原因

  【环球网科技综合报道】8月20日消息,据美国CNBC(美国消费者新闻与商业频道)报道,OpenAI创始人山姆·奥尔特曼日前接受采访时表示,美国低估了中国下一代人工智能的威胁,单靠芯片管...

亨利当年是怎么突然开窍的?

亨利当年是怎么突然开窍的?

  当时的意甲真的好看也是那时喜欢看足球的,亨利在尤文是没战术地位踢边锋,但他身体条件和技术是相当不错的,当年在边锋位置上他踢的很一般,皮耶罗打的位置更适合亨利,但有一说一巅峰的皮耶罗很厉...

[流言板]杨幂用华为Pura X晒自拍,谐音梗祝福鸿蒙5终端数破1000万

[流言板]杨幂用华为Pura X晒自拍,谐音梗祝福鸿蒙5终端数破1000万

  随后,演员杨幂使用华为Pura X发布自拍,并配文“你负责‘红’,我负责‘萌’。”用谐音梗为鸿蒙送上祝福。   据了解,华为Pura X是首款全面搭载鸿蒙5的手机,已...

华为昇腾AI芯片调试中,后续将加速deepseek进程并保障安全

华为昇腾AI芯片调试中,后续将加速deepseek进程并保障安全

  刚开始用华为昇腾AI芯片,不匹配是正常的deepseek,等调试好了,后面deepseek就进展快了,而且还能保证安全。用英伟达的说不定就有后门!原文出处:华为昇腾AI芯片调试中,后续...