当前位置:首页 > Deepseek最新资讯 > 正文内容

百度发布两款大模型,对标DeepSeek、聚焦多模态

3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。

今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半。

百度曾是国内最早一批发布大模型的厂商之一,在过去两年时间里,大模型领域国内大模型赛道竞争异常激烈,DeepSeek-R1以颠覆性姿态“杀”了进来,其开源+低价策略引发的"鲇鱼效应",迫使全球大模型厂商重新校准竞争维度。第一财经记者了解到,李彦宏在今年内部讲话中透露,百度将于下半年发布文心大模型的5.0版本,并加大AI应用商业化实践。接下来,百度还将在6月30日正式将文心大模型开源。

今日上午记者体验了百度原生多模态大模型文心4.5,用户可上传包括文档、图片、音频、视频的文件,让AI进行解读。记者上传了一张《哪吒》电影视频截图,就此询问文心4.5,但AI没能给出正确答案,而是称这是来自迪士尼动画电影《公主与青蛙》中的场景。不过在逻辑测试中,AI能准确识别脑筋急转弯的陷阱并给出回答,针对数学物理题、益智问答基本能给出准确回答。

文心大模型X1为深度思考模型,运用到的关键技术包括递进式强化学习、基于思维链和行动链的端到端训练、多元统一的奖励系统等,百度称在性能上对标DeepSeek-R1,具备“长思维链”。记者体验看到,除了联网搜索外,增加了多模态能力和多工具调用,能理解和生成图片,调用工具生成代码、图表等。目前DeepSeek-R1支持上传的附件仅识别文字。

在文本创作上,过去文心4.0的观点较为“端水”,4.5擅长写“锐评”;在图片理解方面,当记者再次拿出《哪吒》电影截图考考X1时,AI给出的答案是《快乐池塘》。记者在进一步的对话中告诉X1答错了,这是电影《哪吒》 场景后,AI表示感谢指正,经过分析后表示提供的图片场景确实出自电影《哪吒》。事实上AI每次错误都在拓宽技术边界,它的视觉理解也将在"犯错-修正"的螺旋中不断改进。

随着人工智能技术从基础问答向复杂推理跃迁,除了百度外,近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”,试图让AI突破表层语义匹配,建立因果推理、价值判断及跨领域知识迁移能力。这种竞争不仅体现在模型性能上,各家更通过云计算捆绑、行业解决方案等生态卡位争夺B端市场。

(本文来自第一财经)


“百度发布两款大模型,对标DeepSeek、聚焦多模态” 的相关文章

网宿旗下爱捷云DeepSeek智算一体机发布

网宿旗下爱捷云DeepSeek智算一体机发布

每经AI快讯,近日,网宿科技旗下子公司爱捷云依托海量的智能算力资源、自研领先的全局算力调度平台和丰富的云平台运营等核心能力,正式推出爱捷云DeepSeek智算一体机,为企业提供开箱即用、高性能、安全可...

普通人如何逃离DeepSeek幻觉陷阱

普通人如何逃离DeepSeek幻觉陷阱

DeepSeek横空出世,我们和人工智能的关系也随之进入新时代。但对于许多人来说,与AI的蜜月期还没有结束,幻觉问题就不合时宜地来预警。近期一条“80后死亡率突破5.2%”的假新闻广为流传,据上海网络...

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

曾几何时,AI领域信奉“大力出奇迹”,随着DeepSeek横空出世,以“四两拨千斤”的创新路径,仅以数百万美元的训练成本就实现了Chat-GPT4的同等性能,同时参数量也仅为对手的几十分之一。这就是D...

“国民级应用”纷纷下场 DeepSeek开启AI新时代?

“国民级应用”纷纷下场 DeepSeek开启AI新时代?

刚刚过去的周末,人工智能大模型DeepSeek再次登上各大社交平台的热搜榜,同时出现的,还有“国民级应用”腾讯和百度的名字,引发业界和普通用户高度关注。15日晚间,腾讯宣布微信搜一搜正灰度测试接入De...

谷歌CEO评DeepSeek:我认为DeepSeek团队做得非常非常出色

谷歌CEO评DeepSeek:我认为DeepSeek团队做得非常非常出色

据凤凰卫视现场报道,北京时间2月12日,在迪拜举行的第12届世界政府峰会(WGS 2025)上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)与阿联酋人工智能部长奥马尔·苏丹·奥拉马(Omar...

腾讯云TI平台支持DeepSeek全系模型精调与推理

腾讯云TI平台支持DeepSeek全系模型精调与推理

36氪获悉,近日,DeepSeek全系列模型率先登陆腾讯云TI平台,并提供企业级精调与推理服务。腾讯云TI平台支持快速数据清洗、Prompt优化、灵活训练调度,并提供公有云和私有化部署,满足多样化业务...