如何预期DeepSeek传言中的R2新模型
2025-06-26 【 字体:大 中 小 】

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
信息平权
路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研究员Daya在2月初已经说过:RL还在早期,今年会看“显著进步”(significant progress)
其实在r1论文中也提到过:由于目前RL训练数据还很少,R1的下个版本会大幅提升。
也就是r1论文中的下图,以及论文所述:随着RL数据的增加,模型不仅解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力,比如“反思”、“探索不同方法”。这些能力不是人类设计,而是随着模型在RL环境中训练,自然涌现的。
粗浅的理解,现在不需要算法上的巨大创新,按照目前路线+更多算力+DS如此强的infra能力,基于目前的V3基座模型,依然可以取得r2/r3。当看到RL提升边际放缓,再基于新的基座V4,继续做RL,进一步推进推理模型提升。也就是下面这张图:(左脚踩右脚示意图)
而参考OpenAI的路线图,o3已经决定不发布完整模型,GPT-4.5也成了最后一个独立发布的基座模型,意味着GPT-5(混合模型)开始,越来越黑盒。说白了,以后无论是基座模型还是推理模型本身,都是“原料”而不是“最终产品”,CloseAI和Anthropic一定会雪藏。
但DeepSeek要做的,就是在别人继续闭源的时候,继续开源。r2应该对标的是o3完整版,而V4至少应该对标GPT-4.5,基于V4+RL的模型,应该对标是未来的所谓“GPT-5”。因此合理预期应该是V4可能会加入多模态能力,但r系列依然是推理模型。且这个过程中,所有的“原料”全部开源,不仅原料开源,按照这次代码五连发,连制造原材料的“配方”都直接开源。
这里面其实没有什么DeepSeek不知道的秘密,甚至在infra层面远超北美很多模型大厂。今天我们在讨论的:DeepSeek甚至可能比英伟达更懂如何使用GPU。而所谓Research上的创新,OpenAI o系列的灵感也来自于早已发表的“开源”paper,叠加自己的算力优势和工程探索实现。说到底没人全靠自己闭门造车,都受益于全世界“开源”研究或实践的喂养。
因此说回来,相比于r2,大家反而应该更期待V4,因为这打开了推理模型另一个level天花板,开辟的是另一条全新跑道。r2是时间表上确定的事情,而V4会是一个惊喜。这都会在今年发生。
(完)
文章内容有删减
新浪声明:此消息系转载自新浪合作媒体,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:凌辰
猜你喜欢
38—秋末悔城:金价顺势不改!非农或也无力改变
631
全国人大代表、中国银行董事长葛海蛟 中行要当好行动派, 对标一流金融企业
5226
商络电子:1月8日高管张全减持股份合计608万股
4063
千元机也该保护好自己!博主曝千元机将卷防水等级
1169
开源证券:游戏行业收入增速有望迎来向上拐点
8817
股票配资炒股平台:助你把握股市机遇,实现财富增值
1618
近观枫桥 沉浸式体验“揽收员”的一天
7746
香港财政司司长陈茂波回应首次置业人士按揭成数是否会放宽:正研究微调措施
5276
股票融资操作流程指南:一步步实现资金筹措
288
银川股票配资 ,博纳影业:累计回购约318万股
5787
贵州打造开放新“门户”,形成欧亚贸易中转集拼地
西太平洋银行:澳元美元本周可能还会继续上涨
一季报点评:新华中证云计算50ETF基金季度涨幅853%
兰建平:锻造竞争新优势
10只科创板股获融资净买入额超2000万元
中信证券:金属铬价格跳涨 强烈推荐板块投资机遇
新增4家 杭州发布2025年第四批 住房租赁企业风险名单
凯因科技终止不超3亿元定增 员工持股平台正拟减持
比亚迪(002594SZ)本年累计销量13809万辆,同比增长4698%
PX低估值弱预期与宏观情绪变化相互博弈
