林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理
3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。
文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。
林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。
针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。
来源:凤凰网科技返回搜狐,查看更多
同类文章排行
- 作为一个服务器,node.js 是性能最高的吗?
- 鱼缸有哪些寿命比较长的草推荐呢?
- 《权力的游戏》里面最美的是谁?
- 为什么我感觉Gemini 2.5 Pro模型有一种异常的强?
- 2025年,歼16与美军机50分钟缠斗,为什么知乎上没有任何消息?
- 60×40×50 的鱼缸,请问有什么样的过滤器好用呢?
- 老的所谓的洋垃圾至强CPU和现在的民用CPU作为个人服务器哪个更有优势?
- 你是怎么发现亲戚开始见不得你好的?
- 为什么琼恩·雪诺给人一种智商不高的感觉?
- 以色列为什么突然敢打伊朗了?不怕被报复?
最新资讯文章
- 有没有免费的语音转文字的软件?
- golang总体上有什么缺陷?
- 穿瑜伽裤爬山的女生会不会害羞?
- 为什么战斗机都很好看?
- ***拍大尺度片子时摄影师不会看光吗?
- Vue性能优于React,那为什么还不用Vue?
- 女生被踢裆也会很疼吗?
- 丰田将中国市场决策权交给中方,是在华战略重大调整,这会不会意味着未来中国市场的丰田车“中味”十足了?
- 浏览器为什么要分那么多种,用一种不会很快捷吗?
- 如何设计一个属于自己又简洁的个人logo?
- 大环境什么时候可以好?
- duckdb的性能如何?
- snipaste怎么安装?
- 阿里云为什么没有一年的免费云服务?
- 刘强东称「京东外卖很快就会出来一个跟美团完全不同的商业模式」,如何看待此回应?
- 为什么现在东南亚一片稳定,而中东还是一锅乱粥??
- 现在还有人一直坚持使用 Eclipse,不使用 IntelliJ IDEA 吗?
- 广东省肇庆市怀集县洪水后,赵一鸣零食店被哄抢,物资和收银机里面的几千块钱被哄抢一空,如何评价?
- 组nas一定要TDP低的cpu吗?
- 北京暴雨故宫再现「千龙吐水」奇观,为什么故宫古老排水系统历经六百年仍能正常运作?有哪些特别之处?





