Claude会「做梦」了,梦里还在卷_Agents_记忆_工作
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
Claude开始做梦了。
人有时候白天想不通的事,睡一觉起来就突然明白了。
现在,Claude也学会了这招。Anthropic旗下Claude Managed Agents,上线了一项新功能,Dreaming——
让AI在工作间隙“睡觉”反思,清理记忆、总结规律、甚至自我升级。
说白了,就是AI的睡眠整理术。
Claude Code泄露源码里的Dreaming函数,现在终于知道是啥了(doge)。
Claude的「梦」,到底在做什么
咱和AI聊天的时候,每次对话它都会往记忆库里塞内容,时间长了,记忆库就变成了杂货铺。
重复的、过时的、没用的全堆在一起,AI自己都分不清该用哪个。
结果就是AI越来越慢、越来越不准。
Claude这次推出的Dreaming,就是要解决这个问题。
它是一段在对话间隙悄悄运行的异步任务,而且是跨智能体集体反思。
Dreaming会自动读取记忆库和最多100条历史会话,然后开始干三件事:
第一,合并重复,清理噪音。
把大同小异的记忆条目合并,删掉记忆库里无用的冗余信息。
第二,替换旧内容,更新知识。
第三,交叉分析,挖掘规律。
单个Agent看自己的经历看不出啥,但把多个Agent的历史放在一起对照,就能挖出单AI发现不了的隐藏模式。
比如反复出现的错误、多个Agent最终收敛的最优工作流、整个团队统一的偏好习惯。
Dreaming的设计也比较安全可控,它不修改原始记忆数据,所有整理、优化后的结果,都会输出到一个全新的记忆库。
也就是说,你对“梦境”不满意直接删掉这个新库就行,也不会影响原有数据。
Anthropic官方是这么说的:
Memory是工作时当场记住学到的东西;
Dreaming是工作间隙想明白这些经验意味着什么。
一个是即时学习,一个是深度反思,这和人类睡觉时,大脑自动整理白天记忆、沉淀经验、强化技能的逻辑几乎一样。
目前Dreaming还处于研究预览阶段,但也有公司已经尝鲜了。
法律科技公司Harvey接入Dreaming后,表示其长文法律文书起草的完成率涨了大约6倍;写作工具Spiral用Dreaming记住用户的个人风格偏好,配合多Agent协作,内容越写越对味。
三件套齐发
当然了,这次Claude Managed Agents更新,也不只是做梦。
在Dreaming之外,还有Outcomes、多智能体编排功能,这两个已经进入了公开测试阶段。
Outcomes可以看成是AI的自我质检员。
思路很简单:你先写一份评分标准,AI干完活后,一个独立的Grader Agent在隔离的上下文窗口里对着标准打分。
这个打分AI不受执行AI的干扰,不达标就指出问题,执行AI会自动修改,直到合格。
内部测试数据显示,Outcomes能让任务成功率最高提升10个百分点,docx文件生成质量提升8.4%,pptx提升10.1%,对细节要求高、主观标准强的任务,效果尤其明显。
多智能体编排则是让AI组团干活,一个Lead Agent当队长,把复杂任务拆成几块,分给不同的Specialist Agent并行处理。
每个Specialist可以是不同的模型、不同的prompt、不同的工具集,上下文互相隔离但共享文件系统。
Lead Agent可以随时找之前调过的Agent继续聊,对方还记得上次做了什么。
Netflix已经实践过,平台工程团队用它并行分析几百个build的日志,多个Agent各扫各的批次,最后只浮出反复出现的问题模式,一次性噪音全被过滤掉了。
这三个功能合在一起,其实解决的是同一件事——
让AI不用人盯着,也能独立完成复杂工作。
再加上和SpaceX合作拿到Colossus 1数据中心全部算力***、Pro和Max用户的Claude Code调用限额翻倍……也能看出Anthropic正在搭建的是一整套AI自主工作的基础设施。
创始人Dario Amodei还在Code with Claude大会上放了个预测:
首家由一人+AI运营、估值达到10亿美金的公司,将在2026年诞生。
未来一个人做成10亿美金公司不再是梦,或许这个10亿美金公司,得先从Claude做个好梦开始…
参考链接:
[2]***s://claude***/blog/new-in-claude-managed-agents
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完—
5月20日,我们将在北京金茂万丽酒店举办一年一度的中国AIGC产业峰会。
首波嘉宾阵容已公布!昆仑万维方汉、智谱吴玮杰、EverMind邓亚峰、风行在线易正朝、百度秒哒朱广翔、Fusion Fund张璐、香港大学黄超、MarsW***e冯雷
请你和我们一起,不再只是讨论AI的未来,而是现在就用起来。👉 返回搜狐,查看更多
同类文章排行
- 韩国作为发达国家,到底发达在哪?
- 都说乱世买黄金,现在算是乱世吗?
- 有哪些长得很无害,实际有毒的植物?
- 为什么几乎没人用电视屏幕连主机或者笔记本当显示器?
- 超小团队选择Django还是Flask?
- MacOS真的比Windows流畅吗?
- nodejs适合作为后端主要技术栈吗?
- Ps原文件扩大导致打开和导出图片太慢怎么办?
- 请问27寸4K显示器哪个好呀?
- 如何评价上海理工大学 C语言考试,老师不认识vscode 说是切屏***?
最新资讯文章
- 为什么都认为无GC语言一定会比有GC语言要快?
- 你见过最漂亮的女生长什么样?
- Caddy 和 Nginx 比有哪些优点和缺点?
- 骑自行车会花费多少钱?
- 为什么光纤目前取代不了网线?
- 为什么有的女生喜欢穿紧身牛仔裤?
- 电脑为什么只能识别固态硬盘而识别不了机械硬盘?
- 你捡过最大的漏是什么?
- 2025 年还能等得到 LCD 屏的旗舰机吗?
- 作为一个服务器,node.js 是性能最高的吗?
- 为什么韩国的热辣舞团无法征服中国的男性市场??
- 买到烂尾楼到底该有多绝望?
- 如何看待 2025 浙江高考杭州二中高分段被镇海宁海学军等校「碾压」?
- 为什么微软出的软件都那么巨大?
- NAS噪音太大,大家都吧NAS放置到哪了?
- 开战斗机从上海到北京要多久,那是一种什么样的体验?
- 怎么看待三十而已里说的养鱼让人玩物丧志,养鱼是魔鬼,是黑洞,养鱼毁三代鱼缸毁一生的话?
- 未来几年,市场对 AI 人才的需求会集中在哪几个方向?
- 如何评价 Windows 11 的 UI ?
- 如何评价“寡姐”斯嘉丽·约翰逊的身材?





