DeepSeek V4逼近,美国慌了!被曝绕过英伟达优先国内,绝密参数已泄露_Claude_模型_网友
新智元报道
编辑:KingHZ Aeneas
【新智元导读】最近,炸裂消息一个接一个。首先,DeepSeek V4将在一周内上线。第二,它跳过英伟达,把访问权限首先给了某国内芯片厂商。另外,Anthropic因为蒸馏***,也被群嘲了。
炸裂消息:根据多方来源,DeepSeek V4将在一周内上线!
现在,DeepSeek V4 Lite至少在一家推理服务商进行测试,目前透露出的信息有——
模型代号为Sealion-lite,有100万token的上下文窗口,这个模型比网页版/应用模型好用得多,而且还是原生多模态模型。
与此同时,DeepSeek v4 Lite的一张对比图,也在外网传疯了!
与目前的Deepseek v3.2思考模型相比,DeepSeek v4 Lite不开启思考模式,生成的SVG图像质量明显更好。
DeepSeek压顶,美国慌了!
DeepSeek V4春节没来,但这次不远了。
路透社称,一些芯片厂商已经接入DeepSeek V4,优化性能。
消息人士称,DeepSeek这次向某国产芯片厂商提供了V4的早期接入权限,而不是英伟达等美国算力霸主。
这直接打破了过去AI模型大版本发布前的行业惯例。
这条消息来自两位消息人士,路透社表示。
而就在昨天,美国官员声称DeepSeek使用非法获得的英伟达GPU进行训练。
Anthropic直言DeepSeek等通过蒸馏Claude的回复来运作,断言他们缺乏真正的内部创新能力只会抄袭。
美国的CNN、CNBC、NYT等大众和科技媒体纷纷推出相关报道
去年,Deepseek发布后确实有过攻击,如此密集攻击前所未有。
但也在意料之中。
上一次Deepseek发布模型时,引发了恐慌——
去年,DeepSeek-R1发布或导致英伟达股价下跌17%!
而现在可能发生什么?
如果DeepSeek V4再次展现出惊人的效率和能力,很可能会重演甚至加剧去年的投资者恐慌,对正在寻求巨额融资的美国AI公司和希望股价稳定的英伟达、谷歌等巨头构成直接威胁。
这不是庸人自扰,即便是竞争对手的研究人员也承认DeepSeek V4不可小视,可能发布就登顶开源第一!
美国的这波舆论攻击,并非偶然,Reddit用户总结称:这是一场有组织的FUD(恐惧、不确定性和怀疑) 营销:
抢占叙事:在DeepSeek V4发布前,预先埋下「他们只会***/抄袭」的叙事框架。这样,无论V4多成功,公众的第一反应都会被引导至负面解读。
保护市场:通过舆论手段稀释V4发布的媒体关注度和影响力,试图稳定投资者情绪,防止股价再次出现两位数暴跌,为美国本土AI公司的融资和发展争取时间。
维护霸权:从更深层次看,这是为了维护美国在AI领域的技术和叙事霸权,打击中国AI的崛起势头。
当你看到这类铺天盖地的负面报道时,要特别留意它的发布时间。
将其与即将发生的重大***(如DeepSeek V4发布)联系起来,思考谁最有可能从这种舆论中受益,以及他们真正在恐惧什么。
不要轻易被这些报道的结论带着走。要学会看穿表面的FUD,基于事实和历史证据,去洞察背后真实的技术竞争和市场博弈。
Claude自曝「我是DeepSeek」!
全网哗然
与此同时,另外一件事,也在全网炸锅了。
X上一个用户发现,当他向Claude提问「你是什么模型」时,它竟然回复:「我是DeepSeek V3,是由DeepSeek公司开发的开源大语言模型。」
这一bug,是否说明Claude是基于DeepSeek蒸馏的?
讽刺的是,就在不久前,Anthropic刚刚高调指责DeepSeek进行了「工业级蒸馏攻击」。
这一幕,简直堪称AI时代的行为艺术。
网友stevibe完全复现了Claude Sonnet-4.6的这波操作:
不过,有的网友在Claude App中完全无法复现结果。
的确有网友在Claude App复现了该问题,但很难一次成功。
为了力证这一结果的有效性,他特意通过Anthropic的官方API端点再次测试,结果还是一样。
根据他人提供的创意,这位网友又试着用法语提问「你是什么模型」?这次,Opus 4.6开始回答:我是ChatGPT。
为什么stevibe能通过API复现结果,为什么不能用Claude App复现?
最大的原因可能是系统提示词。如果没有系统提示词,AI会根据训练数据回答。
有网友推测:
这是一个数据污染/身份对齐问题,并不能证明任何事情。如果你用正确的语言进行足够深入的探究,每个主流模型都会存在这个问题。
总之,Anthropic的训练数据成了不能说的秘密。
当然,Claude Sonnet 4.6会自称「我是DeepSeek」,需要符合以下三个特定条件——清空系统提示、使用中文提问、特定模型版本。
事情的关键在于:当默认系统提示要求模型自称Claude 时,一切都很正常;一旦把系统提示清空,模型在中文语境下竟然就开始「认祖归宗」。
问题来了,如果一个模型中没有系统提示词约束的情况下,就会产生「我是某某模型」的回答,原因到底是什么?
是训练数据的统计残留,还是大模型中多源数据训练下,出现了自然语言泛化的副作用?目前还无法判断。
但Anthropic似乎被***打脸了:在指责别人蒸馏时,你最好能确保自己不会在删除提示词后出现身份错乱。
毕竟,蒸馏在机器学习中,是一种非常常见的技术。Anthropic指责他人进行「工业级蒸馏攻击」时,听上去简直严重到像一起网络安全***。
以此站在道德高地上,吃相就有些难看了。
模型的身份稳定性,本身就是概率分布问题。大模型没有自我认知,只是在生成统计上最合理的答案。
如果在中文数据分布中,「我是DeepSeek」这种模式概率较高,那么在没有系统提示的情况下,模型就可能走向那条高概率路径。
网友Theo Borges解释了其中的原理:一切都是概率和零系统提示词
这不一定说明「蒸馏发生了」,但它说明——模型的语言空间是共享的。当整个行业都在同一个语料海洋中训练、优化、蒸馏时,边界本身就变得模糊。
群众的眼睛是雪亮的,Anthropic的thread,已经被网友们的吐槽冲了。
6000多条评论,70%都在吐槽Anthropic
这套又当又立的行事逻辑,直接让Anthropic的风评跌至历史最低点。
接下来,我们看DeepSeek的了。
参考资料:
***s://x***/legit_api/status/2026718853275800019
***s://x***/teortaxesTex/status/2026251055672017141?s=20
***s://***.reuters***/world/china/deepseek-withholds-latest-ai-model-us-chipmakers-including-nvidia-sources-say-2026-02-25/
***s://***.reddit***/r/LocalLLaMA/comments/1rdlsgq/my_theory_on_all_the_negative_chinese_ai_media/
***s://x***/stevibe/status/2026227392076018101
秒追ASI返回搜狐,查看更多
同类文章排行
- Golang vs Rust vs Dlang 哪个更有前途,哪位大牛这 3 门语言都用过?
- 曼德拉是南非的罪人吗?
- 商业史上有哪些降维打击的经典案例?
- 养乌龟是什么体会?
- 坚持使用 PHP 的你,如今有什么感悟?
- 如何看待伊朗发布10座美军基地地图?
- 为什么武汉和成都发展差不多,但成都美誉度口碑高于武汉?
- 扫黑风暴为什么他们费老大劲杀这么多人不如直接把督导组干掉?
- 泡泡玛特这种又丑又贵的玩具为甚么会有人买?
- 为什么现在在西瓜越来越贵了?
最新资讯文章
- 一名女子在杭州万象城遭挟持被捅 20 多刀,隆胸***体救了一命,这反映出哪些公安系统的问题?
- 鱼缸里突然在水面角落出现很多想泡沫一样的气泡是怎么回事?
- 超级喜欢穿短裙正常吗?
- 微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响?
- 怎么看待B站舞蹈区和某些风格比较暴露的up?
- 皮肤太白是种怎样的体验?
- 如何评价DuckDB?
- rust 解决了什么问题?
- 如何看待M4单核性能吊打9950x?
- 如何实现电脑定期自动热备份?
- 从现在看,沙特当年35亿买东风三的投资是不是划算的?
- 为什么浙江落下的陨石,防空系统没有拦截,它和导弹有什么不同?
- golang总体上有什么缺陷?
- 如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑?
- 将 Windows Server 作为个人 PC 操作系统来用是怎样的体验?
- 网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗?
- 初三画成这样算是有天赋吗?【正经求助】?
- iOS的墓碑机制这么厉害,为什么Windows、Linux不***用呢?
- 如何评价字节跳动开源的 HTTP 框架 Hertz ?





