日薪5500+元的「AI喷子」火了?这家公司找人“专职骂AI”:目标是把它骂崩溃、反复“翻车”_Memvid_记忆_问题
要是有一份工作,要求你一整天对着 AI “挑刺、找茬、刻意刁难”,而且还能拿到日薪800 美元(约合人民币 5521 元),你会不会觉得这像个玩笑?
最近,一家名为 Memvid 的初创公司发布了一则颇具争议的招聘:寻找一名“职业 AI 喷子”,用整整一天时间,对主流聊天机器人进行高强度压力测试,核心任务只有一个——把 AI 的“记忆缺陷”问题彻底暴露出来。
他们提供的报酬也很直接:100 美元一小时,一天 800 美元。
“AI 喷子”这份工作,本质是在做压力测试
过去几年,大模型的进步有目共睹。从代码生成到多轮对话,LLM 在“表达能力”上已经非常接近人类,在很多场景中甚至还表现得更高效。
但问题在于——它们擅长“说”,却不擅长“记”。
相信很多开发者都有类似体验:你刚刚在对话里设定了背景信息,甚至明确给出关键约束条件,但只要对话轮次一多,模型就开始:忘记前文设定、混淆上下文信息、输出自相矛盾的内容……
这种“短期失忆”,本质上并不是 Bug,而是当前大模型架构的天然限制。大模型并没有真正的长期记忆,它只是基于当前的输入窗口进行概率生成,而一旦信息被“挤出窗口”,就相当于彻底消失。
而 Memvid 的这次招聘,其实就是冲着这个老问题去的——AI 的记忆能力几乎是“残缺”的。招聘“职业 AI 喷子”的做法看似在玩梗,实际上 Memvid 是***对 AI 进行一次“压力测试”。
“大多数聊天机器人虽然乍看之下很聪明,但它们往往记不住你之前说过的话,无法理解对话的上下文,还让你不得不一遍又一遍地重复——这就是这份工作的棘手之处。
我们正在招聘一个人,通过整天对聊天机器人的记忆进行压力测试,公开揭露这个问题。”
据招聘页面介绍,这个岗位按小时计费(100 美元/小时),支持远程,为期一天,总报酬 800 美元。而简单来说,这名“职业 AI 喷子”的工作内容就是:让 AI 反复“翻车”。
不断要求 AI 记住某些信息
在后续对话中反复验证
记录 AI 出现混乱、遗忘、答非所问的情况
整理成完整的失败案例报告
某种程度上,这更像是一场公开的、极端条件下的 AI 可用性测试。值得一提的是,这一过程不仅需要手动记录,Memvid 还会全程录像(屏幕+摄像头),确保素材真实可靠。
除此之外,这个岗位还有点“反常识”的要求:不需要任何 AI 专业背景,但必须有丰富的“被技术坑过”的经历;能耐心把同样的问题对AI问四遍(生气也要坚持);对当今 AI 有强烈的不满情绪,最好是那种“一提 AI 就想吐槽”的人。
换句话说,至少对于这个岗位,Memvid 要找的不是专家,而是情绪到位的真实用户:
你将花上一整天的 8 个小时与顶尖 AI 聊天机器人互动——而你的唯一任务,就是毫不留情地指出它们有多令人失望。让 AI 记住一些事情,看着它们忘记,然后再问一次,记录下过程中的混乱。
请尽情地抱怨吧,然后,你就能拿到报酬了。
给 AI 加一个“***大脑”?
至于为什么要公开 AI 的“记忆问题”,Memvid 联合创始人兼 CEO Mohamed Omar 给出的解释很直接:
“一个真正好用的聊天机器人,核心能力就是——持续记住信息并保持对话连贯。”
如他所说,在各种实际应用中,AI 的“记忆能力”直接决定了它的上限:
在编程助手中,忘记上下文 → 代码质量下降
在企业知识库中,无法持续理解语境 → 检索失效
更严重的是,很多被称为“AI 幻觉”的问题,其实并不完全是模型“胡编”,而是因为上下文丢失后被迫重新“猜测”。也就是说,所谓“幻觉”,有一部分本质是“记忆失败”。
因此,Memvid 招聘“职业 AI 喷子”只是第一步,其真正目的是:通过公开 AI 的记忆问题,来推销自家的核心产品——一个“自进化的 AI 记忆层”。
简单来说,他们推出了一套基于文件的持久化存储方案,可跨对话保留上下文,能动态更新和优化记忆内容。它试图让 AI 不再是“一次性对话机器”,而是一个具备连续认知能力的系统。
此外,Memvid 还提供了两种使用方式:集成聊天机器人产品(Kora) 和面向开发者的工具接口。官方宣称,这套方案不仅能提升回答准确率,还能改善响应延迟和基础设施效率。
他们真的在找一个“AI 黑粉”
最后,回到 Memvid 花 800 美元找“AI 喷子”的操作,其目的显然有两层:一方面:确实指出了行业痛点;另一方面:也是一次非常聪明的营销——用“雇人骂 AI”这种极具传播力的方式,把技术问题变成公众话题,本身就很“互联网”。
据了解,Memvid 这个岗位的招聘将在几周内结束,他们明确表示,希望找到一个“真的不喜欢 AI 的人”。听起来有点讽刺,但背后的逻辑其实很清晰:
最真实的批评,往往来自最不买账的人。
与其让工程师在理想环境中测试模型,不如让一个“暴躁用户”在现实语境中不断挑战系统边界。
不少网友也关注到了这个消息,并引起了许多讨论:
“这看起来像个大型广告。他们很可能真的会雇一个人来做这份‘工作’,同时收集其他人的数据,然后再向你推销他们的产品。”
“算我一个,反正我已经在免费做这件事了!”
“一边折磨 AI,一边被拍摄和录音,肯定不会有好结果。”
那么,你对于这件事又有何看法呢?
【活动分享】"48 小时,与 50+ 位大厂技术决策者,共探 AI 落地真路径。"由 CSDN&奇点智能研究院联合举办的「全球机器学习技术大会」正式升级为「奇点智能技术大会」。2026 奇点智能技术大会将于 4 月 17-18 日在上海环球港凯悦酒店正式召开,大会聚焦大模型技术演进、智能体系统工程、OpenClaw 生态实践及 AI 行业落地等十二大专题板块,特邀来自BAT、京东、微软、小红书、美团等头部企业的 50+ 位技术决策者分享实战案例。旨在帮助技术管理者与一线 AI 落地人员规避选型风险、降低试错成本、获取可复用的工程方法论,真正实现 AI 技术的规模化落地与商业价值转化。这不仅是一场技术的盛宴,更是决策者把握 2026 AI 拐点的战略机会。
返回搜狐,查看更多
同类文章排行
- 请问买个nas,能够直接把游戏装进去吗?
- 如何评价B站峰哥亡命天涯直播中说面包就是比馒头好吃,中国古代不吃面包是因为贫穷,没有足够的柴火?
- 百寸电视买什么品牌的比较好?
- 吴彦祖疯狂接代言被猜缺钱,卖完英语课又代言黄酒,他是真的缺钱还是有其他考量?
- 苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
- 张伟丽可以打败什么级别的普通男性?
- 女生真正的完美身材是什么样子?
- 如何评价首个女性友好的编程语言HerCode?
- 如何评价任天堂新游戏《咚奇刚 蕉力全开》的专场直面会?
- count(*) count(1)哪个更快?
最新资讯文章
- 你在健身房发生过什么有趣的事情?
- 有没有一个特别好用的Linux系统?
- 网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
- 大海捞针还捞着了是一种什么样的体验?
- 为什么Dreamwe***er,FrontPage会被淘汰?
- Flutter 为什么没有一款好用的UI框架?
- 为什么男生都不喜欢173身高的女生啊?
- 什么时候你意识到做技术永无出路?
- 吴柳芳的真实水平如何?
- 为什么 IPv6 突然不火了?
- “哨兵模式”涉嫌泄密,你支持封杀特斯拉吗?
- 如何看待多地开展查摆年轻干部玩心重、混日子、说话随意、口大气粗等问题的行动?
- 如何评价“寡姐”斯嘉丽·约翰逊的身材?
- 匿名关了,大家实名说说你最近的烦恼?
- 阿里网盘为什么没有动静了?
- 伊朗发布「霍拉姆沙赫尔-4」导弹发射画面,被认为是伊朗破坏力最强导弹,其威力有多大?
- 如何评价高圆圆的身材算是美女类型的吗?
- golang 与rust 在服务器程序领域相比较,各有什么优劣势?
- 《西西里美丽传说》女主角,在当时打扮这么高调,不觉得带给自己很多不便吗?如何理解她的心态?
- 为什么开发一个 AI Agent 看似容易,但真正让它「好用」却如此困难?技术瓶颈主要在哪里?





