全网都在扒的小米MiMo团队,几乎被“北大学子”承包了_模型_罗福莉_核心
henry 梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI
小米MiMo团队中,每天Agent对话次数少于100次的,就离职吧。
小米MiMo团队中,每天Agent对话次数少于100次的,就离职吧。
前脚,小米MiMo-V2-Pro模型刚登上OpenRouter调用量榜单第一。
后脚,罗福莉就发文分享了自己对于团队管理的思考。
热度几乎无缝衔接,网友们的目光也纷纷从模型本身转到 小米MiMo团队身上。
满打满算,从发布首个推理大模型MiMo-7B到现在不到的一年时间,MiMo的能力曲线却呈现出明显陡升——
短短时间内已冲到 全球一线梯队。
相比之下,同样花重金组建的Meta超级智能实验室,近期却频频跳票,被爆模型性能远不如早前发布的前沿模型。
于是,不少人开始好奇:
小米MiMo,究竟是一支怎样的团队,竟能在几个月时间打造出让全球关注的模型?
众所周知,大模型开发向来是集团军作战,model card的背后往往是多位作者的集体智慧。
而且据内部消息透露,小米的LLM团队在内部也相当神秘,但通过整理近半年的模型发布记录和论文,仍能捕捉到一些蛛丝马迹——
核心作者大多来自北京大学,其中甚至还有罗福莉本人的师弟。
更值得注意的是,北京大学也是罗福莉的老东家DeepSeek的策源地。
关于小米MiMo团队
小米MiMo团队近期的动作引发了外界广泛好奇,而这种关注与团队在产品侧和论文发表的「高节奏推进」密不可分。
随着多篇研究成果陆续曝光,小米MiMo团队 核心成员也浮出水面。
△MiMo-7B技术报告核心贡献者
肖邦骏(Bangjun Xiao),MiMo-V2-Flash 的首作,本科及博士均就读于北京大学。
博士生导师为北京大学人工智能研究院副院长黄罡教授。
他的研究方向聚焦于边缘计算和联邦学习,之前也短暂涉猎过计算机视觉和扩散模型。
Bingquan Xia,MiMo-V2-Flash 核心作者之一,中科院计算技术研究所2021届研究生。
马文晗(Wenhan Ma),自2025年9月起在北京大学计算机科学学院攻读博士,由穗志方教授指导。
△公众号:大信科
他的研究方向为 大语言模型,近期主要关注提升大语言模型的推理能力。
本科毕业于北京大学电子工程与计算机科学学院,专业为计算机科学与技术。
值得一提的是,穗志方教授正是罗福莉在北大的导师,而马文晗则是罗的同门师弟。
△公众号「北京大学」罗福莉(后排左二)与导师穗志方教授(前排右二)合影
朱大为(Dawei Zhu),北京大学三年级博士生,导师为李素建教授,本科毕业于北京大学电子工程与计算机科学学院。
研究方向为长上下文建模,他认为高效处理超长上下文是未来语言模型和多模态模型的关键能力,也对智能体(Agent)、对齐(Alignment)以及多模态模型的进展感兴趣。
此前,他参与的《paperbanana》项目曾引起较大关注,并被量子位关注。
董谨豪,中国人民大学信息学院/数据工程与知识工程教育部重点实验室讲师,同时也是小米大语言模型(LLM)核心团队技术顾问,主要负责与代码相关的LLM开发,包括预训练、强化学习及智能体方向。
他主导建立了人***–小米基础大语言模型联合重点实验室,并担任技术委员会成员。
他博士毕业于北京大学计算机科学学院,本科毕业于西安电子科技大学计算机科学与技术专业。
张海林,小米MiMo团队成员,专注于AI基础设施建设,为MiMo系列模型打造高效、可扩展且稳定的强化学习(RL)基础设施。
他2025年获得北京大学计算机科学博士学位,导师为崔斌教授,并曾获北京大学优秀博士论文奖。
研究重点包括大规模大语言模型(LLMs)、深度学习推荐模型(DLRMs)、信息检索(IR)及通用分布式计算。
此外,还有诸多核心作者,但公开信息较少,部分谷歌主页如下:
小米MiMo是一支怎样的团队
一支成立才一两年的团队,能一路冲到顶尖模型研发的前列,靠的绝不只是产品节奏和核心成员这么简单。
仔细梳理团队的背景,我们也会发现一个明显的共性——北大背景浓厚。
从核心成员到技术骨干,很多团队成员本科或博士均来自北京大学计算机学院。
一方面,北大的同门关系、导师体系和院系传承,使得小米在大模型工业界作为后起之秀,能够源源不断地吸纳新鲜血液;
另一方面,学生们也能迅速接触工业界,借助丰富的算力和***,将科研想法高效落地与迭代。
而在这个过程中,罗福莉则成为团队与北大学术背景之间的重要桥梁。
△图源:北京大学公众号
除了院校对于成员产品理念的影响外,小米MiMo团队的技术理念也深受小米企业 产品基因的驱动——
核心就是产品层面的「性价比」和公司一贯的「互联网生态」思维。
放到MiMo模型上,最直观的体现就是7B参数规模、开源策略以及端侧部署方向,也算是清楚地展现了小米的战略布局和生态思路。
所以回过头看,MiMo的成功并非偶然,而是多重因素叠加的结果:
北大科研背景的厚度、核心成员的技术经验,以及小米产品与工程的基因驱动,共同铸就了这支年轻团队的迅速崛起。
对了,还有一个颇有缘分的小细节值得一提——
不久前从阿里离职的通义实验室Qwen大模型负责人 林俊旸,正是罗福莉的师兄。
两人硕士阶段均在北京大学语从事自然语言处理相关学习研究,学术路径高度同源。
毕业后又先后加入阿里达摩院,在大模型研发上有着相近的技术底色与行业视野。
一个曾做Qwen,一个带MiMo。
两条国内头部模型线的关键人物,曾经在同一套学术和产业体系中成长出来,这层关系本身也让不少业内人多看了一眼。
参考链接:
[1]***s://arxiv.org/pdf/2505.07608
[2]***s://github***/CuteNPC
— 欢迎AI产品从业者共建 —
📚「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。返回搜狐,查看更多
同类文章排行
- 芯片暴涨之际,三星电子工会决定罢工_人工智能_半导体_斗争
- 315晚会 | AI“***”产业链遭曝光,通过虚***信息和大量发稿可操控AI大模型_业务_力擎_网络平台
- 王兴不想做老登_公司_组织_互联网
- 谁在布局全球出行的宏大叙事_Food_平台_企业
- 特朗普将召集微软谷歌等科技巨头签署承诺:自行承担数据中心电费_电价上涨_公司_美国
- 对话“养虾大师”傅盛:“龙虾”将带来技术平权,所有需要熟练操作电脑的岗位都会被替代_Peter_Agent_大厂
- 蔚来盈利了,含金量高不高?_毛利率_单车_代闪充
- 苹果CEO库克再次来华:我爱成都_全球_中国_春熙路
- 刘强东和雷军登上新闻联播,排面拉满_企业_小米_京东集团
- 国家安全部发布OpenClaw龙虾安全养殖手册_实际操作_权限_人工智能
最新资讯文章
- 黄仁勋,投了俄罗斯马云_Nebius_Yandex_部署
- 突然爆火!超多人抢着要,有人称赚了26万;专家:先冷静_OpenClaw_服务_模型
- 北约将活蟑螂的神经接入AI,化身无孔不入的赛博格侦察兵_生物_系统_昆虫
- 史无前例!三星薪资谈判破裂面临史上最大罢工:内存供货或遭重创_员工_超额利润_年薪
- 硅谷最贵华人放弃 14 亿天价 offer,上交校友庞若鸣提桶投奔 OpenAI_Meta_苹果_团队
- 魅族确认放弃手机业务:后续聚焦AI驱动软件产品_Flyme_品牌_座舱
- 抖音“分家”干美团_省省_流量_用户
- OpenClaw,给中国AI开辟了一个弯道超车的大市场_Kimi_用户_模型
- 20亿美元绑定特斯拉与xAI:马斯克的“数字员工”,到底算的是什么账?_公司_模型_擎天柱
- Claude全球宕机,机房爆炸!美财政部全面停用,恐遭英伟达断供_模型_瞬间_物体
- 日企行业霸主强势提价35%,又一个“超级周期”来了?_服务器_市场_产能
- 独家对话追觅AURORA手机负责人刘扬:全球80%利润被苹果吃掉,要和国产厂商一起突围_行业_市场_科技
- 租赁,撑起了具身智能的一片天_机器人_宇树_元远征
- 叮咚买菜换帅,CFO掌权_整合_梁昌霖_王松
- 伊朗战争,加速了这个赛道_建设_陆地上_卫星
- 黄仁勋罕见撰文!重新定义AI“五层架构”,万亿基建才刚开局_人工智能_应用_能源
- 赢疯了!英伟达日赚32亿,AI成摇钱树_芯片_业务_智能
- “AI龙虾”***都能养?工信部发布“六要六不要”建议!_OpenClaw_风险_部署
- 国产手机开年就遇冷,苹果笑到最后,这可怎么办?_同比_市场_行业
- 硅谷程序员,疯狂“投喂”中国大模型_Token_MiniMax_智谱





