老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!_Nemo_标准单元_逻辑
新智元报道
编辑:Aeneas
【新智元导读】8人团队干10个月,AI只需一夜!英伟达祭出「造芯」神技:芯片设计效率狂飙百倍,非人类直觉的设计方案惊呆工程师。硅基生命开始自进化,人类正退居二线?进来看黄仁勋的秘密武器。
就在今天,这条消息全网刷屏了。
英伟达用AI设计GPU,原本需要8名资深工程师10个月才能完成的任务,一夜就完成了!
在刚刚过去的英伟达GTC大会上,首席科学家Bill Dally与谷歌首席科学家Jeff Dean的一场巅峰对话,揭露了令人震惊的这个事实。
现在,这个Youtube演讲已经有上万人观看,受到网友们的盛赞。
在半导体行业的历史长河中,摩尔定律曾是不可逾越的真理,但随着物理极限的逼近,研发一款旗舰GPU的复杂程度已呈指数级增长。
但现在,英伟达的AI造芯神技,几乎让人类工程师彻底退居二线了?
从「80个人月」到「一块GPU的一夜」
在传统芯片设计流程中,标准单元库(Standard Cell Library)的迁移是一项极度枯燥且耗时的重体力活。
每当台积电或三星推出新的半导体工艺(如从5nm跨越到3nm),英伟达必须将其包含约2500至3000个单元的基础库重新适配新工艺。
Bill Dally透露,过去这项任务需要一个由8名资深工程师组成的团队,连续奋斗10个月才能完成,总计耗费80个人月的人力成本。
但在AI介入后,这一切被彻底颠覆了!
现在,英伟达开发了一款基于强化学习的工具——NB-Cell。只需将需求输入系统,一块GPU在一夜之间即可完成全部迁移工作。
在这个过程中,NB-Cell通过不断的试错和自我优化,在极短时间内探索数以亿计的设计排列组合。
令人震惊的是,AI生成的单元在尺寸(Area)、功耗(Power)和延迟(Delay)等核心指标上,不仅达到了人类水平,甚至在某些案例中优于人类的手工设计。
这种「隔夜交付」的能力,意味着英伟达可以比竞争对手更早地跑通新工艺,从而在硬件竞赛中始终保持身位领先。
AI在芯片设计中的具体应用层次
逻辑重塑:Prefix RL与「非人类直觉」的布局
如果说NB-Cell解决的是重复性劳动,那么Prefix RL则展示了AI在复杂逻辑设计上的创造力。
在芯片的算术逻辑单元(ALU)中,进位前瞻链(Carry Lookahead Chain)的放置是一个研究了几十年的经典难题。
人类工程师凭借经验和直觉进行布局,往往会达到一个性能瓶颈。
但Prefix RL系统给出了一份完全不同的答案。Dally形容,AI生成的布局是「人类永远无法想到的怪异设计」。
这些设计违背了传统电子工程的审美,但在性能表现上,却比人类最优设计提升了约20%到30%。
这标志着一个转折点:AI不再仅仅是人类的助手,它正在突破人类认知的边界,去寻找那些隐藏在数百万维空间中的「最优解」。
硅基导师Chip Nemo,让初级工程师「原地升级」
在英伟达内部,人力***的错配曾是一个很大的隐痛:资深设计师往往需要花费大量时间指导新人,解释某个特定硬件模块(RTL)是如何工作的。
为了释放核心生产力,英伟达开发了内部大语言模型——Chip Nemo和Bug Nemo。
不同于市面上的通用LLM,这些模型基于英伟达数十年积累的专有架构文档、RTL代码和硬件规格进行微调。经过私有化训练,它们是「最懂英伟达GPU」的专家。
初级工程师遇到复杂的模块设计不再需要去打扰忙碌的高级工程师,而是直接询问Chip Nemo。它能像一位极具耐心的导师,条分缕析地解释GPU的工作原理。
Bug Nemo则负责汇总错误报告,自动将Bug分配给最合适的工程师或模块,极大地缩短了芯片验证这一「长跑阶段」的时间。
AI真的能完全自主「造芯」吗?
尽管效率提升了百倍,但Bill Dally在对话中依然保持了极其清醒的克制。
他明确指出,完全端到端的自动化芯片设计(即只需说一句「给我设计一个新GPU」,AI就吐出完整图纸)距离实现还有「很长的路要走」。
目前,AI扮演的角色更像是「增强设计(Augmented Design)」,而非自主造芯。
其中有三大关键限制:
高层级架构决策仍依赖人类专家。
创造性电路设计和复杂逻辑结构仍需人工主导。
设计验证仍是整个流程中最长的「长杆」,AI只能辅助加速,无法完全闭环
也就是说,框架设定的部分,比如顶层的逻辑架构、跨模块的协调以及关键的决策,依然牢牢掌握在人类手中。
另外,虽然AI可以加速验证,但最终的模拟仿真和实际实验依然必不可少,以确保芯片在物理世界中万无一失。
英伟达的实践表明,AI并非淘汰工程师,而是重构工程师的工作方式。
初级工程师需要通过Chip Nemo自主学习复杂模块的工作原理,减少对资深工程师的打断。
资深工程师能从重复性任务中解放,专注于更高价值的创新和决策。
在整体流程上,AI负责大规模搜索、优化、验证,人类负责目标设定、约束定义、创意引导。
只是一种「人类设定框架 + AI极速执行」的协同模式。
而Dally构想的未来,是一个「多智能体(Multi-agent)」模型,不同的专业AI系统处理不同的设计环节,就像现在的各职能团队一样协作。
长期目标仍是端到端自动化设计,但需要克服验证、接口协商、动态调整等难题。
目前的进展已经让英伟达能够 更快地迭代下一代硬件,成为维持摩尔定律的重要支撑。
人类工程师,还不能被替代
当8名工程师10个月的工作被一块GPU的一夜取代时,我们不得不直面一个残酷的现实:平庸的体力型工程劳动正在迅速贬值。
英伟达正在构筑一道由AI驱动的技术壁垒。当竞争对手还在通过增加人力来追赶进度时,英伟达已经进入了「AI设计AI,AI优化AI」的自循环体系。
这种效率上的降维打击,正是其能够一年一更旗舰显卡的核心密码。
对于芯片工程师而言,这既是危机也是机遇。人类正从繁琐的布线、搬运单元中解脱出来,被迫向更高层级的架构思考、更复杂的创造性决策进化。
在硅基造芯的新纪元。在这里,计算不再仅仅是芯片的目的,计算已成为芯片诞生的源头。
参考资料:
***s://***.tomshardware***/tech-industry/artificial-intelligence/nvidia-says-ai-cuts-10-month-eight-engineer-gpu-design-task-to-overnight-job-company-is-still-a-long-way-from-ai-designing-chips-without-human-input
秒追ASI返回搜狐,查看更多
同类文章排行
- 法布雷加斯陨落的核心原因是什么?
- 我应该设置多少kb才能让他不能玩游戏?
- 2025 年 6 月,Rust 在 GUI 方面有何大的进展? 你最看好哪个框架?
- 现实中的父女关系是怎样的?
- 中国为什么要每隔10年搞一次大阅兵?
- 为什么程序员独爱用Mac进行编程?
- 为什么前端这么多看过vue源码而看过react源码的少呢?
- Chrome 浏览器设计的神细节有哪些?
- 各双拼输入方案之间有明显的优劣之分吗?
- 如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
最新资讯文章
- 56 岁白岩松踢球摔倒久不能起,他目前情况如何?踢球时需要注意什么?
- 有一个***约你出去,你会去吗?
- 真的没有人觉得2k是一个很尴尬的分辨率吗?
- Web 前端怎样入门?
- 体制内女老师,被关系户欺负,大吼——"不干就给老子滚",我该怎么办?
- 据说go和c#的开发者都说自己比较节省内存,你们认为呢?
- 为什么中国电信的iptv一定要有网线连接!?
- 新手想要打好篮球,主要练运球还是投篮?
- 苹果 macOS Tahoe 26 新 Finder 图标引争议,其争议点主要集中在哪些方面?
- 2025 江西高考本科线历史类 486 分,物理类 429 分较去年降 19 分,怎样看待江西分数线?
- 迷茫。J***a还是.net?
- 如果SSD硬盘闲置很多年,内部数据会不会丢失?
- iOS 26 的新设计被吐槽丑,苹果在设计更新时考虑了哪些因素?你对这一设计都有哪些评价?
- 不住酒店可以去哪过夜?
- 为什么中国电信的iptv一定要有网线连接!?
- 网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
- 如何看待网上说的:凡是有阿里、华为经历的一律不要?
- 战鹰真名叫什么?
- 有人说24GB和48GB内存容量是新一代电脑平台最均衡的方案,真的是这样吗?电脑内存应该如何选?
- 程序员看剧的时候,如果看到有敲代码页面,会暂停看代码吗?





