大纲
Stanford MS&E 435(2026 年春季)由 Apoorv Agrawal 主讲,他是 Altimeter Capital 的投资人,早年在 Palantir 写过 Spark。每周一节课,邀请一位创始人或投资人客座,按查塔姆守则(Chatham House rules,发言可引但不可点名)进行——客座经常爆料,所以课堂内容比公开博客、访谈更新、更尖锐。课程主页:https://mse435.stanford.edu/
四周共享一条核心论点:
AI 价值链是倒置三角形——钱在底部(芯片、算力),不在顶部(应用)。云时代那种 V 字形(应用赚钱)至少要再过 10-15 年才有可能在 AI 重演。整门课就是在拆:这个三角形为什么不下沉、什么条件下才会下沉。
| 周 | 日期 | 主题 | 讲师 / 客座 | 状态 |
|---|---|---|---|---|
| 1 | 04/03 | 生成式 AI 经济学导论 | Apoorv Agrawal(独讲) | ✓ 已整理 |
| 2 | 04/10 | 芯片与 GPU 经济 | + Brad Gerstner (Altimeter) + Sunny Mudra (Groq) | ✓ 已整理 |
| 3 | 04/17 | AI 数据中心 | + Chase Lochmiller (Crusoe) | ✓ 已整理 |
| 4 | 04/24 | AI 应用栈 | + Ali Ghodsi (Databricks) | ✓ 已整理 |
每周一份课堂视频作为主源,再配 2-5 份阅读材料作辅源。
第 1 周 — 钱在 AI 的哪一层
AI 价值链是云栈的镜像:钱集中在底层芯片(NVIDIA 一家拿走 70%+),离终端用户最近的应用层反而赚得最少。这不是周期早期的过渡现象——Apoorv 的判断是这种格局可能持续 10-15 年甚至更久,因为 AI 和 SaaS 的经济学根本不同(边际成本不为零)。本周建立的”倒置三角形”是后 9 周的分析骨架。
1.1 课程定位与核心问题
Apoorv 开场点出两条主线:
- 盯紧超大规模云厂商(hyperscaler)的财报:每季度公开电话会议上,CEO 都会主动谈他们最大的赌注和担忧。他特别推荐养成这个习惯——上市公司 CEO 一年会主动告诉你四次他们最焦虑的问题
- 9 周客座阵容:从半导体、基础设施、能源、模型一路覆盖到应用和智能体。课堂遵守查塔姆守则,客座爆料不要传出去
- 课程目标:“5 年后再被问起这一轮 AI 超级周期(supercycle)你是否亲历,你应该能说亲历过”——这批学生有一半会创业、一半会投资 AI
1.2 倒置三角形:五层蛋糕的价值分布
Apoorv 借用 Jensen Huang 的”五层蛋糕”框架(能源 → 芯片 → 电力与互联 → 存储 → 上面跑的模型与应用),对比 AI 栈和云栈的根本差异:
| 维度 | 云栈(V 字形) | AI 栈(倒置三角) |
|---|---|---|
| 钱集中在 | 顶部(应用) | 底部(芯片) |
| 形态 | 上宽下窄 | 上窄下宽 |
| 当前盈利 | 应用毛利 80-90% | 应用毛利 0-30%,芯片约 75% |
| 时间锚点 | AWS 2004 年开建 → 2010 年第一个外部客户(Netflix)→ 2012 年 Amazon 自己迁过来,前后 8 年 | AI 还在建设期,远没到收割期 |
两年纵向对比(2024 → 2026):生态规模翻了 5 倍(900 亿 → 4350 亿美元),但价值链形态几乎没变——新增的约 3500 亿美元收入里有 75% 直接流向半导体层。应用层翻了十倍以上,却没撼动底部分配。
1.3 关键判断:AI 不是 SaaS
AI 不是软件——它没有”边际成本为零”这件事。用户多就要算力多,所以规模越大利润不会越高,token(模型计费单位)账单基本约等于收入。
这是 Apoorv 整个 9 周课的隐含理论底座。它直接解释了为什么应用层利润低、为什么注定要靠广告——SaaS 时代”软件吃世界”靠的是边际成本归零叠加 90% 毛利复利,但 AI 是每多一个用户就多烧一份 GPU。
学生提问环节,他给出更精细的拆解:
- Salesforce、Palantir 这类老牌厂商算不算应用层?算——它们购买模型推理的支出会被记到上层
- 是否存在时间错配?存在——芯片层建产能要 5-6 年,应用层收入是当下产生的,所以底部资本开支(CapEx)必然过冲,类似 2000 年代电信光纤过度建设(fiber overbuild)的早期镜像
- 什么时候翻转?他押注 10-15 年甚至更久——云用了大约 10 年完成这件事,AI 这一次他的直觉是会更久
两个翻转的催化剂(Apoorv 明确点名):
- 任一家超大规模云厂商的专用集成电路(ASIC,application-specific integrated circuit)计划——Google TPU、Meta MTIA、AWS Trainium、OpenAI 自研——出现爆款级成功,会触发全栈重定价
- 超大规模云厂商在财报里停止上调资本开支指引,意味着当前的均衡撑不住了
1.4 训练与推理:NVIDIA 内部最受关注的数字
学生问”训练推理的负载混合为什么不影响 NVIDIA”,Apoorv 给出业内最被追问的一组数字:
- NVIDIA 当前在网设备里,推理占 40%、训练占 60%(来自最近一次财报披露)
- 推理负载形态:脉冲式使用、全天有周期波动,连圣诞节都会跌
- 训练负载形态:可预测、利用率高、时间段较短
- 推理占比长期会继续上升,但没人能预测拐点时间
这条数据是后续几周——尤其是第 2 周 Sunny 那段讨论”NVIDIA 出货份额下降但收入仍占 50%+“——的根本依据。
1.5 消费 AI 三梯队和 ARPU 鸿沟
Apoorv 提出消费应用三梯队框架(按全球周活用户 WAU,weekly active users 分布):
| 梯队 | 周活规模 | 代表 | 用户依赖度 |
|---|---|---|---|
| 必备型工具(mandatory utility) | 20-30 亿 | WhatsApp、Chrome、YouTube | 没了活不了 |
| 社交型(靠网络效应) | 15-20 亿 | Instagram、TikTok、Facebook | 朋友在就在 |
| 细分型(niche) | 3-6 亿 | Spotify、Amazon、Twitter | 特定场景 |
当下定位:
- ChatGPT 刚跨过细分进入社交档,周活约 9 亿
- Gemini 还在细分档,周活约 2 亿
- Apoorv 自己的话:“作为投资人我当然希望 ChatGPT 成为必备型工具”——但它不是消息平台、不是收件箱、不是多巴胺刺激源,本质是主动查询工具。主动发问这件事,注定不可能覆盖全部 40 亿在线人口
每用户平均收入(ARPU,average revenue per user)的鸿沟比周活更刺眼:
| 公司 | 用户 | ARPU |
|---|---|---|
| Alphabet | 约 40 亿 | 约 $100/年 |
| Meta | 约 35 亿 | 约 $70/年 |
| OpenAI | 约 10 亿 | 约 $10/年 |
Apoorv 的判断很明确:要把 $10 拉到 $100,靠订阅远远不够,必须靠广告——对话式提问意图清晰、用户已登录、归因(attribution)链路短,这三点会让 AI 广告的千次展示成本(CPM,cost per mille)比 Google 传统广告更高。这是本课程最锋利的一条第一性原理预测。
1.6 与阅读材料的对照
5 篇辅读博客(Apoorv 自己 2024-2026 年的写作)基本覆盖了课堂论点:
- 《Economics of GenAI》(2024)——倒置三角形最初提出
- 《Two Years Later》(2026)——复盘形态不变,外加 5 家 ASIC 成熟度对比
- 《State of Consumer AI 1-3》——用周活、留存、使用时长三个维度支撑梯队论
- 课堂独有的判断:10-15 年翻转的时间预测、对必备型工具地位的不乐观、对广告路径的”第一性原理看好”——这些都是公开博客里没有明说的现场判断
第 2 周 — 芯片与 GPU 经济
Brad Gerstner 把镜头拉远到 2000 年量级的 GDP 增长曲线,将 AI 定性为”工业革命影响的 10 倍、速度的 10 倍”。Sunny Mudra(Groq 总裁)从内部视角讲:NVIDIA 真正的护城河不是 CUDA,而是高带宽存储(HBM)的买方垄断(monopsony)和对客户配额的控制。本周最反直觉的判断不是”NVIDIA 会下来”——而是”5 年后 NVIDIA 只占出货量的 10%,但收入仍占 50%+“。
2.1 Brad 的宏观框架:AI 是 10 倍速的工业革命
Brad Gerstner 开场不讲芯片,先放一张 2000 年长跨度的 GDP 曲线:
- 前 1800 年:曲线几乎水平,人类只在求生存,没有过剩生产力
- 1800-1900 年:工业革命爆发,GDP 翻倍所需的年限从世纪级降到几十年
- 当下:全球 GDP 每 25 年翻一倍
- 对 AI 的预测(引自 Demis Hassabis):影响是工业革命的 10 倍,速度也是 10 倍——10 年走完工业革命 100 年的路
落到投资视角:
- 科技占全球 GDP 的比例从 5% 上升到 13%
- 过去 10 年纳斯达克的每股收益(EPS,earnings per share)复合增长率 15%,非科技板块只有 6%——科技公司本来就复利更快,AI 会进一步加速
Brad 留给学生的金句:今天你必须借 AI 把自己升级成”半机械人”——不用不行。10 年前我看你的学校、看你工作的公司;今天我只看你能不能交付远超平均水平的价值。
2.2 NVIDIA 的真正护城河:HBM 买方垄断与客户配额
Sunny Mudra(Groq 总裁,原 Definitive Intelligence CEO,公司被 NVIDIA 收购后加入 Groq)从内部视角拆解 NVIDIA 的真护城河——不是 CUDA:
- 理论上 NVIDIA 一年能造 5000 万颗 GPU 裸片(die,与手机芯片同款工艺)
- 实际只造约 550 万颗
- 瓶颈不在芯片本身,而在 HBM(high bandwidth memory,高带宽存储)和中介层(interposer)封装
- NVIDIA 是 HBM 的买方垄断方——和卖方垄断(monopoly)相反,全市场只有它一家在大量买;HBM 厂利润率本来就高,没有扩产的动力
- 锁定 HBM 大单需要提前两年下订
超大规模云厂商自研芯片的真正动机不是性能、也不是成本,是对命运的掌控——不再让 NVIDIA 决定自己能拿到多少 GPU 配额。Sunny 直接点破常见误解:自研芯片的逻辑是不再被告知自己的配额上限,而不是为了更快。
2.3 五年芯片市场预测:营收主导和出货份额脱钩
Sunny 给出全场最具体的一组预测:
| 5 年后 | NVIDIA |
|---|---|
| 营收份额 | 仍 ≥ 50% |
| 出货量份额 | 可能只剩约 10% |
| 原因 | ”买 NVIDIA 不会有人被开除”——品牌溢价加上客户求稳愿付高毛利 |
| 底层变化 | 35-36 家集中客户的决策权越来越大,会更按业务需求选芯片 |
芯片业天然的护城河是时间:从设计到量产 3 年(执行完美才行),实际通常 4 年。只有 14% 的芯片做到首次流片成功(A0 silicon,first-pass silicon)。Groq 的三颗芯片都做到了 A0,把迭代节奏压到 一年一代——这是它的核心差异化。
至于新入局者想造芯片硬刚 NVIDIA:3 年起步已经追不上,太晚了。
2.4 速度是被严重低估的护城河
Sunny 用**消费品包装行业(CPG,consumer packaged goods)**做类比,说明速度才是真正的护城河:
- 这个行业里高利润品的共同特征是”作用速度”:香烟 > 嚼烟 > 软饮 > 水
- 生效越快,多巴胺关联越强,品牌价值越高
- 互联网同理:Google 和 Facebook 都押注速度,每提速 100 毫秒带来 8% 的转化率提升
延伸到 AI 推理:客户上来都问速度,但意识到算力短缺后立刻转问”能给我多少”——Sunny 坚信,速度才是真正的差异化。
由此得出的延伸结论:CUDA 的开发者锁定(lock-in)不是护城河——训练阶段有用,推理阶段无用。Groq 已有 220 万注册开发者,NVIDIA 声称有 600 万 CUDA 开发者——推理市场的这道墙在塌。
2.5 中美 AI 竞争:主场与客场
Sunny 给出第 1 周辅读完全没覆盖的一个原创框架:
- 主场:中国能赢自家——150 座核反应堆加上党的补贴运营,能效差也能撑得住
- 客场:盟友市场(韩国、日本、欧洲、印度)才是真正战场。一个电力规模只有 100MW 的国家不会为了 AI 再建核电站——这种地方,能效更高的芯片就是决定性优势
美国未来 2-3 年的客场窗口,决定能不能把盟友拉进美国 AI 阵营。
欧洲的能源解药:
- 挪威风能利用率 80%,风电翻 5 倍就能供整个美国的规模
- 与沙特做”数据使馆”(data embassy)安排——欧洲数据主权配上沙特能源(3-4GW 即将上线)
- 日本重启核电、铺 2nm 晶圆厂、安排 650 亿美元 AI 预算
- 法国和韩国都会建核电站
不行动的下场,Sunny 一句话说完:欧洲会变成旅游经济体,人们只为看老房子才来。
2.6 阅读材料与课堂的对照
- Acquired 那期 Brad Gerstner(2022):作为 Brad 的背景介绍——本周课程的真正主源是 Brad 当周在 Stanford 的判断,不是 4 年前的播客
- 20MinutesVC 那期 Jonathan Ross(2025):Ross 本人的访谈,和本周课堂上 Sunny 的视角互补——Ross 是 Groq 创始人视角,Sunny 是 Groq 总裁兼 NVIDIA 收购前 Definitive CEO 的视角
- 课堂独有的判断:Brad 的 2000 年 GDP 长轴加”10 倍工业革命、10 倍速度”框架;Sunny 给出的”5 年后 50%+ 营收但 10% 出货量”的具体数字
字幕校正记录:第 2 周的自动字幕把 Groq 听成 Grock(21 处)、Altimeter 听成 Ultimter/Ultim(5 处)、Gerstner 听成 Gersonner(1 处)、Anthropic 听成 Enthropic(2 处)、ChatGPT 听成 Chat GBT(1 处)、OpenAI 听成 Open AAI(2 处),均已批量替换回写。
第 3 周 — AI 数据中心
Chase Lochmiller 把 AI 投资重新定义为”创造数字劳动力”——借柯布-道格拉斯(Cobb-Douglas)模型说明:超大规模云厂商不是在烧钱建数据中心,而是在用资本开支替代生育。这是整门课最值得停下重读的一次重定义。当下 AI 资本开支已经是仅次于美国国防预算的人类投资项目,规模大过阿波罗计划、曼哈顿计划和全美高速公路之和。
3.1 投资规模锚定
Apoorv 开场把超大规模云厂商的 AI 资本开支放进历史尺度对比:
- 大于阿波罗登月计划
- 大于曼哈顿计划
- 大于全美高速公路系统
- 仅次于美国国防预算
这是人类正在做的最大几项投资之一。
3.2 Chase 的核心重定义:把电子转成 token,就是创造数字劳动力
Chase Lochmiller(Crusoe 创始人兼 CEO,Stanford 研究生校友,登顶过 5/7 大洲最高峰)整场演讲建立在一个重定义上——AI 不是”建数据中心”,是”创造数字劳动力”。
借助经济学的柯布-道格拉斯模型(GDP 增长公式):
GDP 增长 = f(Δ 劳动力, Δ 资本, Δ 技术)
- 历史上,劳动力增长只能靠生育——20 年提前期,还要养、要教育
- AI 时代:通过资本开支和 GPU 投入,可以数字化地创造劳动力——给 Claude 一个”帮我做一个客户关系管理系统(CRM,customer relationship management)“的任务,就是数字劳动力被实例化的那一瞬间
- 所以超大规模云厂商的资本开支不只是算力投资,而是把资本直接转化为劳动力的工业基建——这是工业革命以来从未发生过的事
Chase 自己的精炼:之所以这些投资如此广泛,是因为加速数字劳动力存在彻底重塑经济的机会。
3.3 数据中心的 AI 构成方程
Chase 给出第一性原理的拆分,“AI 由四样东西组成”:
| 组件 | 内容 | 谁赚钱 |
|---|---|---|
| 数据 | 数据集和数据标注 | Scale AI、Mercor、Handshake 等数据公司 |
| 算法 | 反向传播(backprop)、Transformer 等架构 | AI 实验室(OpenAI、Anthropic、Google) |
| 算力 | GPU 加高性能并行计算 | NVIDIA、AMD、各家 ASIC 厂 |
| 能源 + 数据中心 | 电力加物理建筑 | Crusoe 在这一层 |
Crusoe 的定位是垂直整合的 AI 基础设施公司——能源、数据中心、算力一起做。这种整合是新品类,因为传统”数据中心 = 房子 + 机柜”的拆分方式已经不够用。
3.4 GPU 数据中心和传统数据中心的根本差异
辅读 A Primer on AI Data Centers 给出的技术骨架(课堂没展开,Chase 默认学生已读):
规模演进:
| 时间 | 单座规模 |
|---|---|
| 2001 | 几 MW |
| 2010 年代 | 50 MW |
| 2020 | 120 MW |
| 2024+ | 1 GW(约等于纽约市 1/5 用电) |
地理路径依赖:1969 年阿帕网(ARPANET)服务于华盛顿特区,由此让北弗吉尼亚成为数据中心之都,55 年路径依赖延续至今。
AI 时代的关键差异:训练不需要靠近终端用户——对延迟和带宽要求都低,可以建在任何地方。Crusoe 用搁浅能源(stranded energy,包括油田尾气、闲置可再生能源)做数据中心,这一商业模式的前提就是 AI 数据中心不必接近用户。
集成系统化:摩尔定律放缓,单芯片性能提升越来越难,只能把硬件互相靠得更近——从 GPU 到服务器,到机柜组(POD)、超级机柜组(SuperPOD),再到整座数据中心,是同一条逻辑链。Google TPU 架构叫脉动阵列(systolic array)不是巧合——systole 在希腊语里就是心脏收缩。
3.5 能源瓶颈与解药
辅读和课堂一致强调:算力短缺的根源不是芯片,是电力。
短期:
- 接入电网(on-grid):可靠性好,但电网扩容要数年
- 离网(off-grid):自建电源——AWS 在 Indiana 投 110 亿美元建数据中心,配套 4 座太阳能场和 1 座 600MW 风电场;Amazon 收购 Talen,把数据中心建在 2.5GW 核电站旁
中长期:
- 核能:清洁稳定,挑战在经济可行性、行政许可(permitting)和政治敏感性
- 长时储能(long-duration batteries):消除可再生能源间歇性的必备补件
- 许可流程自动化:建数据中心和扩电网都被审批拖死,许可软件公司是隐形受益者
3.6 阅读材料与课堂的对照
- Eric Flaningam 的 A Primer on AI Data Centers:5 层价值链、能源选项、系统集成视角的技术骨架;课堂没复述,默认学生已读
- McKinsey 的 Crusoe 播客:抓取失败,材料缺失(McKinsey 页面反爬)
- 课堂独有的判断:Chase 的柯布-道格拉斯”数字劳动力”重定义;将 AI 资本开支锚定到仅次于美国国防预算的尺度;Crusoe 不止做数据中心、而是包整个栈的垂直整合战略
本周 1 份材料未能获取:McKinsey Crusoe 播客(页面反爬抓取失败)
第 4 周 — AI 应用栈:Ali Ghodsi 谈 AGI 和它为何不重要
Ali Ghodsi(Databricks CEO)的立场和前 3 周形成最锐利对比:通用人工智能(AGI,artificial general intelligence)我们已经有了,别再追超级智能(super intelligence)。MIT 报告里 95% 的企业 AI 概念验证(PoC,proof of concept)失败,不是模型不够强,而是缺企业内部上下文。这个观点把整门课从”芯片层会赚多少钱”重新拉回”应用层为什么进展慢”——答案不在模型质量,在企业数据。
4.1 反主流定位:冷静一点
Ali 开场不谈技术,先安抚学生情绪:
你们 22 岁就在问”我现在该不该创业当 CEO,再等 6 个月人生是不是就结束了”。这不健康。冷静一点,事情需要时间。
他批评硅谷当前追逐”超级智能”是不必要的执念:
- 没人能定义什么叫超级智能
- 大家在读 Kurzweil,想象起飞奇点(takeoff singularity)、GDP 一夜跳 10%、失业率 20%、靠无条件基本收入(UBI,universal basic income)兜底
- 他们是真的相信这些。但不需要相信——AGI 我们已经有了
4.2 颠覆性命题:AGI 已经到了
Ali 现场做了一场”催眠测试”——三个问题让 100 个学生左右脑打架:
| 问题 | 学生反应 |
|---|---|
| 谁认为我们已经有 AGI 了? | 约 10% 举手 |
| 谁认为你日常打交道的多数人比你用过的最聪明的模型还聪明? | 几乎无人举手 |
| 那你为什么还不认为我们有 AGI 了? | 沉默 |
他追溯到 2009 年 UC Berkeley AMPLab 时代的 AGI 定义——按那个定义,我们绝对到了。后来人们一直在挪移球门:草莓里有几个 R 数不清就被判定”还不是 AGI”。
延伸推论:如果 AGI 已经达成,那么继续在 GPU 和数据中心上烧钱就不是必需——这直接挑战前 3 周 Apoorv、Brad、Chase 的资本开支框架。Ali 这一周成了整门课的对照组。
4.3 95% PoC 失败的真正原因:上下文,不是模型
主流叙事:MIT 报告 95% 的企业 AI 概念验证失败,说明 AI 还不够好。Ali 的反驳:
走进任何一家企业看看实情——AI 智能体(Agent)真的在和人协作吗?没有。电影《上班一条虫》(Office Space)描述的运转方式至今没变——人类还在传 TPS 报表。AI 公司自己也一样,他们从老牌公司挖销售,用老办法。
那为什么 95% 的概念验证失败?不是模型不够好,是上下文没灌进去:
- 每家公司都有一个”John 或 Jane”——干了 10 年、20 年、30 年,所有人去问、不能丢的关键员工
- 这个人脑子里的上下文不在模型里
- 所以模型再聪明也会犯蠢错——它根本不知道企业内部的”约定俗成”
Databricks 的整个商业模式就是把企业上下文(数据加业务规则)灌进 AI——这就是 Ali 坐上本周课堂讲台的根本原因。
4.4 Chris Paik 的补充:软件经济学正在重演 1990 年代的媒体业
辅读 Chris Paik 的短文 The End of Software 提供了另一条角度:“应用层进展慢,但终将被重构”。
经济学模板:一旦某个行业的创作成本归零,必然出现寒武纪大爆发和价值链重组。
1990 年代媒体业剧本:
- 互联网前:媒体贵——内容必须自己赚钱(订阅、付费、按次付费)
- 互联网到来:人人看见分发成本归零,没人看见内容创作成本也在归零
- 用户生成内容(UGC,user-generated content)起飞,内容供给爆炸,价值迁移到控制分发的平台(Meta、TikTok、YouTube)
- 媒体公司被侧撞——同一个注意力市场,自己的销售成本(COGS,cost of goods sold)却严格更高
对软件业的对应预测:
- 软件贵,是因为开发者贵——他们是”翻译家”(把人话翻译成代码)
- 大语言模型把翻译成本归零,软件将迎来寒武纪大爆发
- Salesforce 不会被另一个一体化的客户关系管理系统取代,而会被一组动态拼装、共同服务同一意图的小东西取代
- 现在读计算机科学,等同于 1990 年代末读新闻学
4.5 Ali 与 Chris Paik 的张力
两份材料在第 4 周形成有趣对照:
| 视角 | Ali Ghodsi(Databricks CEO) | Chris Paik |
|---|---|---|
| 主战场 | 企业内部数据与上下文整合 | 软件经济学结构 |
| 关键瓶颈 | 把”John 或 Jane”的隐性知识灌进模型 | 创作成本归零是必然趋势 |
| 对 SaaS 的判断 | 我们已经有 AGI,但缺上下文——隐含数据平台类公司(如 Databricks)会赢 | SaaS 这套商业模式即将被淘汰,所有现有软件公司都危险 |
| 对学生 | 冷静下来,专注基本功 | 别把计算机科学当主修 |
Apoorv 把这两种立场同时放进第 4 周显然是有意的——给学生留一个未解决的问题:AGI 是已经达成,还是远未达成?答案决定你该把职业押在哪一边。
4.6 阅读材料与课堂的对照
- Chris Paik 的 The End of Software:作为课堂前的导读,预设学生已经在思考 SaaS 模式是否要崩
- Ali Ghodsi YouTube:材料缺失(YouTube 无字幕),但课堂本身就是 Ali 的最新现场发言,损失不大
- 课堂独有的判断:Ali 的”AGI 已到”立场,“95% 概念验证失败是上下文问题不是模型问题”,以及”《上班一条虫》仍然描述着世界的运转方式”——这些直接挑战前 3 周”AI 全速建底层”的叙事
本周 1 份材料未能获取:Ali Ghodsi 与 David Solomon 对谈 YouTube(YouTube 无可用字幕)。但第 4 周课堂字幕已抓取,覆盖了 Ali 的核心立场,损失可控。
全课程主线总结
四周走下来,整门课的真正轮廓浮现——它不是在教怎么投资 AI,而是在训练一个判断框架:
- 第 1 周(Apoorv 独讲):建立倒置三角形的事实。钱在底部,量级是 10-15 年。
- 第 2 周(Brad + Sunny):拆解芯片层为什么这么集中——HBM 买方垄断、时间护城河、速度护城河三件套。从内部看 NVIDIA 不可撼动的真因。
- 第 3 周(Chase):重定义 AI 资本开支——不是建数据中心,是创造数字劳动力。把投资规模锚定到国防尺度。
- 第 4 周(Ali):唱反调——AGI 已经到了,瓶颈在上下文不在模型——所以前 3 周的乐观底层投资可能在烧错的火。
四周对照下,主讲 Apoorv 的立场(第 1 周)和三位客座的立场(第 2-4 周)形成了框架与反例的结构。这种”先给一条核心论点,再请客座来砸”的教学设计本身就是课程内容——后 5 周还会有更多客座(Anthropic、OpenAI、七大科技股的 ASIC 团队等)继续接着砸这个论点。