Skip to content
Synapse
Go back

Economics of AI (Stanford MS&E 435)

Stanford 2026 春季课程,Apoorv Agrawal(Altimeter Capital)主讲。每周邀请一位创始人或投资人客座,从经济学视角拆解 AI 价值链:钱在哪一层、为什么不下沉、什么时候会下沉。

大纲

Stanford MS&E 435(2026 年春季)由 Apoorv Agrawal 主讲,他是 Altimeter Capital 的投资人,早年在 Palantir 写过 Spark。每周一节课,邀请一位创始人或投资人客座,按查塔姆守则(Chatham House rules,发言可引但不可点名)进行——客座经常爆料,所以课堂内容比公开博客、访谈更新、更尖锐。课程主页:https://mse435.stanford.edu/

四周共享一条核心论点:

AI 价值链是倒置三角形——钱在底部(芯片、算力),不在顶部(应用)。云时代那种 V 字形(应用赚钱)至少要再过 10-15 年才有可能在 AI 重演。整门课就是在拆:这个三角形为什么不下沉、什么条件下才会下沉。

日期主题讲师 / 客座状态
104/03生成式 AI 经济学导论Apoorv Agrawal(独讲)✓ 已整理
204/10芯片与 GPU 经济+ Brad Gerstner (Altimeter) + Sunny Mudra (Groq)✓ 已整理
304/17AI 数据中心+ Chase Lochmiller (Crusoe)✓ 已整理
404/24AI 应用栈+ Ali Ghodsi (Databricks)✓ 已整理

每周一份课堂视频作为主源,再配 2-5 份阅读材料作辅源。


第 1 周 — 钱在 AI 的哪一层

AI 价值链是云栈的镜像:钱集中在底层芯片(NVIDIA 一家拿走 70%+),离终端用户最近的应用层反而赚得最少。这不是周期早期的过渡现象——Apoorv 的判断是这种格局可能持续 10-15 年甚至更久,因为 AI 和 SaaS 的经济学根本不同(边际成本不为零)。本周建立的”倒置三角形”是后 9 周的分析骨架。

1.1 课程定位与核心问题

Apoorv 开场点出两条主线:

1.2 倒置三角形:五层蛋糕的价值分布

Apoorv 借用 Jensen Huang 的”五层蛋糕”框架(能源 → 芯片 → 电力与互联 → 存储 → 上面跑的模型与应用),对比 AI 栈和云栈的根本差异:

维度云栈(V 字形)AI 栈(倒置三角)
钱集中在顶部(应用)底部(芯片)
形态上宽下窄上窄下宽
当前盈利应用毛利 80-90%应用毛利 0-30%,芯片约 75%
时间锚点AWS 2004 年开建 → 2010 年第一个外部客户(Netflix)→ 2012 年 Amazon 自己迁过来,前后 8 年AI 还在建设期,远没到收割期

两年纵向对比(2024 → 2026):生态规模翻了 5 倍(900 亿 → 4350 亿美元),但价值链形态几乎没变——新增的约 3500 亿美元收入里有 75% 直接流向半导体层。应用层翻了十倍以上,却没撼动底部分配。

1.3 关键判断:AI 不是 SaaS

AI 不是软件——它没有”边际成本为零”这件事。用户多就要算力多,所以规模越大利润不会越高,token(模型计费单位)账单基本约等于收入。

这是 Apoorv 整个 9 周课的隐含理论底座。它直接解释了为什么应用层利润低、为什么注定要靠广告——SaaS 时代”软件吃世界”靠的是边际成本归零叠加 90% 毛利复利,但 AI 是每多一个用户就多烧一份 GPU。

学生提问环节,他给出更精细的拆解:

两个翻转的催化剂(Apoorv 明确点名):

  1. 任一家超大规模云厂商的专用集成电路(ASIC,application-specific integrated circuit)计划——Google TPU、Meta MTIA、AWS Trainium、OpenAI 自研——出现爆款级成功,会触发全栈重定价
  2. 超大规模云厂商在财报里停止上调资本开支指引,意味着当前的均衡撑不住了

1.4 训练与推理:NVIDIA 内部最受关注的数字

学生问”训练推理的负载混合为什么不影响 NVIDIA”,Apoorv 给出业内最被追问的一组数字:

这条数据是后续几周——尤其是第 2 周 Sunny 那段讨论”NVIDIA 出货份额下降但收入仍占 50%+“——的根本依据。

1.5 消费 AI 三梯队和 ARPU 鸿沟

Apoorv 提出消费应用三梯队框架(按全球周活用户 WAU,weekly active users 分布):

梯队周活规模代表用户依赖度
必备型工具(mandatory utility)20-30 亿WhatsApp、Chrome、YouTube没了活不了
社交型(靠网络效应)15-20 亿Instagram、TikTok、Facebook朋友在就在
细分型(niche)3-6 亿Spotify、Amazon、Twitter特定场景

当下定位:

每用户平均收入(ARPU,average revenue per user)的鸿沟比周活更刺眼:

公司用户ARPU
Alphabet约 40 亿约 $100/年
Meta约 35 亿约 $70/年
OpenAI约 10 亿约 $10/年

Apoorv 的判断很明确:要把 $10 拉到 $100,靠订阅远远不够,必须靠广告——对话式提问意图清晰、用户已登录、归因(attribution)链路短,这三点会让 AI 广告的千次展示成本(CPM,cost per mille)比 Google 传统广告更高。这是本课程最锋利的一条第一性原理预测。

1.6 与阅读材料的对照

5 篇辅读博客(Apoorv 自己 2024-2026 年的写作)基本覆盖了课堂论点:


第 2 周 — 芯片与 GPU 经济

Brad Gerstner 把镜头拉远到 2000 年量级的 GDP 增长曲线,将 AI 定性为”工业革命影响的 10 倍、速度的 10 倍”。Sunny Mudra(Groq 总裁)从内部视角讲:NVIDIA 真正的护城河不是 CUDA,而是高带宽存储(HBM)的买方垄断(monopsony)和对客户配额的控制。本周最反直觉的判断不是”NVIDIA 会下来”——而是”5 年后 NVIDIA 只占出货量的 10%,但收入仍占 50%+“。

2.1 Brad 的宏观框架:AI 是 10 倍速的工业革命

Brad Gerstner 开场不讲芯片,先放一张 2000 年长跨度的 GDP 曲线

落到投资视角:

Brad 留给学生的金句:今天你必须借 AI 把自己升级成”半机械人”——不用不行。10 年前我看你的学校、看你工作的公司;今天我只看你能不能交付远超平均水平的价值。

2.2 NVIDIA 的真正护城河:HBM 买方垄断与客户配额

Sunny Mudra(Groq 总裁,原 Definitive Intelligence CEO,公司被 NVIDIA 收购后加入 Groq)从内部视角拆解 NVIDIA 的真护城河——不是 CUDA

超大规模云厂商自研芯片的真正动机不是性能、也不是成本,是对命运的掌控——不再让 NVIDIA 决定自己能拿到多少 GPU 配额。Sunny 直接点破常见误解:自研芯片的逻辑是不再被告知自己的配额上限,而不是为了更快。

2.3 五年芯片市场预测:营收主导和出货份额脱钩

Sunny 给出全场最具体的一组预测:

5 年后NVIDIA
营收份额仍 ≥ 50%
出货量份额可能只剩约 10%
原因”买 NVIDIA 不会有人被开除”——品牌溢价加上客户求稳愿付高毛利
底层变化35-36 家集中客户的决策权越来越大,会更按业务需求选芯片

芯片业天然的护城河是时间:从设计到量产 3 年(执行完美才行),实际通常 4 年。只有 14% 的芯片做到首次流片成功(A0 silicon,first-pass silicon)。Groq 的三颗芯片都做到了 A0,把迭代节奏压到 一年一代——这是它的核心差异化。

至于新入局者想造芯片硬刚 NVIDIA:3 年起步已经追不上,太晚了。

2.4 速度是被严重低估的护城河

Sunny 用**消费品包装行业(CPG,consumer packaged goods)**做类比,说明速度才是真正的护城河:

延伸到 AI 推理:客户上来都问速度,但意识到算力短缺后立刻转问”能给我多少”——Sunny 坚信,速度才是真正的差异化

由此得出的延伸结论:CUDA 的开发者锁定(lock-in)不是护城河——训练阶段有用,推理阶段无用。Groq 已有 220 万注册开发者,NVIDIA 声称有 600 万 CUDA 开发者——推理市场的这道墙在塌。

2.5 中美 AI 竞争:主场与客场

Sunny 给出第 1 周辅读完全没覆盖的一个原创框架:

美国未来 2-3 年的客场窗口,决定能不能把盟友拉进美国 AI 阵营。

欧洲的能源解药

不行动的下场,Sunny 一句话说完:欧洲会变成旅游经济体,人们只为看老房子才来。

2.6 阅读材料与课堂的对照

字幕校正记录:第 2 周的自动字幕把 Groq 听成 Grock(21 处)、Altimeter 听成 Ultimter/Ultim(5 处)、Gerstner 听成 Gersonner(1 处)、Anthropic 听成 Enthropic(2 处)、ChatGPT 听成 Chat GBT(1 处)、OpenAI 听成 Open AAI(2 处),均已批量替换回写。


第 3 周 — AI 数据中心

Chase Lochmiller 把 AI 投资重新定义为”创造数字劳动力”——借柯布-道格拉斯(Cobb-Douglas)模型说明:超大规模云厂商不是在烧钱建数据中心,而是在用资本开支替代生育。这是整门课最值得停下重读的一次重定义。当下 AI 资本开支已经是仅次于美国国防预算的人类投资项目,规模大过阿波罗计划、曼哈顿计划和全美高速公路之和。

3.1 投资规模锚定

Apoorv 开场把超大规模云厂商的 AI 资本开支放进历史尺度对比:

这是人类正在做的最大几项投资之一。

3.2 Chase 的核心重定义:把电子转成 token,就是创造数字劳动力

Chase Lochmiller(Crusoe 创始人兼 CEO,Stanford 研究生校友,登顶过 5/7 大洲最高峰)整场演讲建立在一个重定义上——AI 不是”建数据中心”,是”创造数字劳动力”

借助经济学的柯布-道格拉斯模型(GDP 增长公式):

GDP 增长 = f(Δ 劳动力, Δ 资本, Δ 技术)

Chase 自己的精炼:之所以这些投资如此广泛,是因为加速数字劳动力存在彻底重塑经济的机会。

3.3 数据中心的 AI 构成方程

Chase 给出第一性原理的拆分,“AI 由四样东西组成”:

组件内容谁赚钱
数据数据集和数据标注Scale AI、Mercor、Handshake 等数据公司
算法反向传播(backprop)、Transformer 等架构AI 实验室(OpenAI、Anthropic、Google)
算力GPU 加高性能并行计算NVIDIA、AMD、各家 ASIC 厂
能源 + 数据中心电力加物理建筑Crusoe 在这一层

Crusoe 的定位是垂直整合的 AI 基础设施公司——能源、数据中心、算力一起做。这种整合是新品类,因为传统”数据中心 = 房子 + 机柜”的拆分方式已经不够用。

3.4 GPU 数据中心和传统数据中心的根本差异

辅读 A Primer on AI Data Centers 给出的技术骨架(课堂没展开,Chase 默认学生已读):

规模演进

时间单座规模
2001几 MW
2010 年代50 MW
2020120 MW
2024+1 GW(约等于纽约市 1/5 用电)

地理路径依赖:1969 年阿帕网(ARPANET)服务于华盛顿特区,由此让北弗吉尼亚成为数据中心之都,55 年路径依赖延续至今。

AI 时代的关键差异:训练不需要靠近终端用户——对延迟和带宽要求都低,可以建在任何地方。Crusoe 用搁浅能源(stranded energy,包括油田尾气、闲置可再生能源)做数据中心,这一商业模式的前提就是 AI 数据中心不必接近用户。

集成系统化:摩尔定律放缓,单芯片性能提升越来越难,只能把硬件互相靠得更近——从 GPU 到服务器,到机柜组(POD)、超级机柜组(SuperPOD),再到整座数据中心,是同一条逻辑链。Google TPU 架构叫脉动阵列(systolic array)不是巧合——systole 在希腊语里就是心脏收缩。

3.5 能源瓶颈与解药

辅读和课堂一致强调:算力短缺的根源不是芯片,是电力

短期:

中长期:

3.6 阅读材料与课堂的对照

本周 1 份材料未能获取:McKinsey Crusoe 播客(页面反爬抓取失败)


第 4 周 — AI 应用栈:Ali Ghodsi 谈 AGI 和它为何不重要

Ali Ghodsi(Databricks CEO)的立场和前 3 周形成最锐利对比:通用人工智能(AGI,artificial general intelligence)我们已经有了,别再追超级智能(super intelligence)。MIT 报告里 95% 的企业 AI 概念验证(PoC,proof of concept)失败,不是模型不够强,而是缺企业内部上下文。这个观点把整门课从”芯片层会赚多少钱”重新拉回”应用层为什么进展慢”——答案不在模型质量,在企业数据。

4.1 反主流定位:冷静一点

Ali 开场不谈技术,先安抚学生情绪:

你们 22 岁就在问”我现在该不该创业当 CEO,再等 6 个月人生是不是就结束了”。这不健康。冷静一点,事情需要时间。

他批评硅谷当前追逐”超级智能”是不必要的执念

4.2 颠覆性命题:AGI 已经到了

Ali 现场做了一场”催眠测试”——三个问题让 100 个学生左右脑打架:

问题学生反应
谁认为我们已经有 AGI 了?约 10% 举手
谁认为你日常打交道的多数人比你用过的最聪明的模型还聪明?几乎无人举手
那你为什么还不认为我们有 AGI 了?沉默

他追溯到 2009 年 UC Berkeley AMPLab 时代的 AGI 定义——按那个定义,我们绝对到了。后来人们一直在挪移球门:草莓里有几个 R 数不清就被判定”还不是 AGI”。

延伸推论:如果 AGI 已经达成,那么继续在 GPU 和数据中心上烧钱就不是必需——这直接挑战前 3 周 Apoorv、Brad、Chase 的资本开支框架。Ali 这一周成了整门课的对照组。

4.3 95% PoC 失败的真正原因:上下文,不是模型

主流叙事:MIT 报告 95% 的企业 AI 概念验证失败,说明 AI 还不够好。Ali 的反驳:

走进任何一家企业看看实情——AI 智能体(Agent)真的在和人协作吗?没有。电影《上班一条虫》(Office Space)描述的运转方式至今没变——人类还在传 TPS 报表。AI 公司自己也一样,他们从老牌公司挖销售,用老办法。

那为什么 95% 的概念验证失败?不是模型不够好,是上下文没灌进去

Databricks 的整个商业模式就是把企业上下文(数据加业务规则)灌进 AI——这就是 Ali 坐上本周课堂讲台的根本原因。

4.4 Chris Paik 的补充:软件经济学正在重演 1990 年代的媒体业

辅读 Chris Paik 的短文 The End of Software 提供了另一条角度:“应用层进展慢,但终将被重构”。

经济学模板:一旦某个行业的创作成本归零,必然出现寒武纪大爆发和价值链重组。

1990 年代媒体业剧本

对软件业的对应预测

4.5 Ali 与 Chris Paik 的张力

两份材料在第 4 周形成有趣对照:

视角Ali Ghodsi(Databricks CEO)Chris Paik
主战场企业内部数据与上下文整合软件经济学结构
关键瓶颈把”John 或 Jane”的隐性知识灌进模型创作成本归零是必然趋势
对 SaaS 的判断我们已经有 AGI,但缺上下文——隐含数据平台类公司(如 Databricks)会赢SaaS 这套商业模式即将被淘汰,所有现有软件公司都危险
对学生冷静下来,专注基本功别把计算机科学当主修

Apoorv 把这两种立场同时放进第 4 周显然是有意的——给学生留一个未解决的问题:AGI 是已经达成,还是远未达成?答案决定你该把职业押在哪一边。

4.6 阅读材料与课堂的对照

本周 1 份材料未能获取:Ali Ghodsi 与 David Solomon 对谈 YouTube(YouTube 无可用字幕)。但第 4 周课堂字幕已抓取,覆盖了 Ali 的核心立场,损失可控。


全课程主线总结

四周走下来,整门课的真正轮廓浮现——它不是在教怎么投资 AI,而是在训练一个判断框架

  1. 第 1 周(Apoorv 独讲):建立倒置三角形的事实。钱在底部,量级是 10-15 年。
  2. 第 2 周(Brad + Sunny):拆解芯片层为什么这么集中——HBM 买方垄断、时间护城河、速度护城河三件套。从内部看 NVIDIA 不可撼动的真因。
  3. 第 3 周(Chase):重定义 AI 资本开支——不是建数据中心,是创造数字劳动力。把投资规模锚定到国防尺度。
  4. 第 4 周(Ali):唱反调——AGI 已经到了,瓶颈在上下文不在模型——所以前 3 周的乐观底层投资可能在烧错的火。

四周对照下,主讲 Apoorv 的立场(第 1 周)和三位客座的立场(第 2-4 周)形成了框架与反例的结构。这种”先给一条核心论点,再请客座来砸”的教学设计本身就是课程内容——后 5 周还会有更多客座(Anthropic、OpenAI、七大科技股的 ASIC 团队等)继续接着砸这个论点。