Investing for Programmers

大纲

Stefan Papp 是程序员出身的投资者，核心问题是：如何把编程、数据分析和 AI 能力转成投资优势。全书按”认知→工具→实战→进阶”展开，主线是用工程思维替代直觉决策。

基础篇（第 1-3 章）

章	主题	关键概念
1	分析型投资者	资产分类、投资 vs 交易 vs 赌博、成长/价值/收入三大风格、核心-卫星组合、程序员的不公平优势
2	投资基础	三张报表、FCF、GICS 行业分类与经济周期、市值分层、关键指标（P/E、PEG、D/E、ROE）、分红与回购、外部评级的局限
3	数据收集	金融数据三类（基本面/技术/非财务）、数据源选型、时间序列分析、归一化、对数收益率

组合篇（第 4-5 章）

章	主题	关键概念
4	成长型组合	投资假说、SWOT、LiDAR 案例、三种决策路径、退出条件
5	收入型组合	股息、债券、加密货币质押、提前退休

工程篇（第 6-7 章）

章	主题	关键概念
6	构建资产监控器	持仓采集、数据聚合、可视化、被动收入追踪、收益预测
7	风险管理	止损、风险度量、对冲、组合优化、再平衡

AI 篇（第 8-9 章）

章	主题	关键概念
8	AI 金融研究	ML 局限、监督/无监督学习、LLM 研究助手、投资者画像
9	AI 代理	反思、工具调用、规划、多代理、RAG

交易篇（第 10-11 章）

章	主题	关键概念
10	图表与技术分析	K 线、形态识别、均线、布林带、MACD
11	算法交易	非财务数据、催化剂、回测、交易信号、订单类型、API 下单

进阶篇（第 12-13 章）

章	主题	关键概念
12	私募股权：投资初创	初创生命周期、估值、股权稀释、初创评分
13	路在脚下	寻求专业建议、保持好奇、行为金融控制、指数基金作为安全底线

前半本讲公开市场和研究流程，后半本扩展到工具、AI、交易和私募；结尾落回行为控制。

第 1 章 — 分析型投资者

程序员的投资优势不在胆子更大，而在能把研究、决策和执行做成系统。

被动收入是程序员突破职场天花板的替代路径：覆盖部分必要开支时，自由就开始了。知道自己随时能离开一份高薪但压榨灵魂的工作，这种底气本身就是解脱。

1.2 资产

变现路径	机制
资本增值	低买高卖
被动收入	利息、租金、分红

投资前三问	判断标准
风险承受力	能承受多大损失而不焦虑
财务目标	时间跨度 × 目标收益
时间投入	盯盘侵蚀生活说明策略要调

资产类型	核心机制	被动收入
股票（Stocks）	公司所有权（equity），股价由供需驱动	股息（dividend）
债券（Bonds）	借钱换定期票息（coupon）+ 到期返本	票息
ETF	一篮子证券，天然分散，多数被动跟踪指数	分红（分配型 ETF）
期权（Options）	付权利金获买/卖权利（非义务）	—
加密货币（Crypto）	区块链数字资产，无中介点对点交易	质押（Staking）
私募股权（PE）	未上市公司，流动性最低，回报潜力最大	—

债券收益率和信用风险正相关，美国国债是无风险基准。期权买方风险有限，卖方风险敞口更大。股息策略至少要跑赢无风险收益率，否则连通胀都难覆盖；而证券的优势在于门槛低、流动性好、可扩展。

1.3 投资方法

类别	特征
赌博	凭直觉决策，受认知偏差驱动
投资	长期视角，依赖分析和批判性思维
交易	利用短期波动，频率高、风险大

定量研究看数字，定性研究解释原因；AI 提高效率，但不替代判断（角色边界见第 8 章）。交易按频率分为日内、波段、算法和高频；做多赌涨，做空赌跌。回测（Backtesting）则用历史数据检验策略。

三大投资风格

属性	成长型（Growth）	价值型（Value）	收入型（Income）
目标	资本增值	资本增值	持续现金流
关注	未来潜力	被低估的”便宜货”	稳定现金分配
典型公司	高速扩张	成熟但暂不受欢迎	成熟、高现金流
分红	低或无	通常有	高且稳定
关键指标	高营收增长、高 P/E	低 P/E、低 P/B	高股息率
风险	高	低到中	低

合理价格成长策略（GARP）是成长和价值的折中；Peter Lynch 的提醒也一样：对某个领域的专业知识，本身就是投资优势。

对冲本质上是买保险。过去回报不保证未来，价格也不只受基本面驱动，社交媒体和情绪同样会放大波动；因此真正有用的不是预测，而是在情绪极端时保持反身性。

核心-卫星组合（Core and Satellite）

核心仓位（Core）负责长期持有和复利增长，卫星仓位（Satellites）负责短期交易和现金流补充。

1.4 程序员的不公平优势

基本面分析像 debug：先拆解业务，再判断价值；而编程擅长构建规则系统，这正好对应投资纪律。

特质	投资映射
耐心和纪律	投资是最高形式的延迟满足
抽象思维	习惯处理 API 和数据结构，理解无形资产更容易
前沿视角	身处 AI、VR、biotech 前线，有领域判断力

投资策略应和人生选择对齐。

第 2 章 — 投资基础

基本面分析的顺序是：报表 → 行业 → 指标 → 同行业横比。

2.1 会计基础

财务报表就是公司的源代码，主流标准是 GAAP 和 IFRS。

报表	核心问题
损益表	赚了多少
资产负债表	有什么、欠什么
现金流量表 / 自由现金流（FCF）	能自由支配多少现金

读财报时只抓四件事：净利润不增长，真实购买力就在缩水；同一组数据要同时能讲出看多和看空两套故事；指标只能放在同行业里比，流动性往往比账面财富更暴露风险；**资本性支出（CapEx）**低也未必代表更轻，可能只是把成本转进了运营费用。

2.2 行业分类

GICS 把股票分到不同板块；关键不是记分类细节，而是知道不同板块受不同宏观因子驱动。

只投自己理解的业务；数字必须放回商业模式里读。

经济周期与行业表现

经济周期分扩张、顶峰、收缩、谷底；周期性行业在衰退期更脆弱，防御性行业更稳。已知的板块驱动因子还可以直接转成 ML feature，把宏观认知变成可回测信号。

市值 = 流通股 × 股价；规模越大越稳，规模越小波动越大但上行弹性也更强。市值不是内在价值，机会来自两者的偏离。

2.3 指标与比率

没有单一指标能定义好公司，关键是指标组合、行业横比和历史变化。

类别	指标	判断要点
流动性	Current ratio / Quick ratio	都看短期偿债能力，后者更严格
债务	D/E / Interest coverage	先确认口径；利息覆盖率 `< 1.0` 是红线
盈利	EPS / ROA / ROE / Margin	看盈利质量和资本使用效率
估值	P/E / PEG / P/S / P/B	行业横比 + 历史纵比，不同阶段用不同指标
分红	Dividend yield / Payout ratio	高股息未必安全，削减分红是警告
股权	Float / Outstanding	增发稀释，回购提升每股价值

指标使用原则

指标选择本身就是叙事：选什么指标，就会看到什么公司。股东回报主要看分红和回购，辅助信号再看内部人交易、SBC 和同行业 ESG。外部评级只作参考，分析师、机构和量化模型经常互相矛盾，最终仍要自己判断；投资不追求每次都对，而追求胜率和分散化的组合。

多元化没有通用答案；关键是新业务能否延续原有优势。

第 3 章 — 数据收集

数据源的核心问题不是便宜，而是能否稳定支撑研究流程。

3.1 数据源与分析方法

类型	特征
基本面	低频、可审计
技术	实时、延迟敏感
非财务	非结构化、需挖掘

AI 提高了非结构化数据的可用性，非财务数据因此更重要。数据源选型只看一条：原型阶段用免费接口，正式使用切到稳定的数据源或抽象层工具。

关键分析方法

分析时先看序列，不看点值：单个指标要放回多年区间里看，波动本身不等于风险恶化。跨股票比较前先做可比性，归一化到同一起点；收益率分析优先用对数收益率。波动判断还要看时间窗口，不看单年快照。

第 4 章 — 成长型投资组合

可复用的研究框架：想法→SWOT 挑战→缩窄焦点→候选筛选→多维分析→风险审视→持续监控→耐心等待。

4.1 投资假说

投资假说就是一套可被质疑的买入逻辑；买入前先定义目标，退出条件与三条路径见 §4.3。

对行业越陌生，越容易高估自己，所以最好从真正懂的领域出发，再用 SWOT 把宽泛主题缩窄成具体标的；最后只看三问：现金流、护城河、安全边际。

4.2 案例与方法论启示

LiDAR 案例演示了完整流程：从大主题缩窄到细分供应商，再比较技术、财务、管理层和风险。结论不是买入，而是继续观察。

四条要点：研究完仍不确定就先不出手，次优机会会占掉未来弹药；风险研究比收益想象更重要，个人可用”换日换角色”替代机构里的多空分工；信息源优先级是专业报刊 > 分析师 > Reddit > 公司 IR；追踪假说前先定义衡量标准。

4.3 决策路径

面对”有前景但不确定”的标的，决策无非三条路：大胆型直接建仓，前提是真懂；谨慎型继续研究或放弃，代价只是错过；混合型小额建仓边持有边研究，代价是仓位大小难拿捏。

无论哪条路径，提前定义退出条件（止盈、止损、时间窗口）比选路径本身更重要。

投资和创业都在找好机会；区别只是投资者不亲自运营。

没有想法时，就从自己熟悉的行业和技术主题开始。

第 5 章 — 收入型投资组合

收入型组合的关键不是追高收益，而是识别现金流背后的风险来源和可持续性。

5.1 股息

分红能力主要由生命周期、行业结构和护城河决定：成熟期、再投资需求低、现金流可预测的公司最适合做股息资产。现金牛（Cash Cow）是理想股息标的，行业也比规模更能决定分红倾向，公用事业通常比科技公司更适合。

护城河越深，分红越可持续；高股息本身不是护城河。

股息筛选指标

指标	判断要点
年度派息 / 派息频率	看现金流节奏是否匹配需求
股息率（Dividend yield）	高股息率可能只是股价下跌
股息增长年数 / 增长率	看分红是否长期稳定
派息比率（Payout ratio）	越低越有余地
公司注册地	直接影响税负

低派息比率 + 稳定分红历史，才值得深挖。

REIT 的优势是高分配率、不动产敞口和流动性，适合补充稳定现金流。

5.2 债券

股票是所有权，债券是借贷；债券回报来自票息和价格变化。普通债券（Vanilla bond）就是固定付息、固定到期，其他变种只是偿付和担保条件不同。

债券核心属性

属性	说明
借款方	联邦政府 / 市政 / 企业
到期日	数月到数十年
票息	固定或浮动
信用评级	投资级与投机级的分界线最重要
支付方式	付息频率和方式

债券回报不只来自票息，也可能来自折价买入后的资本增值。美国国债按期限分为 T-Bills、T-Notes、T-Bonds；利率是债券市场的总开关，加息会压低旧债价格，也会推高违约风险。

提前卖出债券不是对错问题，而是机会成本判断。

信用违约互换（CDS） 本质上是债券违约保险，也能被用来表达做空信用风险的观点。

5.3 加密货币质押

5.3.1 密钥与交易所

核心区别只有一条：把币放在交易所是用便利换托管风险，自管私钥才是真正控制资产。FTX 暴露了第三方托管的系统性风险；硬件钱包和软件钱包把风险收窄到市场波动和链上安全。

5.3.2 挖矿与质押

机制	共识协议	特征
挖矿（Mining）	PoW	用算力解数学题验证交易，需硬件+电力的大额前期投入
质押（Staking）	PoS	锁定代币支持网络验证交易，能效高但有最低持仓要求

自建验证节点门槛高，多数人只能委托第三方验证者，用佣金换便利。质押的三类风险是流动性锁定、收益率浮动和高通胀稀释；APY 越高，通常越要警惕后两者。

稳定币质押只消除了币价波动，不消除利率波动和平台风险。

5.4 提前退休

财务独立的简易公式是 年支出 ÷ 预期收益率 = 所需本金；5% 是常见保守估算，但还要再扣掉通胀。年龄越大，配置越应向被动收入倾斜；但长期看，成长型 ETF 往往因复利跑赢固定收益组合。收入型配置的价值，是避免在最差时点被迫卖出成长资产。

第 6 章 — 构建资产监控器

资产监控的核心不是做报表，而是把分散在不同平台、不同币种、不同资产类型的持仓压成统一视图。

6.1 架构

层	作用	关键对象
数据源	收集线上和线下持仓	券商 API、交易所 API、`offline_asset`
规范化	统一字段	`ticker`、持仓数量、平均买入价、交易所、来源
富化	补估值和收益数据	Yahoo Finance、Google Finance、CoinMarketCap
导出	写入不同工作表	`stock`、`etf`、`bond`、`crypto`、`assets`

难点不在展示，而在统一模型；字段对齐后，分析、汇总和导出都能复用
没有 API 的资产也要入表，ticker 仍是最稳的主键；Google Sheets 只是展示层，导出值是快照，Live 列补实时行情

6.2 数据管线

先定义统一字段，再为各券商和交易所写适配器。

统一字段	用途
`ticker`	资产唯一标识
持仓数量	计算总价值和总收益
平均买入价	计算历史收益
`exchange`	推导币种并做汇率转换
`broker`	标记数据来源，便于排错

asset_lookup 负责三件事：标记资产类型、归属组合、把券商 ticker 映射到行情平台符号（如 BRK.B → BRK-B）
映射完成后，才能稳定补价格、汇率和收益指标
选券商不能只看手续费；API 质量、自动化友好度和平台可信度同样重要。Alpaca 更现代，Interactive Brokers 更强但依赖本地 TWS 桥接

6.3 资产处理

先统一采集和估值口径，再按资产类型挂不同指标。

资产	处理重点
股票（Stocks）	补行情、统一币种、聚合到整仓；核心口径是 `总成本`、`总市值`、`总股息`、历史收益和潜在收益，组合看绝对金额，个股看百分比
ETF	复用股票流程，但更关注净值（NAV）和 `yield`；股票分红、债券票息、加密质押奖励在监控层都可统一为 `yield`
债券（Bonds）	更像按单次发行建档，常见标识是 ISIN；重点监控面值、本息回收和年化票息，收益率维护在离线表即可
加密货币（Cryptocurrencies）	视图必须同时覆盖交易所持仓和链下自托管持仓；Google Finance 支持不足，要改用专门数据源；质押奖励可记作 `yield`，但稳定性远不及债券票息

统一视图建立后，风险分析、估值面板、ESG 和自定义预警都只是往同一管线上挂模块
API key、交易所密钥和表格凭证都属于敏感信息；资产监控首先是自动化系统，其次才是投资工具

第 7 章 — 风险管理

风险管理不是押注更少，而是先定义跌倒时怎么收伤，再决定能承受多大的上行诱惑。

7.1 基本防守（Ukemi）

作者把风险管理比作武术里的 Ukemi：先学会安全落地，再谈进攻。投资里的第一层防守不是预测对错，而是先画出损失边界。

7.1.1 止损

止损单（Stop-loss）最直接的作用，是预先告诉券商：跌到某个价位就自动卖出
上涨后可同步上调止损位，把“继续持有”和“锁定部分利润”合成一个机制
但止损不是无脑全覆盖，至少要同时考虑税负、交易成本和被短期波动洗出去的风险；长期持有优质公司时，它更像风控旋钮，不是唯一纪律

7.1.2 风险分类

风险层级	含义	典型例子
市场风险（Market risk）	整体市场下跌拖累多数资产	衰退、地缘冲突、情绪崩塌
行业风险（Sector risk）	某一板块一起受冲击	监管收紧、技术替代、需求转向
个股风险（Asset-specific risk）	公司自身出了问题	管理失误、产品失败、财务恶化

Bikeshedding 在投资里同样常见：盯着某只股票 5% 波动，却忽视另一家持仓的基本面已经坏掉
风险要先分层再处理：先看会不会把整个市场一起拖下去，再看它在自己组合里会放大成什么损失；长期看，稳定复利通常优于靠几次暴击换高收益

7.1.3 风险测量

工具	回答的问题	用法
风险矩阵	哪些风险最该先处理	按影响程度 × 发生概率排序，再预设动作
Beta	资产对大盘波动有多敏感	`>1` 比大盘更激进，`<1` 更稳健
原则清单	事情变坏时该怎么做	提前定义“到什么等级就减仓 / 清仓”

风险评估不是为了算准未来，而是提前写好“如果发生，我怎么办”；真到高压时刻，靠原则往往比靠临场理性更可靠

7.2 个股与组合的风险画像

7.2.1 风险价值（VaR）

风险价值（VaR）回答的是：在给定时间窗口和置信水平下，正常情况下最糟可能亏多少。

要素	作用
时间窗口	看一天、一周还是一个月
置信水平	常见是 95% 或 99%
模拟方法	方差-协方差法、蒙特卡洛模拟（Monte Carlo）

VaR 适合把历史波动压成“正常时期的最坏日常损失”；黑天鹅（Black Swan）这类极端异常事件通常仍在模型外
组合层面可先算单资产 VaR，再聚合成整仓风险承受图

7.2.2 相关性

相关性看的是资产是否一起涨跌，而不是谁绝对价格更高
协方差（Covariance）回答“是否同向”，相关系数（Correlation）回答“同向到什么程度”
同属同一叙事的公司往往高度相关；表面分散、实则仍押在同一条赛道。找到低相关甚至负相关资产，会牺牲牛市爆发力，但能显著降低坏年份回撤

7.3 人是最大的风险源

7.3.1 疏忽与偏差

技术风控再严，也挡不住人的贪婪、恐惧和 FOMO
组合跟踪、交易日志、回顾机制，本质上是在给自己的情绪做审计
券商的风险画像、冷静期、交易限制都不是多余摩擦，而是在情绪上头时替你踩刹车

7.3.2 回避高风险

方法	适用场景
指数基金	不想押单一公司生死，但想拿到市场平均收益
定投（DCA）	担心一次买在高点，希望平滑择时风险
安全边际（Margin of safety）	做价值投资，要求买价低于内在价值
主动 + 被动组合	一边拿基准收益，一边保留主动超额空间

风险偏好（Appetite）是“愿不愿赌”，风险承受力（Capacity）是“赌错后扛不扛得住”
长线投资、短线交易、杠杆和做空面对的风险结构完全不同，不能混用同一套纪律

7.3.3 韧性

很多投资者更愿意卖掉赚钱的仓位，而不是承认亏损仓位已经坏掉，这就是 损失厌恶（Loss aversion）
更好的提问方式不是“它还能不能回本”，而是“如果现在没持有，我还会不会买它”
同行复盘、可信的外部意见和机械化原则，都是对抗沉没成本的工具

7.4 对冲

对冲的本质是牺牲一部分上行，换取在坏情形下不致命。

7.4.1 衍生品

工具 / 策略	用途	核心风险
Put / Call 期权	锁定买卖价格区间	买方损失有限，卖方尾部风险高
Covered call	持股赚权利金	大涨时上行被封顶
Cash-secured put	想低价接货时先收权利金	暴跌时被迫接刀
Iron condor	押震荡、赚时间价值	单边大行情易亏损
Futures / Swaps	锁价格或现金流敞口	杠杆和结构复杂

衍生品不是免费保险，而是把风险从一种形式换成另一种形式
卖期权赚的是稳定小钱，承担的是尾部大亏；没吃透义务结构前不要把它当“被动收入工具”

7.4.2 分散、配对与风险配比

分散化（Diversification）不是多买几只同一主题股票，而是减少对单一叙事、单一行业、单一宏观情景的依赖
配对交易（Pair trading）通过一多一空，把押注从“市场整体涨跌”转成“谁相对更强”
风险配比（Risk pairing）更适合个人投资者：用稳定资产托底，再用小比例仓位下注高风险机会
如果 80% 仓位在指数和稳健资产，20% 仓位押新技术，即便高风险部分归零，也不会伤到根基

7.5 非财务风险

非财务风险的难点不是不存在，而是难以像报表指标那样标准化。

这类风险通常没有统一数据库，更多依赖案例类比、舆情分析和主观判断
私人投资者不必追求机构级完整模型；先列出最可能伤到自己组合的 3-5 个非财务风险，再持续观察市场、失业率、收益率曲线和政治变化给出的信号

7.6 组合优化

7.6.1 Markowitz 有效组合

现代投资组合理论（MPT）的目标是：在给定风险下争取最高收益，或在给定收益下争取最低波动
有效前沿（Efficient frontier）展示的是一组“风险-收益最优”的组合
实操上常用历史收益、协方差矩阵和大量随机组合做 蒙特卡洛模拟，再挑候选组合；真正常落脚的往往不是“理论最高收益”，而是 夏普比率（Sharpe ratio）最高的组合，因为它衡量单位风险换来多少超额收益

7.6.2 CAPE 与资产配置

指标	用途	常见解读
Shiller P/E / CAPE	用 10 年真实盈利平滑周期噪音，判断市场整体估值	高 CAPE 代表估值偏贵，低 CAPE 代表估值偏便宜
无风险利率	判断冒险值不值	风险资产回报至少该高于 T-Bills

CAPE 更适合做宏观仓位调整，不适合拿来预测短期拐点
一种常见做法是：先用 CAPE 决定股票 / 债券 / 黄金的大类配置，再在股票内部用夏普比率做微观优化

7.6.3 再平衡

再平衡的目标是防止组合被赢家一路带偏，最后变成“表面持有多资产，实则单一暴露”
常见触发方式有三种：定期、阈值、混合
再平衡不是机械卖强留弱，而是让仓位回到最初的风险设计；交易成本、税负和整股限制都会影响精度，现金流稳定的人还可以用“只拿新增现金补偏离仓位”代替大量卖出

第 8 章 — AI 金融研究

AI 在投资里的最佳位置不是替你拍板买卖，而是把筛选、取数、总结和尽调提速，让判断回到人手里。

8.1 ML 在金融的边界

无监督学习适合先把混乱市场压成可观察结构（如用收益率 + 波动率给成分股聚类，生成研究优先级候选）；监督学习（分类/回归/时间序列）在金融里的根本难点不是写模型，而是选特征、控噪声、抗环境切换——有效市场快速吸收信息，规律随社会技术变迁失效，同一模型跨牛熊周期表现可以天差地别。

ML 更适合范围收窄的场景：某个行业、某类业务模型、某条已知驱动链，而不是”预测全市场”。真正成功的量化团队，难点更多在数据管线和组织迭代，而不是某个单独算法。

8.2 GenAI 的用法与限制

GenAI（研究助手）和 ML（判别器）的差别不只是模型结构，而是任务类型不同。

用法	价值
辅助 ML 选特征	帮忙提出值得纳入模型的业务变量
公司尽调摘要	快速总结管理层、诉讼、商业模式、客户结构
文档总结	财报、电话会、长报告压成一页摘要
非财务风险粗筛	用统一问题先扫疫情、贸易战、气候等暴露
代码生成	加速写抓数、算指标、做分析的脚本

LLM 最适合做”研究加速器”——帮你更快形成评分卡，但不能替你跳过事实核验。核心限制：信息有训练截止日期、会幻觉、同一问题输出不确定；泛化建议越泛越危险，问题越具体越接近甜蜜点。

一旦想做 RAG、接私有数据、比对多个模型和保存结果，代码层不可省；聊天框不擅长统一管理 prompt、上下文和输出。

8.3 Prompt engineering

维度	应提供的信息
目标	资本增值、被动收入，或财务独立时间表
风险偏好	能忍受多大波动、是否接受做空、是否接受高风险资产
背景与经验	熟悉哪些行业、哪些资产、哪些券商
税务	国籍、税务居民地、税负约束
价值观	不投什么行业，是否关心 ESG、宗教、动物权益等

画像越具体，模型越容易避开看似正确、实则不适合你的标准答案。问题要具体（交代行业、风格、期限、排除项）、语言要准确（专业术语越清楚结果越贴近专业语境）、可给参考案例（“像 Netflix 早期那样的商业模式”）。

第 9 章 — AI 代理

AI agent 的增量价值，不是让模型更聪明，而是给它补上记忆、工具、流程和角色分工，把一次性问答变成可复用研究系统。

9.1 要求

单轮 prompt 像记者在发布会上只能问一个问题；复杂研究要让模型能追问、取数、复核和迭代。

要素	缺了会怎样	常见补法
记忆（Memory）	LLM 不会从单次对话中永久学习，上一轮洞察不会自动带到下一轮	用检索增强生成（RAG）或显式上下文给模型补“外部记忆”
外部信息接入	训练截止后的数据、私有数据、专有系统都不在模型脑中	接网页搜索、API、数据库、邮箱、消息记录或模型上下文协议（MCP）
策略（Strategy）	多模型堆在一起只会产生更多输出，不会自动产生更好结论	明确任务拆分、调用顺序、复审机制和最终汇总逻辑

9.1.1 Agentic design patterns

模式	作用	投资研究里的典型用法
反思（Reflection）	根据结果回看动作并调整下一轮策略	交易机器人收盘后复盘收益、风险暴露和执行偏差
工具调用（Tool use）	把取数、计算、搜索等任务外包给专门系统	调新闻 API、股价接口、情绪分析工具
规划（Planning）	先拆目标，再按依赖执行多步流程	先拉财务数据，再扫新闻，再排序并发提醒
多代理协作（Multi-agent）	让多个角色分工后再汇总结论	多头代理找上涨逻辑，空头代理找风险，裁判代理做最终判断

一个完整参考流通常是：触发器（定时 / 用户提问 / 告警）→ 检索（RAG / Web / MCP）→ 生成（一个或多个 LLM）→ 复审（额外 LLM 或规则）→ 输出（Notion、数据库或消息渠道）。

9.2 Prompt 仓库（Prompt repository）

不引入专门框架也能做 agent，但至少要先把 prompt 资产管理起来。

字段	作用
`id`	标识提示词用途，如 `swot_analysis`、`porter_5_forces`
`prompt`	可复用正文，支持 `{company}` 这类占位符
`tag`	按行业、场景、催化剂等维度检索提示词

prompt 仓库是研究资产，不是临时聊天记录；同一条 prompt 应能在 Apple、Alphabet 这类相似场景间复用
仓库建设的关键，是找到“足够具体但仍可复用”的平衡；最简数据库模型只要 prompt 表和 tag 关联表，重点不在 schema 复杂，而在能稳定重取和重用

9.3 结果落库与研究留痕

多 LLM 研究如果不及时落库，prompt 和回答很快会散落在不同聊天界面，后续几乎无法追溯。

步骤	关键点
创建页面	用 `ticker + 日期 + prompt_id + LLM` 组成标题，方便回溯研究上下文
写入内容	先写 prompt，再写 answer，保留“问题→回答”的审计链
分块提交	Notion 单次写入上限约 2,000 字符，长文本必须拆块
统一归档	按标签、创建时间、最后编辑时间筛选，研究记录不会散落在各个平台

Notion 在这里不是普通笔记软件，而是研究日志数据库：统一入口、统一检索、统一留痕。

9.4 框架的价值

框架的价值，不是替代研究逻辑，而是把“调用模型、接工具、串步骤、记录执行过程”这些脏活抽象掉。

路径	优势	代价
n8n 这类 no-code 工具	上手快，适合拖拽出第一版工作流	一旦要做生产级定制，缺失能力可能让后续补洞更慢
LangChain 这类代码框架	统一不同模型和工具的调用方式，方便接 provider、agent 和执行链	仍然要理解状态、检索、编排和调试过程

代理执行日志很重要：能看到它为什么调用某个工具、拿到了什么数据、最后怎样形成答案，调试才有抓手

9.5 检索增强生成（RAG）

RAG 补两类缺口：训练截止后的新数据，以及私有数据。关键洞察：上下文会直接改变结论——同样问自动驾驶公司，偏好 LiDAR 和反对 LiDAR 会导向不同推荐；研究质量最终取决于拿到了什么上下文，以及问了什么问题。

第 10 章 — 图表与技术分析

图表的价值，不是预测未来，而是把价格、时间和市场情绪压成一眼能读的结构。

10.1 图表解读框架

同一段跌幅在指数/个股、危机日/五年维度里意义不同；第一层不是下结论，而是判断跌了多少、多快、相对历史是否异常。

形态（双顶、头肩顶、旗形等）本质是被反复模仿的市场脚本——有效部分来自足够多人相信，不是自然规律；持有周期越短越依赖形态，长线可参考但不必把买卖点完全交给图形。

视角	看到上涨后的反应
均值回归	涨多了就该回落，倾向卖出
动量	趋势未坏就继续持有甚至加仓
逆向	大众一致时反而寻找反方向机会

同一张图会导出相反建议：图表不显影策略，只显影不同策略的冲突。

线图讲单资产时间故事；树图（Treemap）看全市场涨跌热力分布，柱状图和直方图看类别内部分布，散点图按风险/收益/估值等维度做多资产横向比较。

10.2 常用技术指标

K 线用 OHLC 压缩一个时间窗口，比折线更适合读情绪与波动：长影线表某价位被强烈拒绝，小实体偏犹豫，大实体偏单边（影线长 = 冲上去又被打回；实体小 = 开收接近；实体大 = 一边倒）。

均线用于抹平噪音、读出趋势；SMA 稳但慢（长期趋势），EMA 对近期权重更高（短线动量）；不存在放之四海皆准的最佳参数，窗口本身即策略的一部分。布林带看波动率与相对极值（本质测偏离均值，非”碰到就反转”），MACD 看两 EMA 相对关系；单指标易假信号，须搭趋势背景或基本面。

第 11 章 — 算法交易

算法交易不是把买卖自动化，而是先把“什么信号值得行动、如何验证、怎样执行”写成可以复查的规则。

11.1 非财务数据

交易信号可扩展到财报与价格之外；真正稀缺的优势往往来自别人还没系统利用的数据。当公开财务与常见技术指标已被充分消化，这类优势更常体现为媒体、位置移动、人口、政策舆情等场外信息。难点在获取、清洗、持续更新与跨期可比，而非理论价值。假说与证据链与第 4 章同一逻辑（先立假说，再反推所需数据）；数据并非越多越好。

11.1.1 先有 thesis，再找可采信号（例：Waymo）

把“Waymo 会成为 Google 重要增长引擎”拆成可观察指标：

thesis 要验证什么	可采信号
使用量在增长	每周订单量、服务城市扩张
安全性在改善	事故报道数量、监管态度
社会接受度在提升	媒体提及频率、情绪倾向
商业价值在提升	新合作、付费模式、部署密度

11.1.2 常见非财务数据源

数据源	适合回答的问题
媒体 / 社交媒体 / 博客 / 视频转录	市场情绪、叙事变化、品牌热度
地理与移动数据	线下客流、设备部署、车流和物流变化
卫星 / 图像数据	厂房活动、库存变化、资产利用率
人口与行为数据	长期需求变化、用户结构迁移

价值高度依赖行业（消费品偏舆情，工业/能源偏地理与政策）；门槛在稳定变成可比较的时间序列，而非“知道这些数据存在”。

11.2 催化剂

催化剂是价格短期剧烈偏离常态的触发器，适合事件驱动策略；本质不是猜事件是否发生，而是判断一旦发生，价格相对预期偏离多大。同一催化剂可对应短线动量或中长期结构性方向。

催化剂	为什么会剧烈影响价格	策略提醒
并购（M&A）	估值、协同和整合预期瞬间变化	看交易条款，也看文化和执行风险
困境/破产	市场先按最坏情况抛售	可能有“烟蒂机会”，但股权也可能归零
财报电话会	盈利超预期/不及预期迅速改写预期	重点看 surprise 和管理层口风
灾害 / 战争 / 疫情	需求和风险暴露重定价	往往同时制造受害者和受益者
利率变化	贴现率、融资成本、风险偏好一起变	高资本消耗公司最敏感

11.3 把信号写成策略

11.3.1 回测

回测目标不是证明“能赚钱”，而是先过滤明显无效的想法；更像过滤器，不是生产许可证。书里用 SMA 短上穿长买入、下穿卖出 说明最经典规则也未必稳赢基准；参数优化可改善历史表现，也带来过拟合。

回测必须回答的问题	否则会出什么错
买卖信号是什么	规则模糊，无法复现
基准是什么	不知是否优于买入并持有
交易成本怎么算	纸面盈利可能被手续费吃掉
滑点、价差、税怎么处理	实盘系统性差于回测

11.3.2 复杂信号可以做成评分卡

买卖规则不必来自单一指标，可把多类信号压成评分；前提是每项可量化、可比较、可回看。数据源或覆盖一变，历史分数可能不可比——复杂策略的难点是让输入长期稳定，而非 if/else 本身。

信号类型	例子
价格行为	趋势、动量、波动率异常
文本信号	新闻关键词、情绪分数、管理层语气
内部人交易	高管或机构增减持
链上/另类数据	大户转账、解锁、异常流动

11.4 下单与执行

交易所撮合买卖，券商是散户接市场的接口与托管者。股票与加密在监管、托管、可追责性上差异大，不能当同一基础设施。高频交易拼低延迟与执行工程，与普通 Python 脚本不同层级。

订单	作用
市价单（Market order）	立刻成交，优先速度
限价单（Limit order）	到指定价格才成交，优先价格
止损单（Stop order）	到某阈值后触发卖/买，优先风控
止损限价单（Stop-limit）	先触发，再按限价成交，防极差价格
跟踪止损（Trailing stop）	止损随价格上移，保护浮盈

条件	含义
FOK（Fill or Kill）	要么整笔立刻成交，要么取消
GTC（Good ‘til Canceled）	持续有效直到成交或手动取消

订单类型决定何时出手，附加条件决定怎么成交；风控常落在下单参数里。券商与 API 选型见第 6 章数据管线，API 只解决自动提交，执行自动化前研究与风控须先过关。

第 12 章 — 私募股权：投资初创公司

投资初创公司，押注的不是产品演示，而是创始人、商业模型与退出路径能否撑得起多年锁仓和极高失败率。

12.1 从想法到 IPO

阶段	公司状态	投资人关注点
Pre-seed	为 MVP 争取时间，资金覆盖云、销售、基础运营等	赌人：执行力、抗压、投入、商业直觉；零碎帮忙不换大额股权；熟人信任下仍要区分「可放大的商业模型」与「昂贵爱好」
Seed	MVP、已注册、有早期客户验证	路演上看团队气质、市场叙事、产品可交付性；是否有真实客户、复制与扩张速度，让下一轮资金愿意接盘
Series A	员工与早期客户，验证商业模型	产品与获客机制能否放大
Series B	模型跑通，向新市场扩张	组织化运营与更清晰盈利路径
Series C	已占稳定市场位置	国际化、并购或最终 exit

孵化器/加速器加速学习与资源接入，不能替代商业验证，更像 deal flow 过滤器
越往后失败概率越低、资金需求越大，资本从个人/天使转向机构；VC 除资金外带来法务、财务、招聘、后续融资与 exit 的组织能力
整条路径被 exit 支配：目标是做成可被收购或上市的资产，而非慢慢做小而美

退出（Exit）

退出方式	含义	对投资人
IPO	上市后股权可流通	高回报
Acquisition	被收购	高回报
Fire sale	困境低价出售填债	部分回收
Shutdown	关停清算	基本归零

多年锁仓、高失败率，靠少数高回报 exit 覆盖整体；VC 往往不偏好增长慢但已盈利、分红小、退出弱的小生意
回报更接近「谁会买、为何买、团队是否有 acqui-hire 价值」，而非创始人自述愿景

12.2 投资载体

未上市信息不透明、定价未充分发现，押中则涨幅可能远超二级市场；代价是高风险、低流动性、长期不确定。

载体	典型阶段	适合谁	关键代价
VC 基金	Series A 及以后为主	大额、想分散多项目	门槛高；2% 管理费 + 20% carry 常见
天使 syndicate / SPV	Pre-seed 至成长	小资金跟 lead	单项目风险高；常有一次性 setup 费与 carry
主权财富基金（SWF）生态	国家扶持创新	个人不可直接投，可顺生态找机会	取决于本地政策与网络

VC 基金打包多项目，靠少数赢家覆盖失败；个人难进顶级 LP，常经高净值 fund manager；管理费 + carry 买的是筛选、投后与 deal access
天使 syndicate：lead 谈妥后 LP 经 SPV 合投，cap table 上单一实体；有关闭时间、最小票额与一次性费用，本质是跟投专业人士而非主导投后
早期财务噪音大，判断常回到创始人：诚信、韧性、领导力、工作强度、在正确市场里长期推进的能力

12.3 评估初创公司

12.3.1 估值与稀释

方法	能回答什么	局限
可比公司（CCA）	相似公司大概值多少	可比样本难找，数据多不公开
可比交易	类似交易价格	历史未必适合当前周期
VC Method	目标 exit 能否支撑当前估值	对回报率与 exit 假设敏感
DCF	现金流折现估内在价值	早期收入、成本、折现率极不稳定

早期难直接套 P/E、EV；DCF 的价值主要在摊开假设——增速、费用、折现率、终值略动，估值就可能大变
早期价格多是谈判锚点；最终取决于市场愿意为这个故事付多高溢价
融资增发导致持股比例下降（dilution）；若换来客户、市场与更高估值，更小比例的更大公司 仍可能优于 100% 持有一个弱公司
危险是反复融资却无商业进展，在价值未放大前提下被持续摊薄

12.3.2 评分卡：把「凭感觉」拆成可比较维度

维度	为什么重要
孵化器 / 加速器背景	初筛信号
创始人和顾问	执行与抗风险
既有投资人	外部背书
客户与战略合作	需求验证
团队来源国与注册地	人才、税制与融资环境
赛道	技术周期、赔率与风险
监管强度	时间成本与失败率
经济护城河	成功后的利润防守
资本密集度 / burn rate	runway 压力
商业模型 / 网络效应 / North Star Metric	放大能力

程序员可把非财务信号系统化（抓取、权重、迭代）；评分卡减少被路演 charisma 牵着走，但不消灭主观判断

第 13 章 — 路还很长

学会分析资产只是起点，真正决定长期结果的，是你是否愿意求证、保持节制，并在大多数时候接受指数基金这个默认答案。

13.1 求助，但别外包判断

书与 AI 可建框架，时点敏感的真实决策仍须自己承担
最危险是略懂就高估；低仓位试错优于一上来重仓交学费
大额决策值得花时间/钱问税务、财务与有经验同行；税制与身份约束会直接改变真实收益

13.2 生活方式与价值选择

任何”先移居再节税”的故事，签证、税务居民、合同限制、汇率与通胀没算清前都不成立
买入不只是买现金流，也是在为公司的行为与方向投票；在小公司与私募股权里影响会放大，但 activist stance 往往与回报目标冲突

13.3 纪律与能力边界

peer review、延迟下单、把 thesis 说给别人听、做复盘——防止情绪接管的低成本刹车；组合复杂到记不清持有理由就已失控，宁可少而精
长期稳定跑赢者极少；80% 指数 + 20% 主动尝试 是合理起点，复杂模型不自动带来更高回报，多数人的瓶颈是纪律
投资若占满注意力，会吞掉财富本该换来的自由