大纲
Stefan Papp 是程序员出身的投资者,核心问题是:如何把编程、数据分析和 AI 能力转成投资优势。全书按”认知→工具→实战→进阶”展开,主线是用工程思维替代直觉决策。
基础篇(第 1-3 章)
| 章 | 主题 | 关键概念 |
|---|---|---|
| 1 | 分析型投资者 | 资产分类、投资 vs 交易 vs 赌博、成长/价值/收入三大风格、核心-卫星组合、程序员的不公平优势 |
| 2 | 投资基础 | 三张报表、FCF、GICS 行业分类与经济周期、市值分层、关键指标(P/E、PEG、D/E、ROE)、分红与回购、外部评级的局限 |
| 3 | 数据收集 | 金融数据三类(基本面/技术/非财务)、数据源选型、时间序列分析、归一化、对数收益率 |
组合篇(第 4-5 章)
| 章 | 主题 | 关键概念 |
|---|---|---|
| 4 | 成长型组合 | 投资假说、SWOT、LiDAR 案例、三种决策路径、退出条件 |
| 5 | 收入型组合 | 股息、债券、加密货币质押、提前退休 |
工程篇(第 6-7 章)
| 章 | 主题 | 关键概念 |
|---|---|---|
| 6 | 构建资产监控器 | 持仓采集、数据聚合、可视化、被动收入追踪、收益预测 |
| 7 | 风险管理 | 止损、风险度量、对冲、组合优化、再平衡 |
AI 篇(第 8-9 章)
| 章 | 主题 | 关键概念 |
|---|---|---|
| 8 | AI 金融研究 | ML 局限、监督/无监督学习、LLM 研究助手、投资者画像 |
| 9 | AI 代理 | 反思、工具调用、规划、多代理、RAG |
交易篇(第 10-11 章)
| 章 | 主题 | 关键概念 |
|---|---|---|
| 10 | 图表与技术分析 | K 线、形态识别、均线、布林带、MACD |
| 11 | 算法交易 | 非财务数据、催化剂、回测、交易信号、订单类型、API 下单 |
进阶篇(第 12-13 章)
| 章 | 主题 | 关键概念 |
|---|---|---|
| 12 | 私募股权:投资初创 | 初创生命周期、估值、股权稀释、初创评分 |
| 13 | 路在脚下 | 寻求专业建议、保持好奇、行为金融控制、指数基金作为安全底线 |
前半本讲公开市场和研究流程,后半本扩展到工具、AI、交易和私募;结尾落回行为控制。
第 1 章 — 分析型投资者
程序员的投资优势不在胆子更大,而在能把研究、决策和执行做成系统。
被动收入是程序员突破职场天花板的替代路径:覆盖部分必要开支时,自由就开始了。知道自己随时能离开一份高薪但压榨灵魂的工作,这种底气本身就是解脱。
1.2 资产
| 变现路径 | 机制 |
|---|---|
| 资本增值 | 低买高卖 |
| 被动收入 | 利息、租金、分红 |
| 投资前三问 | 判断标准 |
|---|---|
| 风险承受力 | 能承受多大损失而不焦虑 |
| 财务目标 | 时间跨度 × 目标收益 |
| 时间投入 | 盯盘侵蚀生活说明策略要调 |
| 资产类型 | 核心机制 | 被动收入 |
|---|---|---|
| 股票(Stocks) | 公司所有权(equity),股价由供需驱动 | 股息(dividend) |
| 债券(Bonds) | 借钱换定期票息(coupon)+ 到期返本 | 票息 |
| ETF | 一篮子证券,天然分散,多数被动跟踪指数 | 分红(分配型 ETF) |
| 期权(Options) | 付权利金获买/卖权利(非义务) | — |
| 加密货币(Crypto) | 区块链数字资产,无中介点对点交易 | 质押(Staking) |
| 私募股权(PE) | 未上市公司,流动性最低,回报潜力最大 | — |
债券收益率和信用风险正相关,美国国债是无风险基准。期权买方风险有限,卖方风险敞口更大。股息策略至少要跑赢无风险收益率,否则连通胀都难覆盖;而证券的优势在于门槛低、流动性好、可扩展。
1.3 投资方法
| 类别 | 特征 |
|---|---|
| 赌博 | 凭直觉决策,受认知偏差驱动 |
| 投资 | 长期视角,依赖分析和批判性思维 |
| 交易 | 利用短期波动,频率高、风险大 |
定量研究看数字,定性研究解释原因;AI 提高效率,但不替代判断(角色边界见第 8 章)。交易按频率分为日内、波段、算法和高频;做多赌涨,做空赌跌。回测(Backtesting)则用历史数据检验策略。
三大投资风格
| 属性 | 成长型(Growth) | 价值型(Value) | 收入型(Income) |
|---|---|---|---|
| 目标 | 资本增值 | 资本增值 | 持续现金流 |
| 关注 | 未来潜力 | 被低估的”便宜货” | 稳定现金分配 |
| 典型公司 | 高速扩张 | 成熟但暂不受欢迎 | 成熟、高现金流 |
| 分红 | 低或无 | 通常有 | 高且稳定 |
| 关键指标 | 高营收增长、高 P/E | 低 P/E、低 P/B | 高股息率 |
| 风险 | 高 | 低到中 | 低 |
合理价格成长策略(GARP)是成长和价值的折中;Peter Lynch 的提醒也一样:对某个领域的专业知识,本身就是投资优势。
对冲本质上是买保险。过去回报不保证未来,价格也不只受基本面驱动,社交媒体和情绪同样会放大波动;因此真正有用的不是预测,而是在情绪极端时保持反身性。
核心-卫星组合(Core and Satellite)
核心仓位(Core)负责长期持有和复利增长,卫星仓位(Satellites)负责短期交易和现金流补充。
1.4 程序员的不公平优势
基本面分析像 debug:先拆解业务,再判断价值;而编程擅长构建规则系统,这正好对应投资纪律。
| 特质 | 投资映射 |
|---|---|
| 耐心和纪律 | 投资是最高形式的延迟满足 |
| 抽象思维 | 习惯处理 API 和数据结构,理解无形资产更容易 |
| 前沿视角 | 身处 AI、VR、biotech 前线,有领域判断力 |
投资策略应和人生选择对齐。
第 2 章 — 投资基础
基本面分析的顺序是:报表 → 行业 → 指标 → 同行业横比。
2.1 会计基础
财务报表就是公司的源代码,主流标准是 GAAP 和 IFRS。
| 报表 | 核心问题 |
|---|---|
| 损益表 | 赚了多少 |
| 资产负债表 | 有什么、欠什么 |
| 现金流量表 / 自由现金流(FCF) | 能自由支配多少现金 |
读财报时只抓四件事:净利润不增长,真实购买力就在缩水;同一组数据要同时能讲出看多和看空两套故事;指标只能放在同行业里比,流动性往往比账面财富更暴露风险;**资本性支出(CapEx)**低也未必代表更轻,可能只是把成本转进了运营费用。
2.2 行业分类
GICS 把股票分到不同板块;关键不是记分类细节,而是知道不同板块受不同宏观因子驱动。
只投自己理解的业务;数字必须放回商业模式里读。
经济周期与行业表现
经济周期分扩张、顶峰、收缩、谷底;周期性行业在衰退期更脆弱,防御性行业更稳。已知的板块驱动因子还可以直接转成 ML feature,把宏观认知变成可回测信号。
市值 = 流通股 × 股价;规模越大越稳,规模越小波动越大但上行弹性也更强。市值不是内在价值,机会来自两者的偏离。
2.3 指标与比率
没有单一指标能定义好公司,关键是指标组合、行业横比和历史变化。
| 类别 | 指标 | 判断要点 |
|---|---|---|
| 流动性 | Current ratio / Quick ratio | 都看短期偿债能力,后者更严格 |
| 债务 | D/E / Interest coverage | 先确认口径;利息覆盖率 < 1.0 是红线 |
| 盈利 | EPS / ROA / ROE / Margin | 看盈利质量和资本使用效率 |
| 估值 | P/E / PEG / P/S / P/B | 行业横比 + 历史纵比,不同阶段用不同指标 |
| 分红 | Dividend yield / Payout ratio | 高股息未必安全,削减分红是警告 |
| 股权 | Float / Outstanding | 增发稀释,回购提升每股价值 |
指标使用原则
指标选择本身就是叙事:选什么指标,就会看到什么公司。股东回报主要看分红和回购,辅助信号再看内部人交易、SBC 和同行业 ESG。外部评级只作参考,分析师、机构和量化模型经常互相矛盾,最终仍要自己判断;投资不追求每次都对,而追求胜率和分散化的组合。
多元化没有通用答案;关键是新业务能否延续原有优势。
第 3 章 — 数据收集
数据源的核心问题不是便宜,而是能否稳定支撑研究流程。
3.1 数据源与分析方法
| 类型 | 特征 |
|---|---|
| 基本面 | 低频、可审计 |
| 技术 | 实时、延迟敏感 |
| 非财务 | 非结构化、需挖掘 |
AI 提高了非结构化数据的可用性,非财务数据因此更重要。数据源选型只看一条:原型阶段用免费接口,正式使用切到稳定的数据源或抽象层工具。
关键分析方法
分析时先看序列,不看点值:单个指标要放回多年区间里看,波动本身不等于风险恶化。跨股票比较前先做可比性,归一化到同一起点;收益率分析优先用对数收益率。波动判断还要看时间窗口,不看单年快照。
第 4 章 — 成长型投资组合
可复用的研究框架:想法→SWOT 挑战→缩窄焦点→候选筛选→多维分析→风险审视→持续监控→耐心等待。
4.1 投资假说
投资假说就是一套可被质疑的买入逻辑;买入前先定义目标,退出条件与三条路径见 §4.3。
对行业越陌生,越容易高估自己,所以最好从真正懂的领域出发,再用 SWOT 把宽泛主题缩窄成具体标的;最后只看三问:现金流、护城河、安全边际。
4.2 案例与方法论启示
LiDAR 案例演示了完整流程:从大主题缩窄到细分供应商,再比较技术、财务、管理层和风险。结论不是买入,而是继续观察。
四条要点:研究完仍不确定就先不出手,次优机会会占掉未来弹药;风险研究比收益想象更重要,个人可用”换日换角色”替代机构里的多空分工;信息源优先级是专业报刊 > 分析师 > Reddit > 公司 IR;追踪假说前先定义衡量标准。
4.3 决策路径
面对”有前景但不确定”的标的,决策无非三条路:大胆型直接建仓,前提是真懂;谨慎型继续研究或放弃,代价只是错过;混合型小额建仓边持有边研究,代价是仓位大小难拿捏。
无论哪条路径,提前定义退出条件(止盈、止损、时间窗口)比选路径本身更重要。
投资和创业都在找好机会;区别只是投资者不亲自运营。
没有想法时,就从自己熟悉的行业和技术主题开始。
第 5 章 — 收入型投资组合
收入型组合的关键不是追高收益,而是识别现金流背后的风险来源和可持续性。
5.1 股息
分红能力主要由生命周期、行业结构和护城河决定:成熟期、再投资需求低、现金流可预测的公司最适合做股息资产。现金牛(Cash Cow)是理想股息标的,行业也比规模更能决定分红倾向,公用事业通常比科技公司更适合。
护城河越深,分红越可持续;高股息本身不是护城河。
股息筛选指标
| 指标 | 判断要点 |
|---|---|
| 年度派息 / 派息频率 | 看现金流节奏是否匹配需求 |
| 股息率(Dividend yield) | 高股息率可能只是股价下跌 |
| 股息增长年数 / 增长率 | 看分红是否长期稳定 |
| 派息比率(Payout ratio) | 越低越有余地 |
| 公司注册地 | 直接影响税负 |
低派息比率 + 稳定分红历史,才值得深挖。
REIT 的优势是高分配率、不动产敞口和流动性,适合补充稳定现金流。
5.2 债券
股票是所有权,债券是借贷;债券回报来自票息和价格变化。普通债券(Vanilla bond)就是固定付息、固定到期,其他变种只是偿付和担保条件不同。
债券核心属性
| 属性 | 说明 |
|---|---|
| 借款方 | 联邦政府 / 市政 / 企业 |
| 到期日 | 数月到数十年 |
| 票息 | 固定或浮动 |
| 信用评级 | 投资级与投机级的分界线最重要 |
| 支付方式 | 付息频率和方式 |
债券回报不只来自票息,也可能来自折价买入后的资本增值。美国国债按期限分为 T-Bills、T-Notes、T-Bonds;利率是债券市场的总开关,加息会压低旧债价格,也会推高违约风险。
提前卖出债券不是对错问题,而是机会成本判断。
信用违约互换(CDS) 本质上是债券违约保险,也能被用来表达做空信用风险的观点。
5.3 加密货币质押
5.3.1 密钥与交易所
核心区别只有一条:把币放在交易所是用便利换托管风险,自管私钥才是真正控制资产。FTX 暴露了第三方托管的系统性风险;硬件钱包和软件钱包把风险收窄到市场波动和链上安全。
5.3.2 挖矿与质押
| 机制 | 共识协议 | 特征 |
|---|---|---|
| 挖矿(Mining) | PoW | 用算力解数学题验证交易,需硬件+电力的大额前期投入 |
| 质押(Staking) | PoS | 锁定代币支持网络验证交易,能效高但有最低持仓要求 |
自建验证节点门槛高,多数人只能委托第三方验证者,用佣金换便利。质押的三类风险是流动性锁定、收益率浮动和高通胀稀释;APY 越高,通常越要警惕后两者。
稳定币质押只消除了币价波动,不消除利率波动和平台风险。
5.4 提前退休
财务独立的简易公式是 年支出 ÷ 预期收益率 = 所需本金;5% 是常见保守估算,但还要再扣掉通胀。年龄越大,配置越应向被动收入倾斜;但长期看,成长型 ETF 往往因复利跑赢固定收益组合。收入型配置的价值,是避免在最差时点被迫卖出成长资产。
第 6 章 — 构建资产监控器
资产监控的核心不是做报表,而是把分散在不同平台、不同币种、不同资产类型的持仓压成统一视图。
6.1 架构
| 层 | 作用 | 关键对象 |
|---|---|---|
| 数据源 | 收集线上和线下持仓 | 券商 API、交易所 API、offline_asset |
| 规范化 | 统一字段 | ticker、持仓数量、平均买入价、交易所、来源 |
| 富化 | 补估值和收益数据 | Yahoo Finance、Google Finance、CoinMarketCap |
| 导出 | 写入不同工作表 | stock、etf、bond、crypto、assets |
- 难点不在展示,而在统一模型;字段对齐后,分析、汇总和导出都能复用
- 没有 API 的资产也要入表,
ticker仍是最稳的主键;Google Sheets 只是展示层,导出值是快照,Live列补实时行情
6.2 数据管线
先定义统一字段,再为各券商和交易所写适配器。
| 统一字段 | 用途 |
|---|---|
ticker | 资产唯一标识 |
| 持仓数量 | 计算总价值和总收益 |
| 平均买入价 | 计算历史收益 |
exchange | 推导币种并做汇率转换 |
broker | 标记数据来源,便于排错 |
asset_lookup负责三件事:标记资产类型、归属组合、把券商 ticker 映射到行情平台符号(如BRK.B→BRK-B)- 映射完成后,才能稳定补价格、汇率和收益指标
- 选券商不能只看手续费;API 质量、自动化友好度和平台可信度同样重要。
Alpaca更现代,Interactive Brokers更强但依赖本地 TWS 桥接
6.3 资产处理
先统一采集和估值口径,再按资产类型挂不同指标。
| 资产 | 处理重点 |
|---|---|
| 股票(Stocks) | 补行情、统一币种、聚合到整仓;核心口径是 总成本、总市值、总股息、历史收益和潜在收益,组合看绝对金额,个股看百分比 |
| ETF | 复用股票流程,但更关注 净值(NAV)和 yield;股票分红、债券票息、加密质押奖励在监控层都可统一为 yield |
| 债券(Bonds) | 更像按单次发行建档,常见标识是 ISIN;重点监控面值、本息回收和年化票息,收益率维护在离线表即可 |
| 加密货币(Cryptocurrencies) | 视图必须同时覆盖交易所持仓和链下自托管持仓;Google Finance 支持不足,要改用专门数据源;质押奖励可记作 yield,但稳定性远不及债券票息 |
- 统一视图建立后,风险分析、估值面板、ESG 和自定义预警都只是往同一管线上挂模块
- API key、交易所密钥和表格凭证都属于敏感信息;资产监控首先是自动化系统,其次才是投资工具
第 7 章 — 风险管理
风险管理不是押注更少,而是先定义跌倒时怎么收伤,再决定能承受多大的上行诱惑。
7.1 基本防守(Ukemi)
作者把风险管理比作武术里的 Ukemi:先学会安全落地,再谈进攻。投资里的第一层防守不是预测对错,而是先画出损失边界。
7.1.1 止损
- 止损单(Stop-loss)最直接的作用,是预先告诉券商:跌到某个价位就自动卖出
- 上涨后可同步上调止损位,把“继续持有”和“锁定部分利润”合成一个机制
- 但止损不是无脑全覆盖,至少要同时考虑税负、交易成本和被短期波动洗出去的风险;长期持有优质公司时,它更像风控旋钮,不是唯一纪律
7.1.2 风险分类
| 风险层级 | 含义 | 典型例子 |
|---|---|---|
| 市场风险(Market risk) | 整体市场下跌拖累多数资产 | 衰退、地缘冲突、情绪崩塌 |
| 行业风险(Sector risk) | 某一板块一起受冲击 | 监管收紧、技术替代、需求转向 |
| 个股风险(Asset-specific risk) | 公司自身出了问题 | 管理失误、产品失败、财务恶化 |
- Bikeshedding 在投资里同样常见:盯着某只股票 5% 波动,却忽视另一家持仓的基本面已经坏掉
- 风险要先分层再处理:先看会不会把整个市场一起拖下去,再看它在自己组合里会放大成什么损失;长期看,稳定复利通常优于靠几次暴击换高收益
7.1.3 风险测量
| 工具 | 回答的问题 | 用法 |
|---|---|---|
| 风险矩阵 | 哪些风险最该先处理 | 按影响程度 × 发生概率排序,再预设动作 |
| Beta | 资产对大盘波动有多敏感 | >1 比大盘更激进,<1 更稳健 |
| 原则清单 | 事情变坏时该怎么做 | 提前定义“到什么等级就减仓 / 清仓” |
- 风险评估不是为了算准未来,而是提前写好“如果发生,我怎么办”;真到高压时刻,靠原则往往比靠临场理性更可靠
7.2 个股与组合的风险画像
7.2.1 风险价值(VaR)
风险价值(VaR)回答的是:在给定时间窗口和置信水平下,正常情况下最糟可能亏多少。
| 要素 | 作用 |
|---|---|
| 时间窗口 | 看一天、一周还是一个月 |
| 置信水平 | 常见是 95% 或 99% |
| 模拟方法 | 方差-协方差法、蒙特卡洛模拟(Monte Carlo) |
- VaR 适合把历史波动压成“正常时期的最坏日常损失”;黑天鹅(Black Swan)这类极端异常事件通常仍在模型外
- 组合层面可先算单资产 VaR,再聚合成整仓风险承受图
7.2.2 相关性
- 相关性看的是资产是否一起涨跌,而不是谁绝对价格更高
- 协方差(Covariance)回答“是否同向”,相关系数(Correlation)回答“同向到什么程度”
- 同属同一叙事的公司往往高度相关;表面分散、实则仍押在同一条赛道。找到低相关甚至负相关资产,会牺牲牛市爆发力,但能显著降低坏年份回撤
7.3 人是最大的风险源
7.3.1 疏忽与偏差
- 技术风控再严,也挡不住人的贪婪、恐惧和 FOMO
- 组合跟踪、交易日志、回顾机制,本质上是在给自己的情绪做审计
- 券商的风险画像、冷静期、交易限制都不是多余摩擦,而是在情绪上头时替你踩刹车
7.3.2 回避高风险
| 方法 | 适用场景 |
|---|---|
| 指数基金 | 不想押单一公司生死,但想拿到市场平均收益 |
| 定投(DCA) | 担心一次买在高点,希望平滑择时风险 |
| 安全边际(Margin of safety) | 做价值投资,要求买价低于内在价值 |
| 主动 + 被动组合 | 一边拿基准收益,一边保留主动超额空间 |
- 风险偏好(Appetite)是“愿不愿赌”,风险承受力(Capacity)是“赌错后扛不扛得住”
- 长线投资、短线交易、杠杆和做空面对的风险结构完全不同,不能混用同一套纪律
7.3.3 韧性
- 很多投资者更愿意卖掉赚钱的仓位,而不是承认亏损仓位已经坏掉,这就是 损失厌恶(Loss aversion)
- 更好的提问方式不是“它还能不能回本”,而是“如果现在没持有,我还会不会买它”
- 同行复盘、可信的外部意见和机械化原则,都是对抗沉没成本的工具
7.4 对冲
对冲的本质是牺牲一部分上行,换取在坏情形下不致命。
7.4.1 衍生品
| 工具 / 策略 | 用途 | 核心风险 |
|---|---|---|
| Put / Call 期权 | 锁定买卖价格区间 | 买方损失有限,卖方尾部风险高 |
| Covered call | 持股赚权利金 | 大涨时上行被封顶 |
| Cash-secured put | 想低价接货时先收权利金 | 暴跌时被迫接刀 |
| Iron condor | 押震荡、赚时间价值 | 单边大行情易亏损 |
| Futures / Swaps | 锁价格或现金流敞口 | 杠杆和结构复杂 |
- 衍生品不是免费保险,而是把风险从一种形式换成另一种形式
- 卖期权赚的是稳定小钱,承担的是尾部大亏;没吃透义务结构前不要把它当“被动收入工具”
7.4.2 分散、配对与风险配比
- 分散化(Diversification)不是多买几只同一主题股票,而是减少对单一叙事、单一行业、单一宏观情景的依赖
- 配对交易(Pair trading)通过一多一空,把押注从“市场整体涨跌”转成“谁相对更强”
- 风险配比(Risk pairing)更适合个人投资者:用稳定资产托底,再用小比例仓位下注高风险机会
- 如果 80% 仓位在指数和稳健资产,20% 仓位押新技术,即便高风险部分归零,也不会伤到根基
7.5 非财务风险
非财务风险的难点不是不存在,而是难以像报表指标那样标准化。
- 这类风险通常没有统一数据库,更多依赖案例类比、舆情分析和主观判断
- 私人投资者不必追求机构级完整模型;先列出最可能伤到自己组合的 3-5 个非财务风险,再持续观察市场、失业率、收益率曲线和政治变化给出的信号
7.6 组合优化
7.6.1 Markowitz 有效组合
- 现代投资组合理论(MPT)的目标是:在给定风险下争取最高收益,或在给定收益下争取最低波动
- 有效前沿(Efficient frontier)展示的是一组“风险-收益最优”的组合
- 实操上常用历史收益、协方差矩阵和大量随机组合做 蒙特卡洛模拟,再挑候选组合;真正常落脚的往往不是“理论最高收益”,而是 夏普比率(Sharpe ratio)最高的组合,因为它衡量单位风险换来多少超额收益
7.6.2 CAPE 与资产配置
| 指标 | 用途 | 常见解读 |
|---|---|---|
| Shiller P/E / CAPE | 用 10 年真实盈利平滑周期噪音,判断市场整体估值 | 高 CAPE 代表估值偏贵,低 CAPE 代表估值偏便宜 |
| 无风险利率 | 判断冒险值不值 | 风险资产回报至少该高于 T-Bills |
- CAPE 更适合做宏观仓位调整,不适合拿来预测短期拐点
- 一种常见做法是:先用 CAPE 决定股票 / 债券 / 黄金的大类配置,再在股票内部用夏普比率做微观优化
7.6.3 再平衡
- 再平衡的目标是防止组合被赢家一路带偏,最后变成“表面持有多资产,实则单一暴露”
- 常见触发方式有三种:定期、阈值、混合
- 再平衡不是机械卖强留弱,而是让仓位回到最初的风险设计;交易成本、税负和整股限制都会影响精度,现金流稳定的人还可以用“只拿新增现金补偏离仓位”代替大量卖出
第 8 章 — AI 金融研究
AI 在投资里的最佳位置不是替你拍板买卖,而是把筛选、取数、总结和尽调提速,让判断回到人手里。
8.1 ML 在金融的边界
无监督学习适合先把混乱市场压成可观察结构(如用收益率 + 波动率给成分股聚类,生成研究优先级候选);监督学习(分类/回归/时间序列)在金融里的根本难点不是写模型,而是选特征、控噪声、抗环境切换——有效市场快速吸收信息,规律随社会技术变迁失效,同一模型跨牛熊周期表现可以天差地别。
ML 更适合范围收窄的场景:某个行业、某类业务模型、某条已知驱动链,而不是”预测全市场”。真正成功的量化团队,难点更多在数据管线和组织迭代,而不是某个单独算法。
8.2 GenAI 的用法与限制
GenAI(研究助手)和 ML(判别器)的差别不只是模型结构,而是任务类型不同。
| 用法 | 价值 |
|---|---|
| 辅助 ML 选特征 | 帮忙提出值得纳入模型的业务变量 |
| 公司尽调摘要 | 快速总结管理层、诉讼、商业模式、客户结构 |
| 文档总结 | 财报、电话会、长报告压成一页摘要 |
| 非财务风险粗筛 | 用统一问题先扫疫情、贸易战、气候等暴露 |
| 代码生成 | 加速写抓数、算指标、做分析的脚本 |
LLM 最适合做”研究加速器”——帮你更快形成评分卡,但不能替你跳过事实核验。核心限制:信息有训练截止日期、会幻觉、同一问题输出不确定;泛化建议越泛越危险,问题越具体越接近甜蜜点。
一旦想做 RAG、接私有数据、比对多个模型和保存结果,代码层不可省;聊天框不擅长统一管理 prompt、上下文和输出。
8.3 Prompt engineering
| 维度 | 应提供的信息 |
|---|---|
| 目标 | 资本增值、被动收入,或财务独立时间表 |
| 风险偏好 | 能忍受多大波动、是否接受做空、是否接受高风险资产 |
| 背景与经验 | 熟悉哪些行业、哪些资产、哪些券商 |
| 税务 | 国籍、税务居民地、税负约束 |
| 价值观 | 不投什么行业,是否关心 ESG、宗教、动物权益等 |
画像越具体,模型越容易避开看似正确、实则不适合你的标准答案。问题要具体(交代行业、风格、期限、排除项)、语言要准确(专业术语越清楚结果越贴近专业语境)、可给参考案例(“像 Netflix 早期那样的商业模式”)。
第 9 章 — AI 代理
AI agent 的增量价值,不是让模型更聪明,而是给它补上记忆、工具、流程和角色分工,把一次性问答变成可复用研究系统。
9.1 要求
单轮 prompt 像记者在发布会上只能问一个问题;复杂研究要让模型能追问、取数、复核和迭代。
| 要素 | 缺了会怎样 | 常见补法 |
|---|---|---|
| 记忆(Memory) | LLM 不会从单次对话中永久学习,上一轮洞察不会自动带到下一轮 | 用 检索增强生成(RAG)或显式上下文给模型补“外部记忆” |
| 外部信息接入 | 训练截止后的数据、私有数据、专有系统都不在模型脑中 | 接网页搜索、API、数据库、邮箱、消息记录或 模型上下文协议(MCP) |
| 策略(Strategy) | 多模型堆在一起只会产生更多输出,不会自动产生更好结论 | 明确任务拆分、调用顺序、复审机制和最终汇总逻辑 |
9.1.1 Agentic design patterns
| 模式 | 作用 | 投资研究里的典型用法 |
|---|---|---|
| 反思(Reflection) | 根据结果回看动作并调整下一轮策略 | 交易机器人收盘后复盘收益、风险暴露和执行偏差 |
| 工具调用(Tool use) | 把取数、计算、搜索等任务外包给专门系统 | 调新闻 API、股价接口、情绪分析工具 |
| 规划(Planning) | 先拆目标,再按依赖执行多步流程 | 先拉财务数据,再扫新闻,再排序并发提醒 |
| 多代理协作(Multi-agent) | 让多个角色分工后再汇总结论 | 多头代理找上涨逻辑,空头代理找风险,裁判代理做最终判断 |
一个完整参考流通常是:触发器(定时 / 用户提问 / 告警)→ 检索(RAG / Web / MCP)→ 生成(一个或多个 LLM)→ 复审(额外 LLM 或规则)→ 输出(Notion、数据库或消息渠道)。
9.2 Prompt 仓库(Prompt repository)
不引入专门框架也能做 agent,但至少要先把 prompt 资产管理起来。
| 字段 | 作用 |
|---|---|
id | 标识提示词用途,如 swot_analysis、porter_5_forces |
prompt | 可复用正文,支持 {company} 这类占位符 |
tag | 按行业、场景、催化剂等维度检索提示词 |
- prompt 仓库是研究资产,不是临时聊天记录;同一条 prompt 应能在 Apple、Alphabet 这类相似场景间复用
- 仓库建设的关键,是找到“足够具体但仍可复用”的平衡;最简数据库模型只要
prompt表和tag关联表,重点不在 schema 复杂,而在能稳定重取和重用
9.3 结果落库与研究留痕
多 LLM 研究如果不及时落库,prompt 和回答很快会散落在不同聊天界面,后续几乎无法追溯。
| 步骤 | 关键点 |
|---|---|
| 创建页面 | 用 ticker + 日期 + prompt_id + LLM 组成标题,方便回溯研究上下文 |
| 写入内容 | 先写 prompt,再写 answer,保留“问题→回答”的审计链 |
| 分块提交 | Notion 单次写入上限约 2,000 字符,长文本必须拆块 |
| 统一归档 | 按标签、创建时间、最后编辑时间筛选,研究记录不会散落在各个平台 |
Notion 在这里不是普通笔记软件,而是研究日志数据库:统一入口、统一检索、统一留痕。
9.4 框架的价值
框架的价值,不是替代研究逻辑,而是把“调用模型、接工具、串步骤、记录执行过程”这些脏活抽象掉。
| 路径 | 优势 | 代价 |
|---|---|---|
| n8n 这类 no-code 工具 | 上手快,适合拖拽出第一版工作流 | 一旦要做生产级定制,缺失能力可能让后续补洞更慢 |
| LangChain 这类代码框架 | 统一不同模型和工具的调用方式,方便接 provider、agent 和执行链 | 仍然要理解状态、检索、编排和调试过程 |
代理执行日志很重要:能看到它为什么调用某个工具、拿到了什么数据、最后怎样形成答案,调试才有抓手
9.5 检索增强生成(RAG)
RAG 补两类缺口:训练截止后的新数据,以及私有数据。关键洞察:上下文会直接改变结论——同样问自动驾驶公司,偏好 LiDAR 和反对 LiDAR 会导向不同推荐;研究质量最终取决于拿到了什么上下文,以及问了什么问题。
第 10 章 — 图表与技术分析
图表的价值,不是预测未来,而是把价格、时间和市场情绪压成一眼能读的结构。
10.1 图表解读框架
同一段跌幅在指数/个股、危机日/五年维度里意义不同;第一层不是下结论,而是判断跌了多少、多快、相对历史是否异常。
形态(双顶、头肩顶、旗形等)本质是被反复模仿的市场脚本——有效部分来自足够多人相信,不是自然规律;持有周期越短越依赖形态,长线可参考但不必把买卖点完全交给图形。
| 视角 | 看到上涨后的反应 |
|---|---|
| 均值回归 | 涨多了就该回落,倾向卖出 |
| 动量 | 趋势未坏就继续持有甚至加仓 |
| 逆向 | 大众一致时反而寻找反方向机会 |
同一张图会导出相反建议:图表不显影策略,只显影不同策略的冲突。
线图讲单资产时间故事;树图(Treemap)看全市场涨跌热力分布,柱状图和直方图看类别内部分布,散点图按风险/收益/估值等维度做多资产横向比较。
10.2 常用技术指标
K 线用 OHLC 压缩一个时间窗口,比折线更适合读情绪与波动:长影线表某价位被强烈拒绝,小实体偏犹豫,大实体偏单边(影线长 = 冲上去又被打回;实体小 = 开收接近;实体大 = 一边倒)。
均线用于抹平噪音、读出趋势;SMA 稳但慢(长期趋势),EMA 对近期权重更高(短线动量);不存在放之四海皆准的最佳参数,窗口本身即策略的一部分。布林带看波动率与相对极值(本质测偏离均值,非”碰到就反转”),MACD 看两 EMA 相对关系;单指标易假信号,须搭趋势背景或基本面。
第 11 章 — 算法交易
算法交易不是把买卖自动化,而是先把“什么信号值得行动、如何验证、怎样执行”写成可以复查的规则。
11.1 非财务数据
交易信号可扩展到财报与价格之外;真正稀缺的优势往往来自别人还没系统利用的数据。当公开财务与常见技术指标已被充分消化,这类优势更常体现为媒体、位置移动、人口、政策舆情等场外信息。难点在获取、清洗、持续更新与跨期可比,而非理论价值。假说与证据链与第 4 章同一逻辑(先立假说,再反推所需数据);数据并非越多越好。
11.1.1 先有 thesis,再找可采信号(例:Waymo)
把“Waymo 会成为 Google 重要增长引擎”拆成可观察指标:
| thesis 要验证什么 | 可采信号 |
|---|---|
| 使用量在增长 | 每周订单量、服务城市扩张 |
| 安全性在改善 | 事故报道数量、监管态度 |
| 社会接受度在提升 | 媒体提及频率、情绪倾向 |
| 商业价值在提升 | 新合作、付费模式、部署密度 |
11.1.2 常见非财务数据源
| 数据源 | 适合回答的问题 |
|---|---|
| 媒体 / 社交媒体 / 博客 / 视频转录 | 市场情绪、叙事变化、品牌热度 |
| 地理与移动数据 | 线下客流、设备部署、车流和物流变化 |
| 卫星 / 图像数据 | 厂房活动、库存变化、资产利用率 |
| 人口与行为数据 | 长期需求变化、用户结构迁移 |
价值高度依赖行业(消费品偏舆情,工业/能源偏地理与政策);门槛在稳定变成可比较的时间序列,而非“知道这些数据存在”。
11.2 催化剂
催化剂是价格短期剧烈偏离常态的触发器,适合事件驱动策略;本质不是猜事件是否发生,而是判断一旦发生,价格相对预期偏离多大。同一催化剂可对应短线动量或中长期结构性方向。
| 催化剂 | 为什么会剧烈影响价格 | 策略提醒 |
|---|---|---|
| 并购(M&A) | 估值、协同和整合预期瞬间变化 | 看交易条款,也看文化和执行风险 |
| 困境/破产 | 市场先按最坏情况抛售 | 可能有“烟蒂机会”,但股权也可能归零 |
| 财报电话会 | 盈利超预期/不及预期迅速改写预期 | 重点看 surprise 和管理层口风 |
| 灾害 / 战争 / 疫情 | 需求和风险暴露重定价 | 往往同时制造受害者和受益者 |
| 利率变化 | 贴现率、融资成本、风险偏好一起变 | 高资本消耗公司最敏感 |
11.3 把信号写成策略
11.3.1 回测
回测目标不是证明“能赚钱”,而是先过滤明显无效的想法;更像过滤器,不是生产许可证。书里用 SMA 短上穿长买入、下穿卖出 说明最经典规则也未必稳赢基准;参数优化可改善历史表现,也带来过拟合。
| 回测必须回答的问题 | 否则会出什么错 |
|---|---|
| 买卖信号是什么 | 规则模糊,无法复现 |
| 基准是什么 | 不知是否优于买入并持有 |
| 交易成本怎么算 | 纸面盈利可能被手续费吃掉 |
| 滑点、价差、税怎么处理 | 实盘系统性差于回测 |
11.3.2 复杂信号可以做成评分卡
买卖规则不必来自单一指标,可把多类信号压成评分;前提是每项可量化、可比较、可回看。数据源或覆盖一变,历史分数可能不可比——复杂策略的难点是让输入长期稳定,而非 if/else 本身。
| 信号类型 | 例子 |
|---|---|
| 价格行为 | 趋势、动量、波动率异常 |
| 文本信号 | 新闻关键词、情绪分数、管理层语气 |
| 内部人交易 | 高管或机构增减持 |
| 链上/另类数据 | 大户转账、解锁、异常流动 |
11.4 下单与执行
交易所撮合买卖,券商是散户接市场的接口与托管者。股票与加密在监管、托管、可追责性上差异大,不能当同一基础设施。高频交易拼低延迟与执行工程,与普通 Python 脚本不同层级。
| 订单 | 作用 |
|---|---|
| 市价单(Market order) | 立刻成交,优先速度 |
| 限价单(Limit order) | 到指定价格才成交,优先价格 |
| 止损单(Stop order) | 到某阈值后触发卖/买,优先风控 |
| 止损限价单(Stop-limit) | 先触发,再按限价成交,防极差价格 |
| 跟踪止损(Trailing stop) | 止损随价格上移,保护浮盈 |
| 条件 | 含义 |
|---|---|
| FOK(Fill or Kill) | 要么整笔立刻成交,要么取消 |
| GTC(Good ‘til Canceled) | 持续有效直到成交或手动取消 |
订单类型决定何时出手,附加条件决定怎么成交;风控常落在下单参数里。券商与 API 选型见第 6 章数据管线,API 只解决自动提交,执行自动化前研究与风控须先过关。
第 12 章 — 私募股权:投资初创公司
投资初创公司,押注的不是产品演示,而是创始人、商业模型与退出路径能否撑得起多年锁仓和极高失败率。
12.1 从想法到 IPO
| 阶段 | 公司状态 | 投资人关注点 |
|---|---|---|
| Pre-seed | 为 MVP 争取时间,资金覆盖云、销售、基础运营等 | 赌人:执行力、抗压、投入、商业直觉;零碎帮忙不换大额股权;熟人信任下仍要区分「可放大的商业模型」与「昂贵爱好」 |
| Seed | MVP、已注册、有早期客户验证 | 路演上看团队气质、市场叙事、产品可交付性;是否有真实客户、复制与扩张速度,让下一轮资金愿意接盘 |
| Series A | 员工与早期客户,验证商业模型 | 产品与获客机制能否放大 |
| Series B | 模型跑通,向新市场扩张 | 组织化运营与更清晰盈利路径 |
| Series C | 已占稳定市场位置 | 国际化、并购或最终 exit |
- 孵化器/加速器加速学习与资源接入,不能替代商业验证,更像 deal flow 过滤器
- 越往后失败概率越低、资金需求越大,资本从个人/天使转向机构;VC 除资金外带来法务、财务、招聘、后续融资与 exit 的组织能力
- 整条路径被 exit 支配:目标是做成可被收购或上市的资产,而非慢慢做小而美
退出(Exit)
| 退出方式 | 含义 | 对投资人 |
|---|---|---|
| IPO | 上市后股权可流通 | 高回报 |
| Acquisition | 被收购 | 高回报 |
| Fire sale | 困境低价出售填债 | 部分回收 |
| Shutdown | 关停清算 | 基本归零 |
- 多年锁仓、高失败率,靠少数高回报 exit 覆盖整体;VC 往往不偏好增长慢但已盈利、分红小、退出弱的小生意
- 回报更接近「谁会买、为何买、团队是否有 acqui-hire 价值」,而非创始人自述愿景
12.2 投资载体
未上市信息不透明、定价未充分发现,押中则涨幅可能远超二级市场;代价是高风险、低流动性、长期不确定。
| 载体 | 典型阶段 | 适合谁 | 关键代价 |
|---|---|---|---|
| VC 基金 | Series A 及以后为主 | 大额、想分散多项目 | 门槛高;2% 管理费 + 20% carry 常见 |
| 天使 syndicate / SPV | Pre-seed 至成长 | 小资金跟 lead | 单项目风险高;常有一次性 setup 费与 carry |
| 主权财富基金(SWF)生态 | 国家扶持创新 | 个人不可直接投,可顺生态找机会 | 取决于本地政策与网络 |
- VC 基金打包多项目,靠少数赢家覆盖失败;个人难进顶级 LP,常经高净值 fund manager;管理费 + carry 买的是筛选、投后与 deal access
- 天使 syndicate:lead 谈妥后 LP 经
SPV合投,cap table 上单一实体;有关闭时间、最小票额与一次性费用,本质是跟投专业人士而非主导投后 - 早期财务噪音大,判断常回到创始人:诚信、韧性、领导力、工作强度、在正确市场里长期推进的能力
12.3 评估初创公司
12.3.1 估值与稀释
| 方法 | 能回答什么 | 局限 |
|---|---|---|
| 可比公司(CCA) | 相似公司大概值多少 | 可比样本难找,数据多不公开 |
| 可比交易 | 类似交易价格 | 历史未必适合当前周期 |
| VC Method | 目标 exit 能否支撑当前估值 | 对回报率与 exit 假设敏感 |
| DCF | 现金流折现估内在价值 | 早期收入、成本、折现率极不稳定 |
- 早期难直接套 P/E、EV;
DCF的价值主要在摊开假设——增速、费用、折现率、终值略动,估值就可能大变 - 早期价格多是谈判锚点;最终取决于市场愿意为这个故事付多高溢价
- 融资增发导致持股比例下降(dilution);若换来客户、市场与更高估值,更小比例的更大公司 仍可能优于 100% 持有一个弱公司
- 危险是反复融资却无商业进展,在价值未放大前提下被持续摊薄
12.3.2 评分卡:把「凭感觉」拆成可比较维度
| 维度 | 为什么重要 |
|---|---|
| 孵化器 / 加速器背景 | 初筛信号 |
| 创始人和顾问 | 执行与抗风险 |
| 既有投资人 | 外部背书 |
| 客户与战略合作 | 需求验证 |
| 团队来源国与注册地 | 人才、税制与融资环境 |
| 赛道 | 技术周期、赔率与风险 |
| 监管强度 | 时间成本与失败率 |
| 经济护城河 | 成功后的利润防守 |
| 资本密集度 / burn rate | runway 压力 |
| 商业模型 / 网络效应 / North Star Metric | 放大能力 |
- 程序员可把非财务信号系统化(抓取、权重、迭代);评分卡减少被路演 charisma 牵着走,但不消灭主观判断
第 13 章 — 路还很长
学会分析资产只是起点,真正决定长期结果的,是你是否愿意求证、保持节制,并在大多数时候接受指数基金这个默认答案。
13.1 求助,但别外包判断
- 书与 AI 可建框架,时点敏感的真实决策仍须自己承担
- 最危险是略懂就高估;低仓位试错优于一上来重仓交学费
- 大额决策值得花时间/钱问税务、财务与有经验同行;税制与身份约束会直接改变真实收益
13.2 生活方式与价值选择
- 任何”先移居再节税”的故事,签证、税务居民、合同限制、汇率与通胀没算清前都不成立
- 买入不只是买现金流,也是在为公司的行为与方向投票;在小公司与私募股权里影响会放大,但 activist stance 往往与回报目标冲突
13.3 纪律与能力边界
- peer review、延迟下单、把 thesis 说给别人听、做复盘——防止情绪接管的低成本刹车;组合复杂到记不清持有理由就已失控,宁可少而精
- 长期稳定跑赢者极少;
80% 指数 + 20% 主动尝试是合理起点,复杂模型不自动带来更高回报,多数人的瓶颈是纪律 - 投资若占满注意力,会吞掉财富本该换来的自由