Skip to content
Synapse
Go back

Investing for Programmers

程序员如何利用数据分析和编程技能做出更好的投资决策

大纲

Stefan Papp 是程序员出身的投资者,核心问题是:如何把编程、数据分析和 AI 能力转成投资优势。全书按”认知→工具→实战→进阶”展开,主线是用工程思维替代直觉决策。

基础篇(第 1-3 章)

主题关键概念
1分析型投资者资产分类、投资 vs 交易 vs 赌博、成长/价值/收入三大风格、核心-卫星组合、程序员的不公平优势
2投资基础三张报表、FCF、GICS 行业分类与经济周期、市值分层、关键指标(P/E、PEG、D/E、ROE)、分红与回购、外部评级的局限
3数据收集金融数据三类(基本面/技术/非财务)、数据源选型、时间序列分析、归一化、对数收益率

组合篇(第 4-5 章)

主题关键概念
4成长型组合投资假说、SWOT、LiDAR 案例、三种决策路径、退出条件
5收入型组合股息、债券、加密货币质押、提前退休

工程篇(第 6-7 章)

主题关键概念
6构建资产监控器持仓采集、数据聚合、可视化、被动收入追踪、收益预测
7风险管理止损、风险度量、对冲、组合优化、再平衡

AI 篇(第 8-9 章)

主题关键概念
8AI 金融研究ML 局限、监督/无监督学习、LLM 研究助手、投资者画像
9AI 代理反思、工具调用、规划、多代理、RAG

交易篇(第 10-11 章)

主题关键概念
10图表与技术分析K 线、形态识别、均线、布林带、MACD
11算法交易非财务数据、催化剂、回测、交易信号、订单类型、API 下单

进阶篇(第 12-13 章)

主题关键概念
12私募股权:投资初创初创生命周期、估值、股权稀释、初创评分
13路在脚下寻求专业建议、保持好奇、行为金融控制、指数基金作为安全底线

前半本讲公开市场和研究流程,后半本扩展到工具、AI、交易和私募;结尾落回行为控制。

第 1 章 — 分析型投资者

程序员的投资优势不在胆子更大,而在能把研究、决策和执行做成系统。

被动收入是程序员突破职场天花板的替代路径:覆盖部分必要开支时,自由就开始了。知道自己随时能离开一份高薪但压榨灵魂的工作,这种底气本身就是解脱。

1.2 资产

变现路径机制
资本增值低买高卖
被动收入利息、租金、分红
投资前三问判断标准
风险承受力能承受多大损失而不焦虑
财务目标时间跨度 × 目标收益
时间投入盯盘侵蚀生活说明策略要调
资产类型核心机制被动收入
股票(Stocks)公司所有权(equity),股价由供需驱动股息(dividend)
债券(Bonds)借钱换定期票息(coupon)+ 到期返本票息
ETF一篮子证券,天然分散,多数被动跟踪指数分红(分配型 ETF)
期权(Options)付权利金获买/卖权利(非义务)
加密货币(Crypto)区块链数字资产,无中介点对点交易质押(Staking)
私募股权(PE)未上市公司,流动性最低,回报潜力最大

债券收益率和信用风险正相关,美国国债是无风险基准。期权买方风险有限,卖方风险敞口更大。股息策略至少要跑赢无风险收益率,否则连通胀都难覆盖;而证券的优势在于门槛低、流动性好、可扩展。

1.3 投资方法

类别特征
赌博凭直觉决策,受认知偏差驱动
投资长期视角,依赖分析和批判性思维
交易利用短期波动,频率高、风险大

定量研究看数字,定性研究解释原因;AI 提高效率,但不替代判断(角色边界见第 8 章)。交易按频率分为日内、波段、算法和高频;做多赌涨,做空赌跌。回测(Backtesting)则用历史数据检验策略。

三大投资风格

属性成长型(Growth)价值型(Value)收入型(Income)
目标资本增值资本增值持续现金流
关注未来潜力被低估的”便宜货”稳定现金分配
典型公司高速扩张成熟但暂不受欢迎成熟、高现金流
分红低或无通常有高且稳定
关键指标高营收增长、高 P/E低 P/E、低 P/B高股息率
风险低到中

合理价格成长策略(GARP)是成长和价值的折中;Peter Lynch 的提醒也一样:对某个领域的专业知识,本身就是投资优势。

对冲本质上是买保险。过去回报不保证未来,价格也不只受基本面驱动,社交媒体和情绪同样会放大波动;因此真正有用的不是预测,而是在情绪极端时保持反身性。

核心-卫星组合(Core and Satellite)

核心仓位(Core)负责长期持有和复利增长,卫星仓位(Satellites)负责短期交易和现金流补充。

1.4 程序员的不公平优势

基本面分析像 debug:先拆解业务,再判断价值;而编程擅长构建规则系统,这正好对应投资纪律。

特质投资映射
耐心和纪律投资是最高形式的延迟满足
抽象思维习惯处理 API 和数据结构,理解无形资产更容易
前沿视角身处 AI、VR、biotech 前线,有领域判断力

投资策略应和人生选择对齐。

第 2 章 — 投资基础

基本面分析的顺序是:报表 → 行业 → 指标 → 同行业横比。

2.1 会计基础

财务报表就是公司的源代码,主流标准是 GAAPIFRS

报表核心问题
损益表赚了多少
资产负债表有什么、欠什么
现金流量表 / 自由现金流(FCF)能自由支配多少现金

读财报时只抓四件事:净利润不增长,真实购买力就在缩水;同一组数据要同时能讲出看多和看空两套故事;指标只能放在同行业里比,流动性往往比账面财富更暴露风险;**资本性支出(CapEx)**低也未必代表更轻,可能只是把成本转进了运营费用。

2.2 行业分类

GICS 把股票分到不同板块;关键不是记分类细节,而是知道不同板块受不同宏观因子驱动。

只投自己理解的业务;数字必须放回商业模式里读。

经济周期与行业表现

经济周期分扩张、顶峰、收缩、谷底;周期性行业在衰退期更脆弱,防御性行业更稳。已知的板块驱动因子还可以直接转成 ML feature,把宏观认知变成可回测信号。

市值 = 流通股 × 股价;规模越大越稳,规模越小波动越大但上行弹性也更强。市值不是内在价值,机会来自两者的偏离。

2.3 指标与比率

没有单一指标能定义好公司,关键是指标组合、行业横比和历史变化。

类别指标判断要点
流动性Current ratio / Quick ratio都看短期偿债能力,后者更严格
债务D/E / Interest coverage先确认口径;利息覆盖率 < 1.0 是红线
盈利EPS / ROA / ROE / Margin看盈利质量和资本使用效率
估值P/E / PEG / P/S / P/B行业横比 + 历史纵比,不同阶段用不同指标
分红Dividend yield / Payout ratio高股息未必安全,削减分红是警告
股权Float / Outstanding增发稀释,回购提升每股价值

指标使用原则

指标选择本身就是叙事:选什么指标,就会看到什么公司。股东回报主要看分红和回购,辅助信号再看内部人交易、SBC 和同行业 ESG。外部评级只作参考,分析师、机构和量化模型经常互相矛盾,最终仍要自己判断;投资不追求每次都对,而追求胜率和分散化的组合。

多元化没有通用答案;关键是新业务能否延续原有优势。


第 3 章 — 数据收集

数据源的核心问题不是便宜,而是能否稳定支撑研究流程。

3.1 数据源与分析方法

类型特征
基本面低频、可审计
技术实时、延迟敏感
非财务非结构化、需挖掘

AI 提高了非结构化数据的可用性,非财务数据因此更重要。数据源选型只看一条:原型阶段用免费接口,正式使用切到稳定的数据源或抽象层工具。

关键分析方法

分析时先看序列,不看点值:单个指标要放回多年区间里看,波动本身不等于风险恶化。跨股票比较前先做可比性,归一化到同一起点;收益率分析优先用对数收益率。波动判断还要看时间窗口,不看单年快照。


第 4 章 — 成长型投资组合

可复用的研究框架:想法→SWOT 挑战→缩窄焦点→候选筛选→多维分析→风险审视→持续监控→耐心等待。

4.1 投资假说

投资假说就是一套可被质疑的买入逻辑;买入前先定义目标,退出条件与三条路径见 §4.3。

对行业越陌生,越容易高估自己,所以最好从真正懂的领域出发,再用 SWOT 把宽泛主题缩窄成具体标的;最后只看三问:现金流、护城河、安全边际。

4.2 案例与方法论启示

LiDAR 案例演示了完整流程:从大主题缩窄到细分供应商,再比较技术、财务、管理层和风险。结论不是买入,而是继续观察。

四条要点:研究完仍不确定就先不出手,次优机会会占掉未来弹药;风险研究比收益想象更重要,个人可用”换日换角色”替代机构里的多空分工;信息源优先级是专业报刊 > 分析师 > Reddit > 公司 IR;追踪假说前先定义衡量标准。

4.3 决策路径

面对”有前景但不确定”的标的,决策无非三条路:大胆型直接建仓,前提是真懂;谨慎型继续研究或放弃,代价只是错过;混合型小额建仓边持有边研究,代价是仓位大小难拿捏。

无论哪条路径,提前定义退出条件(止盈、止损、时间窗口)比选路径本身更重要。

投资和创业都在找好机会;区别只是投资者不亲自运营。

没有想法时,就从自己熟悉的行业和技术主题开始。

第 5 章 — 收入型投资组合

收入型组合的关键不是追高收益,而是识别现金流背后的风险来源和可持续性。

5.1 股息

分红能力主要由生命周期、行业结构和护城河决定:成熟期、再投资需求低、现金流可预测的公司最适合做股息资产。现金牛(Cash Cow)是理想股息标的,行业也比规模更能决定分红倾向,公用事业通常比科技公司更适合。

护城河越深,分红越可持续;高股息本身不是护城河。

股息筛选指标

指标判断要点
年度派息 / 派息频率看现金流节奏是否匹配需求
股息率(Dividend yield)高股息率可能只是股价下跌
股息增长年数 / 增长率看分红是否长期稳定
派息比率(Payout ratio)越低越有余地
公司注册地直接影响税负

低派息比率 + 稳定分红历史,才值得深挖。

REIT 的优势是高分配率、不动产敞口和流动性,适合补充稳定现金流。

5.2 债券

股票是所有权,债券是借贷;债券回报来自票息和价格变化。普通债券(Vanilla bond)就是固定付息、固定到期,其他变种只是偿付和担保条件不同。

债券核心属性

属性说明
借款方联邦政府 / 市政 / 企业
到期日数月到数十年
票息固定或浮动
信用评级投资级与投机级的分界线最重要
支付方式付息频率和方式

债券回报不只来自票息,也可能来自折价买入后的资本增值。美国国债按期限分为 T-BillsT-NotesT-Bonds;利率是债券市场的总开关,加息会压低旧债价格,也会推高违约风险。

提前卖出债券不是对错问题,而是机会成本判断。

信用违约互换(CDS) 本质上是债券违约保险,也能被用来表达做空信用风险的观点。

5.3 加密货币质押

5.3.1 密钥与交易所

核心区别只有一条:把币放在交易所是用便利换托管风险,自管私钥才是真正控制资产。FTX 暴露了第三方托管的系统性风险;硬件钱包和软件钱包把风险收窄到市场波动和链上安全。

5.3.2 挖矿与质押

机制共识协议特征
挖矿(Mining)PoW用算力解数学题验证交易,需硬件+电力的大额前期投入
质押(Staking)PoS锁定代币支持网络验证交易,能效高但有最低持仓要求

自建验证节点门槛高,多数人只能委托第三方验证者,用佣金换便利。质押的三类风险是流动性锁定、收益率浮动和高通胀稀释;APY 越高,通常越要警惕后两者。

稳定币质押只消除了币价波动,不消除利率波动和平台风险。

5.4 提前退休

财务独立的简易公式是 年支出 ÷ 预期收益率 = 所需本金;5% 是常见保守估算,但还要再扣掉通胀。年龄越大,配置越应向被动收入倾斜;但长期看,成长型 ETF 往往因复利跑赢固定收益组合。收入型配置的价值,是避免在最差时点被迫卖出成长资产。

第 6 章 — 构建资产监控器

资产监控的核心不是做报表,而是把分散在不同平台、不同币种、不同资产类型的持仓压成统一视图。

6.1 架构

作用关键对象
数据源收集线上和线下持仓券商 API、交易所 API、offline_asset
规范化统一字段ticker、持仓数量、平均买入价、交易所、来源
富化补估值和收益数据Yahoo Finance、Google Finance、CoinMarketCap
导出写入不同工作表stocketfbondcryptoassets

6.2 数据管线

先定义统一字段,再为各券商和交易所写适配器。

统一字段用途
ticker资产唯一标识
持仓数量计算总价值和总收益
平均买入价计算历史收益
exchange推导币种并做汇率转换
broker标记数据来源,便于排错

6.3 资产处理

先统一采集和估值口径,再按资产类型挂不同指标。

资产处理重点
股票(Stocks)补行情、统一币种、聚合到整仓;核心口径是 总成本总市值总股息、历史收益和潜在收益,组合看绝对金额,个股看百分比
ETF复用股票流程,但更关注 净值(NAV)和 yield;股票分红、债券票息、加密质押奖励在监控层都可统一为 yield
债券(Bonds)更像按单次发行建档,常见标识是 ISIN;重点监控面值、本息回收和年化票息,收益率维护在离线表即可
加密货币(Cryptocurrencies)视图必须同时覆盖交易所持仓和链下自托管持仓;Google Finance 支持不足,要改用专门数据源;质押奖励可记作 yield,但稳定性远不及债券票息

第 7 章 — 风险管理

风险管理不是押注更少,而是先定义跌倒时怎么收伤,再决定能承受多大的上行诱惑。

7.1 基本防守(Ukemi)

作者把风险管理比作武术里的 Ukemi:先学会安全落地,再谈进攻。投资里的第一层防守不是预测对错,而是先画出损失边界。

7.1.1 止损

7.1.2 风险分类

风险层级含义典型例子
市场风险(Market risk)整体市场下跌拖累多数资产衰退、地缘冲突、情绪崩塌
行业风险(Sector risk)某一板块一起受冲击监管收紧、技术替代、需求转向
个股风险(Asset-specific risk)公司自身出了问题管理失误、产品失败、财务恶化

7.1.3 风险测量

工具回答的问题用法
风险矩阵哪些风险最该先处理影响程度 × 发生概率排序,再预设动作
Beta资产对大盘波动有多敏感>1 比大盘更激进,<1 更稳健
原则清单事情变坏时该怎么做提前定义“到什么等级就减仓 / 清仓”

7.2 个股与组合的风险画像

7.2.1 风险价值(VaR)

风险价值(VaR)回答的是:在给定时间窗口和置信水平下,正常情况下最糟可能亏多少。

要素作用
时间窗口看一天、一周还是一个月
置信水平常见是 95% 或 99%
模拟方法方差-协方差法、蒙特卡洛模拟(Monte Carlo)

7.2.2 相关性

7.3 人是最大的风险源

7.3.1 疏忽与偏差

7.3.2 回避高风险

方法适用场景
指数基金不想押单一公司生死,但想拿到市场平均收益
定投(DCA)担心一次买在高点,希望平滑择时风险
安全边际(Margin of safety)做价值投资,要求买价低于内在价值
主动 + 被动组合一边拿基准收益,一边保留主动超额空间

7.3.3 韧性

7.4 对冲

对冲的本质是牺牲一部分上行,换取在坏情形下不致命。

7.4.1 衍生品

工具 / 策略用途核心风险
Put / Call 期权锁定买卖价格区间买方损失有限,卖方尾部风险高
Covered call持股赚权利金大涨时上行被封顶
Cash-secured put想低价接货时先收权利金暴跌时被迫接刀
Iron condor押震荡、赚时间价值单边大行情易亏损
Futures / Swaps锁价格或现金流敞口杠杆和结构复杂

7.4.2 分散、配对与风险配比

7.5 非财务风险

非财务风险的难点不是不存在,而是难以像报表指标那样标准化。

7.6 组合优化

7.6.1 Markowitz 有效组合

7.6.2 CAPE 与资产配置

指标用途常见解读
Shiller P/E / CAPE用 10 年真实盈利平滑周期噪音,判断市场整体估值高 CAPE 代表估值偏贵,低 CAPE 代表估值偏便宜
无风险利率判断冒险值不值风险资产回报至少该高于 T-Bills

7.6.3 再平衡

第 8 章 — AI 金融研究

AI 在投资里的最佳位置不是替你拍板买卖,而是把筛选、取数、总结和尽调提速,让判断回到人手里。

8.1 ML 在金融的边界

无监督学习适合先把混乱市场压成可观察结构(如用收益率 + 波动率给成分股聚类,生成研究优先级候选);监督学习(分类/回归/时间序列)在金融里的根本难点不是写模型,而是选特征、控噪声、抗环境切换——有效市场快速吸收信息,规律随社会技术变迁失效,同一模型跨牛熊周期表现可以天差地别。

ML 更适合范围收窄的场景:某个行业、某类业务模型、某条已知驱动链,而不是”预测全市场”。真正成功的量化团队,难点更多在数据管线和组织迭代,而不是某个单独算法。

8.2 GenAI 的用法与限制

GenAI(研究助手)和 ML(判别器)的差别不只是模型结构,而是任务类型不同。

用法价值
辅助 ML 选特征帮忙提出值得纳入模型的业务变量
公司尽调摘要快速总结管理层、诉讼、商业模式、客户结构
文档总结财报、电话会、长报告压成一页摘要
非财务风险粗筛用统一问题先扫疫情、贸易战、气候等暴露
代码生成加速写抓数、算指标、做分析的脚本

LLM 最适合做”研究加速器”——帮你更快形成评分卡,但不能替你跳过事实核验。核心限制:信息有训练截止日期、会幻觉、同一问题输出不确定;泛化建议越泛越危险,问题越具体越接近甜蜜点。

一旦想做 RAG、接私有数据、比对多个模型和保存结果,代码层不可省;聊天框不擅长统一管理 prompt、上下文和输出。

8.3 Prompt engineering

维度应提供的信息
目标资本增值、被动收入,或财务独立时间表
风险偏好能忍受多大波动、是否接受做空、是否接受高风险资产
背景与经验熟悉哪些行业、哪些资产、哪些券商
税务国籍、税务居民地、税负约束
价值观不投什么行业,是否关心 ESG、宗教、动物权益等

画像越具体,模型越容易避开看似正确、实则不适合你的标准答案。问题要具体(交代行业、风格、期限、排除项)、语言要准确(专业术语越清楚结果越贴近专业语境)、可给参考案例(“像 Netflix 早期那样的商业模式”)。

第 9 章 — AI 代理

AI agent 的增量价值,不是让模型更聪明,而是给它补上记忆、工具、流程和角色分工,把一次性问答变成可复用研究系统。

9.1 要求

单轮 prompt 像记者在发布会上只能问一个问题;复杂研究要让模型能追问、取数、复核和迭代。

要素缺了会怎样常见补法
记忆(Memory)LLM 不会从单次对话中永久学习,上一轮洞察不会自动带到下一轮检索增强生成(RAG)或显式上下文给模型补“外部记忆”
外部信息接入训练截止后的数据、私有数据、专有系统都不在模型脑中接网页搜索、API、数据库、邮箱、消息记录或 模型上下文协议(MCP)
策略(Strategy)多模型堆在一起只会产生更多输出,不会自动产生更好结论明确任务拆分、调用顺序、复审机制和最终汇总逻辑

9.1.1 Agentic design patterns

模式作用投资研究里的典型用法
反思(Reflection)根据结果回看动作并调整下一轮策略交易机器人收盘后复盘收益、风险暴露和执行偏差
工具调用(Tool use)把取数、计算、搜索等任务外包给专门系统调新闻 API、股价接口、情绪分析工具
规划(Planning)先拆目标,再按依赖执行多步流程先拉财务数据,再扫新闻,再排序并发提醒
多代理协作(Multi-agent)让多个角色分工后再汇总结论多头代理找上涨逻辑,空头代理找风险,裁判代理做最终判断

一个完整参考流通常是:触发器(定时 / 用户提问 / 告警)→ 检索(RAG / Web / MCP)→ 生成(一个或多个 LLM)→ 复审(额外 LLM 或规则)→ 输出(Notion、数据库或消息渠道)。

9.2 Prompt 仓库(Prompt repository)

不引入专门框架也能做 agent,但至少要先把 prompt 资产管理起来。

字段作用
id标识提示词用途,如 swot_analysisporter_5_forces
prompt可复用正文,支持 {company} 这类占位符
tag按行业、场景、催化剂等维度检索提示词

9.3 结果落库与研究留痕

多 LLM 研究如果不及时落库,prompt 和回答很快会散落在不同聊天界面,后续几乎无法追溯。

步骤关键点
创建页面ticker + 日期 + prompt_id + LLM 组成标题,方便回溯研究上下文
写入内容先写 prompt,再写 answer,保留“问题→回答”的审计链
分块提交Notion 单次写入上限约 2,000 字符,长文本必须拆块
统一归档按标签、创建时间、最后编辑时间筛选,研究记录不会散落在各个平台

Notion 在这里不是普通笔记软件,而是研究日志数据库:统一入口、统一检索、统一留痕。

9.4 框架的价值

框架的价值,不是替代研究逻辑,而是把“调用模型、接工具、串步骤、记录执行过程”这些脏活抽象掉。

路径优势代价
n8n 这类 no-code 工具上手快,适合拖拽出第一版工作流一旦要做生产级定制,缺失能力可能让后续补洞更慢
LangChain 这类代码框架统一不同模型和工具的调用方式,方便接 provider、agent 和执行链仍然要理解状态、检索、编排和调试过程

代理执行日志很重要:能看到它为什么调用某个工具、拿到了什么数据、最后怎样形成答案,调试才有抓手

9.5 检索增强生成(RAG)

RAG 补两类缺口:训练截止后的新数据,以及私有数据。关键洞察:上下文会直接改变结论——同样问自动驾驶公司,偏好 LiDAR 和反对 LiDAR 会导向不同推荐;研究质量最终取决于拿到了什么上下文,以及问了什么问题。

第 10 章 — 图表与技术分析

图表的价值,不是预测未来,而是把价格、时间和市场情绪压成一眼能读的结构。

10.1 图表解读框架

同一段跌幅在指数/个股、危机日/五年维度里意义不同;第一层不是下结论,而是判断跌了多少、多快、相对历史是否异常

形态(双顶、头肩顶、旗形等)本质是被反复模仿的市场脚本——有效部分来自足够多人相信,不是自然规律;持有周期越短越依赖形态,长线可参考但不必把买卖点完全交给图形。

视角看到上涨后的反应
均值回归涨多了就该回落,倾向卖出
动量趋势未坏就继续持有甚至加仓
逆向大众一致时反而寻找反方向机会

同一张图会导出相反建议:图表不显影策略,只显影不同策略的冲突。

线图讲单资产时间故事;树图(Treemap)看全市场涨跌热力分布,柱状图和直方图看类别内部分布,散点图按风险/收益/估值等维度做多资产横向比较。

10.2 常用技术指标

K 线用 OHLC 压缩一个时间窗口,比折线更适合读情绪与波动:长影线表某价位被强烈拒绝,小实体偏犹豫,大实体偏单边(影线长 = 冲上去又被打回;实体小 = 开收接近;实体大 = 一边倒)。

均线用于抹平噪音、读出趋势;SMA 稳但慢(长期趋势),EMA 对近期权重更高(短线动量);不存在放之四海皆准的最佳参数,窗口本身即策略的一部分。布林带看波动率与相对极值(本质测偏离均值,非”碰到就反转”),MACD 看两 EMA 相对关系;单指标易假信号,须搭趋势背景或基本面。

第 11 章 — 算法交易

算法交易不是把买卖自动化,而是先把“什么信号值得行动、如何验证、怎样执行”写成可以复查的规则。

11.1 非财务数据

交易信号可扩展到财报与价格之外;真正稀缺的优势往往来自别人还没系统利用的数据。当公开财务与常见技术指标已被充分消化,这类优势更常体现为媒体、位置移动、人口、政策舆情等场外信息。难点在获取、清洗、持续更新与跨期可比,而非理论价值。假说与证据链与第 4 章同一逻辑(先立假说,再反推所需数据);数据并非越多越好。

11.1.1 先有 thesis,再找可采信号(例:Waymo)

把“Waymo 会成为 Google 重要增长引擎”拆成可观察指标:

thesis 要验证什么可采信号
使用量在增长每周订单量、服务城市扩张
安全性在改善事故报道数量、监管态度
社会接受度在提升媒体提及频率、情绪倾向
商业价值在提升新合作、付费模式、部署密度

11.1.2 常见非财务数据源

数据源适合回答的问题
媒体 / 社交媒体 / 博客 / 视频转录市场情绪、叙事变化、品牌热度
地理与移动数据线下客流、设备部署、车流和物流变化
卫星 / 图像数据厂房活动、库存变化、资产利用率
人口与行为数据长期需求变化、用户结构迁移

价值高度依赖行业(消费品偏舆情,工业/能源偏地理与政策);门槛在稳定变成可比较的时间序列,而非“知道这些数据存在”。

11.2 催化剂

催化剂是价格短期剧烈偏离常态的触发器,适合事件驱动策略;本质不是猜事件是否发生,而是判断一旦发生,价格相对预期偏离多大。同一催化剂可对应短线动量或中长期结构性方向。

催化剂为什么会剧烈影响价格策略提醒
并购(M&A)估值、协同和整合预期瞬间变化看交易条款,也看文化和执行风险
困境/破产市场先按最坏情况抛售可能有“烟蒂机会”,但股权也可能归零
财报电话会盈利超预期/不及预期迅速改写预期重点看 surprise 和管理层口风
灾害 / 战争 / 疫情需求和风险暴露重定价往往同时制造受害者和受益者
利率变化贴现率、融资成本、风险偏好一起变高资本消耗公司最敏感

11.3 把信号写成策略

11.3.1 回测

回测目标不是证明“能赚钱”,而是先过滤明显无效的想法;更像过滤器,不是生产许可证。书里用 SMA 短上穿长买入、下穿卖出 说明最经典规则也未必稳赢基准;参数优化可改善历史表现,也带来过拟合。

回测必须回答的问题否则会出什么错
买卖信号是什么规则模糊,无法复现
基准是什么不知是否优于买入并持有
交易成本怎么算纸面盈利可能被手续费吃掉
滑点、价差、税怎么处理实盘系统性差于回测

11.3.2 复杂信号可以做成评分卡

买卖规则不必来自单一指标,可把多类信号压成评分;前提是每项可量化、可比较、可回看。数据源或覆盖一变,历史分数可能不可比——复杂策略的难点是让输入长期稳定,而非 if/else 本身。

信号类型例子
价格行为趋势、动量、波动率异常
文本信号新闻关键词、情绪分数、管理层语气
内部人交易高管或机构增减持
链上/另类数据大户转账、解锁、异常流动

11.4 下单与执行

交易所撮合买卖,券商是散户接市场的接口与托管者。股票与加密在监管、托管、可追责性上差异大,不能当同一基础设施。高频交易拼低延迟与执行工程,与普通 Python 脚本不同层级。

订单作用
市价单(Market order)立刻成交,优先速度
限价单(Limit order)到指定价格才成交,优先价格
止损单(Stop order)到某阈值后触发卖/买,优先风控
止损限价单(Stop-limit)先触发,再按限价成交,防极差价格
跟踪止损(Trailing stop)止损随价格上移,保护浮盈
条件含义
FOK(Fill or Kill)要么整笔立刻成交,要么取消
GTC(Good ‘til Canceled)持续有效直到成交或手动取消

订单类型决定何时出手,附加条件决定怎么成交;风控常落在下单参数里。券商与 API 选型见第 6 章数据管线,API 只解决自动提交,执行自动化前研究与风控须先过关。

第 12 章 — 私募股权:投资初创公司

投资初创公司,押注的不是产品演示,而是创始人、商业模型与退出路径能否撑得起多年锁仓和极高失败率。

12.1 从想法到 IPO

阶段公司状态投资人关注点
Pre-seed为 MVP 争取时间,资金覆盖云、销售、基础运营等赌人:执行力、抗压、投入、商业直觉;零碎帮忙不换大额股权;熟人信任下仍要区分「可放大的商业模型」与「昂贵爱好」
SeedMVP、已注册、有早期客户验证路演上看团队气质、市场叙事、产品可交付性;是否有真实客户、复制与扩张速度,让下一轮资金愿意接盘
Series A员工与早期客户,验证商业模型产品与获客机制能否放大
Series B模型跑通,向新市场扩张组织化运营与更清晰盈利路径
Series C已占稳定市场位置国际化、并购或最终 exit

退出(Exit)

退出方式含义对投资人
IPO上市后股权可流通高回报
Acquisition被收购高回报
Fire sale困境低价出售填债部分回收
Shutdown关停清算基本归零

12.2 投资载体

未上市信息不透明、定价未充分发现,押中则涨幅可能远超二级市场;代价是高风险、低流动性、长期不确定。

载体典型阶段适合谁关键代价
VC 基金Series A 及以后为主大额、想分散多项目门槛高;2% 管理费 + 20% carry 常见
天使 syndicate / SPVPre-seed 至成长小资金跟 lead单项目风险高;常有一次性 setup 费与 carry
主权财富基金(SWF)生态国家扶持创新个人不可直接投,可顺生态找机会取决于本地政策与网络

12.3 评估初创公司

12.3.1 估值与稀释

方法能回答什么局限
可比公司(CCA)相似公司大概值多少可比样本难找,数据多不公开
可比交易类似交易价格历史未必适合当前周期
VC Method目标 exit 能否支撑当前估值对回报率与 exit 假设敏感
DCF现金流折现估内在价值早期收入、成本、折现率极不稳定

12.3.2 评分卡:把「凭感觉」拆成可比较维度

维度为什么重要
孵化器 / 加速器背景初筛信号
创始人和顾问执行与抗风险
既有投资人外部背书
客户与战略合作需求验证
团队来源国与注册地人才、税制与融资环境
赛道技术周期、赔率与风险
监管强度时间成本与失败率
经济护城河成功后的利润防守
资本密集度 / burn raterunway 压力
商业模型 / 网络效应 / North Star Metric放大能力

第 13 章 — 路还很长

学会分析资产只是起点,真正决定长期结果的,是你是否愿意求证、保持节制,并在大多数时候接受指数基金这个默认答案。

13.1 求助,但别外包判断

13.2 生活方式与价值选择

13.3 纪律与能力边界