Skip to content
Synapse
Go back

Mosaic:用 AI Harness 固化买方投研纪律

Updated:
2969 字 · 8 分钟

买方机构真正用来维持研究纪律的,不是单个分析师的自觉,而是反向 DCF 模型库、独立评审、研究方法委员会这一整套基础设施。Mosaic 把这套靠人和制度维持的纪律,做成了 AI 物理上无法绕过的流程。

Mosaic 是什么

项目入口:https://financial.qiyuey.top/

Mosaic 不是一个理财 App,也不是一个股票推荐页面。它更像一条自动化的股票研究生产线:给它一家公司,它会读取财报、行情和宏观数据,让 AI 依次完成公司研究、财务建模、估值分析、图表生成和报告拼装,最后在网页上展示成一份可阅读的买方研报。

读者打开网站时看到的是结果:腾讯、美团、阿里、英伟达、中芯国际、北方华创、哔哩哔哩 7 家公司的完整研报。每份报告都有评级(增持/持有/减持)、目标价、隐含上行空间,点进去是公司分析、财务模型、估值分析、6 种投资哲学视角对照,以及一份独立评审报告。

真正重要的不是”AI 会写研报”。现在让 AI 写出一份看起来专业的研报并不难,难的是让它写出的判断不能随便出口。Mosaic 的核心不是堆更多校验脚本,而是两根支柱:先把宏观、财报、研报三层买方投研纪律流程化,再用 AI Harness 把这套流程工程化

先用最白话的方式看这条流程:

flowchart TD
  A[支柱一:投研纪律流程化] --> A1[宏观约束环境 / 财报约束事实 / 研报约束判断]
  B[支柱二:AI Harness 工程化] --> B1[统一数据入口 / 固定产出结构 / 自动规则拦截 / 独立评审]
  A1 --> C[每份判断必须按流程走完]
  B1 --> C
  C --> D[通过后生成网页可读的买方研报]

文中几个词先做最小解释,避免后面读起来卡住:

术语这篇文章里的意思
买方为自己或基金的钱做投资判断,目标是做出可执行的买卖决策
卖方券商研究常见视角,更多服务客户交易和覆盖需求
upside目标价相对当前股价的上涨空间
DCF用未来现金流折现来估值的方法
反向 DCF / PIE不先问”我觉得值多少钱”,而是从当前股价反推市场已经相信了什么
WACC公司资金成本,DCF 里用来折现未来现金流
harness给 AI 套上的流程、输入输出格式和校验机制,让它不能随意发挥

工程上,它是一套完整的 AI Harness:给 LLM 套上确定性的脚手架,让它必须按设计好的流程跑完、产出结构化结果、通过规则校验后才能进入下一步。技术实现刻意选了朴素方案:数据、模型、报告和评审都沉淀为可追溯的本地资产,前端只负责把最终结果渲染成可浏览的研报。

整套系统分两层。底层是长期沉淀的数据底座,上层是按需触发的研报流水线。研报每次重跑都统一从数据底座读取,不让 LLM 凭训练知识临场编:

flowchart LR
  subgraph Base[底座层:长期沉淀,跨研报复用]
    E[财报数据库]
    F[原始财报]
    G[结构化三表]
    H[产业洞察]
    M[宏观快照]
    N[流动性 / 情绪 / 资金成本]
    E --> F
    E --> G
    E --> H
    M --> N
  end

  subgraph Report[研报层:每次研究触发一次]
    T1[公司研究]
    T2[财务建模]
    T3[估值分析]
    T4[图表生成]
    T5[报告拼装]
    Check[自动质检<br/>数值偏差 ≤ 0.5% 才放行]
    T1 --> T2 --> T3 --> T4 --> T5 --> Check
  end

  E --> T1
  G --> T2
  H --> T1
  H --> T3
  M --> T1
  M --> T3

底座层 是一次写、多次复用的资产,分成两类:一类是财报事实底座,包括原始财报、结构化三表和产业洞察;另一类是宏观环境底座,包括流动性、市场情绪和资金成本快照。每跑一次新研报,系统都会同时读取最新公司事实和当时的市场环境,而不是让 LLM 凭训练知识临场编。

研报层 是按需触发的有依赖流水线:公司研究、财务建模、估值分析、图表生成、报告拼装依次推进。每一步之间都有自动质检把关,任何数字对不齐、结构不完整、引用过时,都会被拦下来重做。最终前端只读取一份结构化结果,把它渲染成网页研报。

到目前为止,已经跑通了腾讯、美团、阿里、英伟达、中芯国际、北方华创、哔哩哔哩七家公司的完整研报。每家公司都会留下可追溯的研究材料、财务模型、估值结果、图表、最终报告和独立评审记录。

这套分层不是为了”看起来更工程化”,而是对应机构买方真实的分工:数据组维护共用的财务和宏观数据库,研究员都从那里拉;研究员产出研报后,由独立评审复核。Mosaic 把机构里靠人和制度维持的分工,做成了 AI 物理上无法绕过的流程。 文章后面也按这两根支柱展开:先讲买方投研纪律如何分层,再讲 AI Harness 如何把纪律固定成流程。

支柱一:把买方投研纪律流程化

绝大多数个人投资者对”做投研”的理解是:研究一家公司 → 形成判断 → 买或不买。这条流程的隐含假设是”判断本身就是研究的产物”。

但买方机构里的研究员花在”约束自己判断”上的时间,远远超过形成判断的时间。原因很简单:任何判断在出口前都必须经过一套固定纪律,才有资格成为可执行的结论。机构投研真正贵的不是”分析师”,而是这套纪律流程——它从宏观环境、财报事实一路约束到最终研报判断。

Mosaic 把这套纪律拆成三层体系:

层级约束对象核心纪律防止的失败
宏观层市场环境流动性、风险偏好、资金成本必须统一读取,不允许每份研报临场判断同一公司在不同报告里使用互相矛盾的宏观假设
财报层事实底座历史财务、最新季报、产业洞察必须来自同一套可追溯数据LLM 凭记忆写出过时或不一致的事实
研报层投资判断预期差、双向约束、多框架视角、独立评审判断看起来专业,但没有交易资格

宏观层决定”现在的市场环境允许怎样的估值假设”,财报层决定”事实从哪里来、是否可追溯”,研报层才决定”这个判断能不能成为交易结论”。任何一层没做透,判断都会以”看起来很专业”的样子带着隐含缺陷出口——这是个人投资者和机构投研之间最大的距离,不在 IQ,不在数据,在纪律是否被流程化。

研报层不需要展开成一套投资学教程。它只承担一个任务:让最终结论在出口前被四种约束压过一遍。

研报层纪律约束的问题一句话说明
预期差评级是否锚定市场预期,而不是公司质量好公司不等于好股票;没有可论证的差异化视角,默认中性
双向约束故事和数字是否互相支撑业务判断必须能翻译成数字,数字假设也必须讲得出业务来源
多框架视角是否被单一投资哲学绑架同一家公司要经得起质量、成长、价值、催化剂、宏观等不同视角审视
独立评审结论是否摆脱自我确认生成报告的人不负责最终放行,评审必须在独立上下文里挑错

这四条不是为了让研报显得更复杂,而是为了阻止一个未经约束的判断直接变成交易建议。

支柱二:用 AI Harness 固化纪律流程

讲到这里,第一根支柱结束:买方投研纪律本身并不神秘,难的是让宏观、财报、研报三层纪律长期稳定执行。第二根支柱才是 Mosaic 的工程价值:用 AI Harness 把纪律固定成流程。

这套纪律传统上靠机构里几十个研究员 + 几十年训练 + 内部研究方法委员会维持。个人投资者没有这套基础设施,方法论再好也容易在某一步偷懒——宏观假设凭感觉、财报事实凭记忆、研报判断凭叙事,都是人脑的自然倾向。

Mosaic 的 AI Harness 设计核心,就是把三层纪律做成 AI 物理上无法绕过的流程——不是靠自律记得做,而是不做就出不了结果。理念上,它做了三件事:

Harness 约束对应的投研纪律AI 为什么绕不过去
数据入口统一宏观层、财报层宏观环境和财务事实只能从同一套数据底座读取,不能凭模型记忆临场编
产出结构固定研报层每份报告必须按固定结构写出预期差、故事与数字、不同视角和最终结论,缺一块就无法进入下一步
确定性规则拦截三层全部数字不一致、评级和上行空间打架、事实过时,都会被程序化规则拦下
独立上下文评审研报层最终报告必须交给不知道生成过程的新评审者挑错,不能由同一个上下文自我确认

AI Harness 这一层的工程细节本身有趣,但不是这篇 note 的重点。真正的价值在双支柱:三层纪律给出判断标准,harness 让标准无法被绕过。方法论是体,harness 是用;没有方法论的 harness 等于把空话变得不可绕过,但还是空话。

实际跑出来的发现

这套机制跑了一阵子之后,几个超出预期的观察:

评级分布往诚实方向偏。 3 持有、3 增持、1 减持。如果允许偷懒,七份报告大概率会变成 5 个增持、2 个持有——这是绝大多数卖方研究的真实分布。“持有”在这套纪律下是默认值,发现不了预期差就只能选它。一开始很不习惯,但跑到第三家时已经默认接受了这件事。

独立评审的拦截率比预期高。 七份报告里有四份在独立评审环节被打回,拦截率超过一半。这意味着如果没有独立评审,这些问题原本有机会带着”看起来很专业”的外观进入决策。这件事在机构里也会发生,只是机构靠人盯人勉强压住。

方法论之间会互相暴露问题。 反向 DCF 算出来的隐含增长率,常常和故事部分写的”未来 3 年增速 X%“对不上;多框架视角里的某个结论,会跟主线判断打架。这些不一致原本会被自己快速合理化过去,工程化后变成结构约束里的硬错误,不容回避。

跑研报花的时间没有显著下降,但”出不了门的判断”被显著拦截了。投研真正的成本不是写报告的时间,是基于错误判断的下注成本——后者降了一个数量级。

这些纪律没有一条是新发明的——宏观约束来自资产定价常识,财报约束来自基本面研究纪律,期望投资法是 Mauboussin,故事与数字是 Damodaran,多哲学视角是各派投资大师的集合,独立评审是基础认知科学。真正的工作是把这些散落在不同书和制度里的纪律集合到一个流程里,让判断永远没法偷懒绕过——机构里靠人和制度,AI-native 系统里靠 harness 和流程。

投研的难度不在找答案,而在让判断扛住多重纪律;判断扛不住,最后亏掉的是钱。



相关内容

下一篇
Karpathy:智能体工程取代氛围编程