从 LLM 基础到可生产部署的 AI Agent:LangChain 组件设计、RAG 进阶优化、LangGraph 状态管理、多 Agent 协作与 MCP 集成的完整实战指南
大纲
Roberto Infante(Manning,2025)是一位在工程团队中从零搭建 LLM 应用的实践者。全书解决的核心问题是:如何从一次 API 调用进阶到可生产部署的 Agent 系统。框架选型以 LangChain + LangGraph + LangSmith + MCP 为主线,14 章按”先会用再优化再自治”的逻辑递进。
Part 1 — 入门:LLM 应用基础(第 1-2 章)
| 章 | 主题 | 关键概念 |
|---|
| 1 | LLM 应用全景与核心挑战 | 三类应用(引擎 / 聊天机器人 / Agent)、RAG 设计模式、LangChain/LangGraph/LangSmith 分工 |
| 2 | 结构化 Prompt 与工程化执行 | Prompt 组件(角色/上下文/指令/输入/示例)、Few-shot、Chain-of-Thought、PromptTemplate、FewShotPromptTemplate |
Part 2 — 摘要引擎:处理超长文本(第 3-5 章)
| 章 | 主题 | 关键概念 |
|---|
| 3 | 用 LangChain 构建摘要链 | MapReduce 与 Refine 策略对比、TokenTextSplitter、LCEL 管道 |
| 4 | 研究摘要引擎 | 搜索-抓取-摘要-合成四段子链、LCEL 并行处理 |
| 5 | LangGraph 入门与 Agentic Workflow | Workflow vs. Agent 区别、LangGraph 节点/边/状态机、条件分支实现 |
Part 3 — Q&A 聊天机器人:RAG 基础(第 6-7 章)
| 章 | 主题 | 关键概念 |
|---|
| 6 | 从零实现 RAG(ChromaDB) | 语义搜索 vs 关键词搜索、向量化 Embedding、Ingestion-Query 两阶段流程、ChromaDB |
| 7 | LangChain RAG 组件 + LangSmith | BaseLoader / TextSplitter / VectorStore / Retriever 对象模型、LangSmith 追踪调试 |
Part 4 — 高级 RAG:工业级检索(第 8-10 章)
| 章 | 主题 | 关键概念 |
|---|
| 8 | 高级索引策略 | ParentDocumentRetriever、MultiVectorRetriever、多模态与半结构化内容索引 |
| 9 | 查询变换 | Rewrite-Retrieve-Read、Step-Back Prompting、HyDE(假设文档嵌入)、查询分解 |
| 10 | 多源路由与后处理 | 自查询(Self-Querying / 元数据过滤)、Text-to-SQL、GraphRAG / SPARQL、RRF 结果融合 |
Part 5 — AI Agents:工具使用到生产部署(第 11-14 章)
| 章 | 主题 | 关键概念 |
|---|
| 11 | LangGraph 工具型 Agent | Tool-Calling 协议、从单工具到多工具 Agent、LangSmith 可观测性 |
| 12 | 多 Agent 系统 | Router 模式 vs Supervisor 模式、跨 Agent 调试与测试、SQL/REST 数据源接入 |
| 13 | 构建与消费 MCP 服务器 | MCP 协议架构(Host/Client/Server)、构建自定义 MCP Server、远程工具与本地工具混合接入 |
| 14 | Agent 生产化 | LangGraph Checkpoint 短期记忆、多层 Guardrail(入口路由 + 模型后处理)、Human-in-the-loop |