Appearance
📚 开源选型|RAG 技术栈地图:Embedding、向量库、Rerank、评测
📌 RAG 不是一个组件——是一条技术栈。每个环节选错了,整个系统的天花板就被锁定了。这篇帮你在一张图里看清每个环节该选什么。
01|RAG 技术栈全景
| 环节 | 推荐方案 | 备选 |
|---|---|---|
| 文档解析 | Unstructured.io | LlamaParse、PyPDF |
| Chunking | 语义分块(LangChain Splitter) | 固定长度+重叠 |
| Embedding(中文) | bge-m3 | text-embedding-3-large |
| Embedding(英文) | text-embedding-3-large | Cohere Embed v3 |
| 向量库(<100万) | Qdrant | Chroma、pgvector |
| 向量库(>100万) | Milvus | Qdrant集群、Pinecone |
| 混合检索 | BM25 + Dense(EnsembleRetriever) | SPLADE |
| Rerank | Cohere Rerank / bge-reranker | Cross-Encoder |
| 评测 | RAGAS | DeepEval、TruLens |
02|最小可行 RAG 栈
如果今天就要开始,用这套:Unstructured → LangChain Splitter → bge-m3 → Chroma → RAGAS
零成本、pip install 全部、一天跑通。到瓶颈再换——不要为了"未来的大规模"选"现在用着痛苦的方案"。
🍋 本文为 AI Agent 学习路线 · 开源选型。© 2026 AI小柠檬。