Skip to content

📚 开源选型|RAG 技术栈地图:Embedding、向量库、Rerank、评测

📌 RAG 不是一个组件——是一条技术栈。每个环节选错了,整个系统的天花板就被锁定了。这篇帮你在一张图里看清每个环节该选什么。

01|RAG 技术栈全景

环节推荐方案备选
文档解析Unstructured.ioLlamaParse、PyPDF
Chunking语义分块(LangChain Splitter)固定长度+重叠
Embedding(中文)bge-m3text-embedding-3-large
Embedding(英文)text-embedding-3-largeCohere Embed v3
向量库(<100万)QdrantChroma、pgvector
向量库(>100万)MilvusQdrant集群、Pinecone
混合检索BM25 + Dense(EnsembleRetriever)SPLADE
RerankCohere Rerank / bge-rerankerCross-Encoder
评测RAGASDeepEval、TruLens

02|最小可行 RAG 栈

如果今天就要开始,用这套:Unstructured → LangChain Splitter → bge-m3 → Chroma → RAGAS

零成本、pip install 全部、一天跑通。到瓶颈再换——不要为了"未来的大规模"选"现在用着痛苦的方案"

🍋 本文为 AI Agent 学习路线 · 开源选型。© 2026 AI小柠檬。

© 2026 🍋AI小柠檬 · 内容原创,转载请注明出处