Appearance
🧭 30 个开源 Agent 项目实战清单:按难度、用途和踩坑排序
📌 学 Agent 最怕的不是"不知道学什么",是"按 Star 数排着学,学到第 5 个还没动手做过一个"。这篇清单不是 Awesome List 的翻译——是按学习路径组织的,每个项目都标注了"第一步怎么跑"和"不适合什么"。
01|先说结论:别按 Star 学项目
GitHub Star 数高度偏向 2023 年初的 AI Agent 泡沫期项目。AutoGPT 有 170K Star——但 2026 年的 Agent 开发者已经不会用它了。Star 数反映的是"这个项目的 idea 在当时有多火",不是"这个项目对你当下的学习价值有多大"。
这篇文章的排序逻辑:
你不会被要求学 30 个项目。你会被给一条路径:
入门 5 个(必须跑通)→ 进阶 10 个(必须看懂源码)→ 工具 5 类(必须会用)
→ 不建议新手碰的 5 个(可以晚点看)02|我的评分维度
| 维度 | 说明 |
| 学习价值 ⭐1-5 | 这个项目能教会你什么?抽象概念还是具体技能? |
| 代码可读性 ⭐1-5 | 源码容易看懂吗?文档齐全吗?能独立跑通吗? |
| 与时俱进度 ⭐1-5 | 2026 年还在维护吗?技术栈还主流吗? |
| 难度 🟢🟡🔴 | 🟢 1天跑通 🟡 3-7天 🔴 需要大量前置知识 |
03|30 个项目总览表
| # | 项目 | GitHub | 难度 | 学习价值 | 分类 |
| 1 | LangGraph | langchain-ai/langgraph | 🟡 | ⭐⭐⭐⭐⭐ | 框架 |
| 2 | CrewAI | crewAIInc/crewAI | 🟢 | ⭐⭐⭐⭐ | 框架 |
| 3 | AutoGen | microsoft/autogen | 🟡 | ⭐⭐⭐⭐ | 框架 |
| 4 | SWE-agent | princeton-nlp/SWE-agent | 🟡 | ⭐⭐⭐⭐⭐ | 代码Agent |
| 5 | OpenHands | All-Hands-AI/OpenHands | 🟡 | ⭐⭐⭐⭐ | 代码Agent |
| 6 | MetaGPT | geekan/MetaGPT | 🟡 | ⭐⭐⭐⭐ | Multi-Agent |
| 7 | ChatDev | OpenBMB/ChatDev | 🟢 | ⭐⭐⭐ | Multi-Agent |
| 8 | CAMEL | camel-ai/camel | 🟡 | ⭐⭐⭐⭐ | Multi-Agent |
| 9 | LlamaIndex | run-llama/llama_index | 🟡 | ⭐⭐⭐⭐⭐ | RAG 框架 |
| 10 | Haystack | deepset-ai/haystack | 🟡 | ⭐⭐⭐⭐ | RAG 框架 |
| 11 | RAGFlow | infiniflow/ragflow | 🟡 | ⭐⭐⭐⭐ | RAG 引擎 |
| 12 | Dify | langgenius/dify | 🟢 | ⭐⭐⭐ | 低代码 |
| 13 | Coze | coze-dev/coze-js | 🟢 | ⭐⭐ | 低代码 |
| 14 | Flowise | FlowiseAI/Flowise | 🟢 | ⭐⭐ | 低代码 |
| 15 | AutoGPT | Significant-Gravitas/AutoGPT | 🟡 | ⭐⭐ | 自主Agent |
| 16 | BabyAGI | yoheinakajima/babyagi | 🟢 | ⭐⭐⭐ | 自主Agent |
| 17 | SuperAGI | TransformerOptimus/SuperAGI | 🟡 | ⭐⭐ | 自主Agent |
| 18 | Langfuse | langfuse/langfuse | 🟢 | ⭐⭐⭐⭐⭐ | 可观测 |
| 19 | LangSmith | langchain-ai/langsmith-sdk | 🟢 | ⭐⭐⭐⭐ | 可观测 |
| 20 | Phoenix | Arize-AI/phoenix | 🟡 | ⭐⭐⭐⭐ | 可观测 |
| 21 | Ragas | explodinggradients/ragas | 🟢 | ⭐⭐⭐⭐⭐ | 评测 |
| 22 | DeepEval | confident-ai/deepeval | 🟢 | ⭐⭐⭐⭐ | 评测 |
| 23 | Browser Use | browser-use/browser-use | 🟡 | ⭐⭐⭐⭐ | 工具 |
| 24 | E2B | e2b-dev/e2b | 🟢 | ⭐⭐⭐⭐ | 工具 |
| 25 | Composio | ComposioHQ/composio | 🟡 | ⭐⭐⭐⭐ | 工具集成 |
| 26 | MCP | modelcontextprotocol/servers | 🟡 | ⭐⭐⭐⭐ | 协议 |
| 27 | Voyager | MineDojo/Voyager | 🔴 | ⭐⭐⭐ | 研究 |
| 28 | TaskWeaver | microsoft/TaskWeaver | 🟡 | ⭐⭐⭐ | 代码Agent |
| 29 | AgentGPT | reworkd/AgentGPT | 🟢 | ⭐⭐ | 自主Agent |
| 30 | OpenAgents | xlang-ai/OpenAgents | 🟡 | ⭐⭐⭐ | Multi-Agent |
04|入门优先跑的 5 个项目
1. CrewAI — 最快跑通 Multi-Agent
- GitHub:
crewAIInc/crewAI - 适合谁:第一次接触 Multi-Agent,想 1 小时内看到效果
- 学什么:Agent 角色定义、Task 编排、Sequential Process
- 第一步:
pip install crewai→ 复制官网 Quickstart 的 3-Agent 例子 → 跑通 → 换成你自己的主题 - 不适合:生产系统(灵活度不够)
- 难度:🟢
2. LangGraph — Agent 控制流必修
- GitHub:
langchain-ai/langgraph - 适合谁:想理解 Agent 底层控制流的开发者
- 学什么:StateGraph、条件边、Checkpointer、HITL
- 第一步:跑通 Quick Start 里的 ReAct Agent 例子 → 改成一个你自己的工具 → 加一条条件边
- 不适合:只想快速 demo 的人(学习曲线比 CrewAI 陡)
- 难度:🟡
3. Langfuse — 理解 Agent 可观测性
- GitHub:
langfuse/langfuse - 适合谁:所有要做生产级 Agent 的人
- 学什么:Trace、Span、评测、Dashboard
- 第一步:
pip install langfuse→ 在 LangGraph 代码里加 3 行 trace 代码 → 看到 Dashboard - 难度:🟢
4. Ragas — 理解 RAG 评测
- GitHub:
explodinggradients/ragas - 适合谁:所有做 RAG 的开发者
- 学什么:faithfulness、answer_relevancy、context_precision
- 第一步:准备 10 条 QA pair → 用 Ragas 跑评测 → 看懂每个指标的含义
- 难度:🟢
5. SWE-agent — 理解代码 Agent 设计
- GitHub:
princeton-nlp/SWE-agent - 适合谁:想深入理解 Agent 如何操作代码的开发者
- 学什么:Agent-Computer Interface(ACI)、代码搜索策略、故障修复流程
- 第一步:看 README 里的 Agent-Computer Interface 设计文档 → 理解为什么它不直接操作文件系统
- 不适合:不想深入源码的人
- 难度:🟡
05|进阶必须拆的 10 个项目
进阶阶段的目标不是"跑通"——是"拆源码,理解设计"。
框架深度(3 个项目)
- LangGraph:重点拆 StateGraph 的 reducer 机制和 Checkpointer 的序列化设计
- AutoGen:重点拆 GroupChat 的 speaker_selection 实现和 nested chat 的递归结构
- LlamaIndex:重点拆 Agent 的 query planning 和 tool retriever 的实现
Multi-Agent 机制(3 个项目)
- MetaGPT:重点拆 SOP 流程编排——它如何用"公司角色"隐喻来编排 Agent 协作
- CrewAI:重点拆 Agent 的 role/goal/backstory 如何被翻译成 System Prompt
- AutoGen:重点拆 group chat 的消息路由和上下文管理
评测与监控(2 个项目)
- Langfuse:重点拆 score 系统和数据集管理的 API 设计
- Ragas:重点拆 faithfulness 指标的具体实现——它不是简单的相似度计算
工具与集成(2 个项目)
- Composio:重点拆它如何在 200+ 工具之间做统一接口抽象
- MCP:重点拆 client-server 协议设计——它是怎么定义"一个工具"的标准表示的
06|生产化必须关注的 5 类工具
| 类别 | 推荐工具 | 解决什么问题 |
|---|---|---|
| 可观测 | Langfuse / LangSmith | Agent 每一步的输入/输出/token/延迟全记录 |
| 评测 | Ragas / DeepEval | 自动化打分 + 回归测试 |
| 沙箱 | E2B / Docker | Agent 代码执行的隔离环境 |
| 工具集成 | Composio / MCP | 给 Agent 接 200+ 工具的标准方式 |
| 低代码 | Dify / Flowise | 给业务人员自己搭 Agent(非开发者场景) |
07|不建议新手一开始碰的项目
- AutoGPT(170K Star):2023 年的现象级项目,但 2026 年已基本不维护。它的自主 Agent 循环没有持久化、没有可靠的工具调用机制——学它不如直接学 LangGraph
- BabyAGI:代码只有 140 行,但它的 Task-Driven 自主 Agent 架构在 2026 年已经被 Plan-and-Execute 范式替代
- Voyager:Minecraft Agent 的研究项目。除非你特别对"游戏里的 Agent"感兴趣,否则学习曲线太陡,工程价值有限
- SuperAGI:试图做一个"万能 Agent 平台",但功能大而全、代码质量参差——拆它的源码不如拆 LangGraph
- AgentGPT:又一个 2023 年的现象级项目。架构简单、功能有限、不再维护
08|一条 30 天实操路线
| 周 | 做什么 | 目标 |
|---|---|---|
| 第 1 周 | 跑通 LangGraph Quickstart + CrewAI Quickstart | 理解两种框架哲学的差异(图 vs 角色) |
| 第 2 周 | 手写一个 ReAct Agent(50 行代码)+ 接一个真实 API | 理解 TAO 循环的本质,不被框架遮蔽 |
| 第 3 周 | 拆 LangGraph StateGraph 源码 + 加 Langfuse trace | 从"会用"到"懂设计" |
| 第 4 周 | 搭 Ragas 评测集(200 case)+ 跑一遍全量评测 | 建立"Agent 好不好"的量化标准 |
09|总结:怎么把清单变成能力
📌 30 个项目不是你要全部学完的清单——是一张地图。你的任务不是走遍地图上的每一个点,而是用这张地图找到你的最优学习路径。入门跑 5 个,进阶拆 10 个,工具用 5 类——剩下的可以等到你有具体需求时再看。
三个切记:
- 不要只看 README——要跑代码。跑不通的 README 理解是假的
- 不要只跑 demo——要换你自己的数据或场景。理解才会内化
- 不要只用一个框架——至少用过 LangGraph + AutoGen,你才能真正理解"框架选型"
💡 "项目的 Star 数不等于你的能力。你看懂了 30 个项目的 README,不如你跑通了 5 个 + 拆了 3 个的源码。"
🍋 本文为 AI Agent 学习路线 · 开源项目选型地图。© 2026 AI小柠檬。