🧭 30 个开源 Agent 项目实战清单：按难度、用途和踩坑排序

📌 学 Agent 最怕的不是"不知道学什么"，是"按 Star 数排着学，学到第 5 个还没动手做过一个"。这篇清单不是 Awesome List 的翻译——是按学习路径组织的，每个项目都标注了"第一步怎么跑"和"不适合什么"。

01｜先说结论：别按 Star 学项目

GitHub Star 数高度偏向 2023 年初的 AI Agent 泡沫期项目。AutoGPT 有 170K Star——但 2026 年的 Agent 开发者已经不会用它了。Star 数反映的是"这个项目的 idea 在当时有多火"，不是"这个项目对你当下的学习价值有多大"。

这篇文章的排序逻辑：

你不会被要求学 30 个项目。你会被给一条路径：
入门 5 个（必须跑通）→ 进阶 10 个（必须看懂源码）→ 工具 5 类（必须会用）
→ 不建议新手碰的 5 个（可以晚点看）

02｜我的评分维度

维度	说明
学习价值 ⭐1-5	这个项目能教会你什么？抽象概念还是具体技能？
代码可读性 ⭐1-5	源码容易看懂吗？文档齐全吗？能独立跑通吗？
与时俱进度 ⭐1-5	2026 年还在维护吗？技术栈还主流吗？
难度 🟢🟡🔴	🟢 1天跑通 🟡 3-7天 🔴 需要大量前置知识

03｜30 个项目总览表

#	项目	GitHub	难度	学习价值	分类
1	LangGraph	langchain-ai/langgraph	🟡	⭐⭐⭐⭐⭐	框架
2	CrewAI	crewAIInc/crewAI	🟢	⭐⭐⭐⭐	框架
3	AutoGen	microsoft/autogen	🟡	⭐⭐⭐⭐	框架
4	SWE-agent	princeton-nlp/SWE-agent	🟡	⭐⭐⭐⭐⭐	代码Agent
5	OpenHands	All-Hands-AI/OpenHands	🟡	⭐⭐⭐⭐	代码Agent
6	MetaGPT	geekan/MetaGPT	🟡	⭐⭐⭐⭐	Multi-Agent
7	ChatDev	OpenBMB/ChatDev	🟢	⭐⭐⭐	Multi-Agent
8	CAMEL	camel-ai/camel	🟡	⭐⭐⭐⭐	Multi-Agent
9	LlamaIndex	run-llama/llama_index	🟡	⭐⭐⭐⭐⭐	RAG 框架
10	Haystack	deepset-ai/haystack	🟡	⭐⭐⭐⭐	RAG 框架
11	RAGFlow	infiniflow/ragflow	🟡	⭐⭐⭐⭐	RAG 引擎
12	Dify	langgenius/dify	🟢	⭐⭐⭐	低代码
13	Coze	coze-dev/coze-js	🟢	⭐⭐	低代码
14	Flowise	FlowiseAI/Flowise	🟢	⭐⭐	低代码
15	AutoGPT	Significant-Gravitas/AutoGPT	🟡	⭐⭐	自主Agent
16	BabyAGI	yoheinakajima/babyagi	🟢	⭐⭐⭐	自主Agent
17	SuperAGI	TransformerOptimus/SuperAGI	🟡	⭐⭐	自主Agent
18	Langfuse	langfuse/langfuse	🟢	⭐⭐⭐⭐⭐	可观测
19	LangSmith	langchain-ai/langsmith-sdk	🟢	⭐⭐⭐⭐	可观测
20	Phoenix	Arize-AI/phoenix	🟡	⭐⭐⭐⭐	可观测
21	Ragas	explodinggradients/ragas	🟢	⭐⭐⭐⭐⭐	评测
22	DeepEval	confident-ai/deepeval	🟢	⭐⭐⭐⭐	评测
23	Browser Use	browser-use/browser-use	🟡	⭐⭐⭐⭐	工具
24	E2B	e2b-dev/e2b	🟢	⭐⭐⭐⭐	工具
25	Composio	ComposioHQ/composio	🟡	⭐⭐⭐⭐	工具集成
26	MCP	modelcontextprotocol/servers	🟡	⭐⭐⭐⭐	协议
27	Voyager	MineDojo/Voyager	🔴	⭐⭐⭐	研究
28	TaskWeaver	microsoft/TaskWeaver	🟡	⭐⭐⭐	代码Agent
29	AgentGPT	reworkd/AgentGPT	🟢	⭐⭐	自主Agent
30	OpenAgents	xlang-ai/OpenAgents	🟡	⭐⭐⭐	Multi-Agent

04｜入门优先跑的 5 个项目

1. CrewAI — 最快跑通 Multi-Agent

GitHub: crewAIInc/crewAI
适合谁：第一次接触 Multi-Agent，想 1 小时内看到效果
学什么：Agent 角色定义、Task 编排、Sequential Process
第一步：pip install crewai → 复制官网 Quickstart 的 3-Agent 例子 → 跑通 → 换成你自己的主题
不适合：生产系统（灵活度不够）
难度：🟢

2. LangGraph — Agent 控制流必修

GitHub: langchain-ai/langgraph
适合谁：想理解 Agent 底层控制流的开发者
学什么：StateGraph、条件边、Checkpointer、HITL
第一步：跑通 Quick Start 里的 ReAct Agent 例子 → 改成一个你自己的工具 → 加一条条件边
不适合：只想快速 demo 的人（学习曲线比 CrewAI 陡）
难度：🟡

3. Langfuse — 理解 Agent 可观测性

GitHub: langfuse/langfuse
适合谁：所有要做生产级 Agent 的人
学什么：Trace、Span、评测、Dashboard
第一步：pip install langfuse → 在 LangGraph 代码里加 3 行 trace 代码 → 看到 Dashboard
难度：🟢

4. Ragas — 理解 RAG 评测

GitHub: explodinggradients/ragas
适合谁：所有做 RAG 的开发者
学什么：faithfulness、answer_relevancy、context_precision
第一步：准备 10 条 QA pair → 用 Ragas 跑评测 → 看懂每个指标的含义
难度：🟢

5. SWE-agent — 理解代码 Agent 设计

GitHub: princeton-nlp/SWE-agent
适合谁：想深入理解 Agent 如何操作代码的开发者
学什么：Agent-Computer Interface（ACI）、代码搜索策略、故障修复流程
第一步：看 README 里的 Agent-Computer Interface 设计文档 → 理解为什么它不直接操作文件系统
不适合：不想深入源码的人
难度：🟡

05｜进阶必须拆的 10 个项目

进阶阶段的目标不是"跑通"——是"拆源码，理解设计"。

框架深度（3 个项目）

LangGraph：重点拆 StateGraph 的 reducer 机制和 Checkpointer 的序列化设计
AutoGen：重点拆 GroupChat 的 speaker_selection 实现和 nested chat 的递归结构
LlamaIndex：重点拆 Agent 的 query planning 和 tool retriever 的实现

Multi-Agent 机制（3 个项目）

MetaGPT：重点拆 SOP 流程编排——它如何用"公司角色"隐喻来编排 Agent 协作
CrewAI：重点拆 Agent 的 role/goal/backstory 如何被翻译成 System Prompt
AutoGen：重点拆 group chat 的消息路由和上下文管理

评测与监控（2 个项目）

Langfuse：重点拆 score 系统和数据集管理的 API 设计
Ragas：重点拆 faithfulness 指标的具体实现——它不是简单的相似度计算

工具与集成（2 个项目）

Composio：重点拆它如何在 200+ 工具之间做统一接口抽象
MCP：重点拆 client-server 协议设计——它是怎么定义"一个工具"的标准表示的

06｜生产化必须关注的 5 类工具

类别	推荐工具	解决什么问题
可观测	Langfuse / LangSmith	Agent 每一步的输入/输出/token/延迟全记录
评测	Ragas / DeepEval	自动化打分 + 回归测试
沙箱	E2B / Docker	Agent 代码执行的隔离环境
工具集成	Composio / MCP	给 Agent 接 200+ 工具的标准方式
低代码	Dify / Flowise	给业务人员自己搭 Agent（非开发者场景）

07｜不建议新手一开始碰的项目

AutoGPT（170K Star）：2023 年的现象级项目，但 2026 年已基本不维护。它的自主 Agent 循环没有持久化、没有可靠的工具调用机制——学它不如直接学 LangGraph
BabyAGI：代码只有 140 行，但它的 Task-Driven 自主 Agent 架构在 2026 年已经被 Plan-and-Execute 范式替代
Voyager：Minecraft Agent 的研究项目。除非你特别对"游戏里的 Agent"感兴趣，否则学习曲线太陡，工程价值有限
SuperAGI：试图做一个"万能 Agent 平台"，但功能大而全、代码质量参差——拆它的源码不如拆 LangGraph
AgentGPT：又一个 2023 年的现象级项目。架构简单、功能有限、不再维护

08｜一条 30 天实操路线

周	做什么	目标
第 1 周	跑通 LangGraph Quickstart + CrewAI Quickstart	理解两种框架哲学的差异（图 vs 角色）
第 2 周	手写一个 ReAct Agent（50 行代码）+ 接一个真实 API	理解 TAO 循环的本质，不被框架遮蔽
第 3 周	拆 LangGraph StateGraph 源码 + 加 Langfuse trace	从"会用"到"懂设计"
第 4 周	搭 Ragas 评测集（200 case）+ 跑一遍全量评测	建立"Agent 好不好"的量化标准

09｜总结：怎么把清单变成能力

📌 30 个项目不是你要全部学完的清单——是一张地图。你的任务不是走遍地图上的每一个点，而是用这张地图找到你的最优学习路径。入门跑 5 个，进阶拆 10 个，工具用 5 类——剩下的可以等到你有具体需求时再看。

三个切记：

不要只看 README——要跑代码。跑不通的 README 理解是假的
不要只跑 demo——要换你自己的数据或场景。理解才会内化
不要只用一个框架——至少用过 LangGraph + AutoGen，你才能真正理解"框架选型"

💡 "项目的 Star 数不等于你的能力。你看懂了 30 个项目的 README，不如你跑通了 5 个 + 拆了 3 个的源码。"

🍋 本文为 AI Agent 学习路线 · 开源项目选型地图。© 2026 AI小柠檬。

🧭 30 个开源 Agent 项目实战清单：按难度、用途和踩坑排序 ​

01｜先说结论：别按 Star 学项目 ​

02｜我的评分维度 ​

03｜30 个项目总览表 ​

04｜入门优先跑的 5 个项目 ​

1. CrewAI — 最快跑通 Multi-Agent ​

2. LangGraph — Agent 控制流必修 ​

3. Langfuse — 理解 Agent 可观测性 ​

4. Ragas — 理解 RAG 评测 ​

5. SWE-agent — 理解代码 Agent 设计 ​

05｜进阶必须拆的 10 个项目 ​

框架深度（3 个项目） ​

Multi-Agent 机制（3 个项目） ​

评测与监控（2 个项目） ​

工具与集成（2 个项目） ​

06｜生产化必须关注的 5 类工具 ​

07｜不建议新手一开始碰的项目 ​

08｜一条 30 天实操路线 ​

09｜总结：怎么把清单变成能力 ​

🧭 30 个开源 Agent 项目实战清单：按难度、用途和踩坑排序

01｜先说结论：别按 Star 学项目

02｜我的评分维度

03｜30 个项目总览表

04｜入门优先跑的 5 个项目

1. CrewAI — 最快跑通 Multi-Agent

2. LangGraph — Agent 控制流必修

3. Langfuse — 理解 Agent 可观测性

4. Ragas — 理解 RAG 评测

5. SWE-agent — 理解代码 Agent 设计

05｜进阶必须拆的 10 个项目

框架深度（3 个项目）

Multi-Agent 机制（3 个项目）

评测与监控（2 个项目）

工具与集成（2 个项目）

06｜生产化必须关注的 5 类工具

07｜不建议新手一开始碰的项目

08｜一条 30 天实操路线

09｜总结：怎么把清单变成能力