Skip to content

📝 项目案例|个人笔记 Agent:从收藏夹到可检索知识库

📌 信息囤积是个人效率的第一杀手。收藏了 500 篇文章、300 个网页、200 条推文——但从来没有回头看过。做一个笔记 Agent,帮你自动整理、分类、摘要,让收藏夹变成可检索的第二大脑。

MVP

用户粘贴链接/文本 → Agent 自动摘要 → 分类 → 存入可检索知识库 → 支持自然语言查询

技术架构

用户输入(链接/文本) → Agent(Jina Reader提取内容) → LLM摘要+分类
→ Embedding → Chroma向量库 → 支持"我的笔记里有没有关于XX的内容?"查询

核心代码

python
def save_note(url: str):
    content = fetch_page(url)  # Jina Reader
    summary = llm.summarize(content, max_words=150)
    category = llm.classify(content, categories=["技术","产品","商业","其他"])
    embedding = embed_model.encode(summary)
    vector_db.add(embedding, metadata={"url": url, "category": category, "summary": summary})

常见坑

  • 网页内容提取失败(JS 渲染页面/登录墙)→ Jina Reader 处理大部分但非全部
  • 分类不准 → 先用 LLM 分类,人工纠正前 50 条,后面越来越准
  • 后期笔记太多检索变慢 → 按时间分库(每月一个 collection)

🍋 本文为 AI Agent 学习路线 · 项目案例库。© 2026 AI小柠檬。

© 2026 🍋AI小柠檬 · 内容原创,转载请注明出处