Skip to content

Latest commit

 

History

History
233 lines (168 loc) · 9.97 KB

File metadata and controls

233 lines (168 loc) · 9.97 KB

AI Agent 实战学习计划

适用对象:有 Python 基础、熟悉国内大模型(DeepSeek/Qwen)、数学基础弱、偏向实战
学习方式:通过 OpenCode 进行交互式学习,每周约 10 小时
计划周期:8 周(由浅入深)


学习原则(必读)

  1. 目标导向:每一周都必须产出可运行的代码/Demo,不追求理论完美。
  2. 先跑通再优化:遇到报错,优先让代码跑起来,再去理解细节。
  3. 避开数学:无需理解 Transformer 底层数学,Agent 的核心是工程逻辑。
  4. 善用 OpenCode:学习中遇到任何问题,直接将报错或疑惑抛给我,我会帮你 debug、解释概念、优化代码。

第一周:Prompt 工程基础 —— 学会与模型沟通

目标:掌握精准表达需求的能力,让 DeepSeek/Qwen 听懂你的话。

核心概念

  • 角色设定(System Role)
  • 少样本提示(Few-shot)
  • 思维链(Chain-of-Thought, CoT)
  • 结构化输出(JSON / Markdown)

本周任务

  1. 学习 Prompt 基础技巧(通过 OpenCode 提问学习)。
  2. 实战项目 A:开发一个「小红书文案生成器」。
    • 输入:产品名称 + 风格关键词。
    • 输出:带 emoji、分段、有网感的文案(要求模型以 JSON 格式返回标题和正文)。

检验标准:给定任意商品,模型能稳定按你要求的格式输出文案。


第二周:Prompt 进阶 —— 复杂任务拆解

目标:让模型处理多步骤、有约束的复杂任务。

核心概念

  • 任务分解(把大任务拆成 Prompt 里的步骤)
  • 输出格式控制(强制 JSON Schema)
  • 上下文管理(对话历史的作用)

本周任务

  1. 实战项目 B:开发一个「Python 代码解释器」。
    • 输入:一段 Python 代码。
    • 输出:模型用大白话逐步解释代码逻辑(练习 CoT)。
  2. 实战项目 C:开发一个「会议纪要助手」。
    • 输入:一段口语化的会议录音转文字(或模拟文本)。
    • 输出:模型提炼为「待办事项(负责人+截止日期)」+「决议」+「疑问」三段式 Markdown。

检验标准:能够对一段 500 字的混乱口语文本,整理出结构清晰的纪要。


第三周:RAG 入门 —— 让 AI 拥有你的知识库

目标:让模型能读取你私有的、外部的知识,不再受限于训练数据。

核心概念

  • RAG(检索增强生成):外接资料 → 切片 → 存向量库 → 检索 → 生成。
  • 向量(Embedding):把文字转成数字坐标(只需直观理解,无需数学推导)。
  • 向量数据库:FAISS / Chroma(本地轻量)。

本周任务

  1. 学习 RAG 流程,了解 LangChain 基础组件。
  2. 实战项目 D:搭建一个「公司制度问答助手」。
    • 输入:一份 PDF/TXT 格式的公司规章制度。
    • 流程:文档自动切片 → 存入本地向量库 → 用户提问 → 检索相关片段 → LLM 结合片段回答。
    • 要求:能准确回答“年假有几天”“报销流程是什么”等具体问题,并指出信息来源。

检验标准:上传一份陌生文档后,连续提问 5 个细节问题,Agent 能准确回答 4 个以上。


第四周:工具调用(Function Calling)—— 让 AI 能动手

目标:教会 LLM 使用外部工具(API、函数),突破模型自身能力边界。

核心概念

  • Function Calling:模型判断何时调用你写的函数。
  • API 对接:天气、计算、搜索等外部服务。

本周任务

  1. 实战项目 E:开发一个「天气穿衣助手」。
    • 用户输入:“今天北京穿什么?”
    • Agent 自动调用天气查询 API → 获取温度/天气 → LLM 根据结果给出穿衣建议。
  2. 实战项目 F:开发一个「网页摘要与存档助手」。
    • 用户提供一个新闻 URL。
    • Agent 调用 requests 获取网页 → 提取正文 → LLM 生成 3 句话摘要 → 保存为本地 Markdown 文件。

检验标准:Agent 能自主判断何时需要调用工具,而不是只靠模型内部知识瞎编。


第五周:Agent 框架 —— 单 Agent 的自主规划

目标:进入真正的 Agent 领域,让 AI 具备“思考-行动-观察”的循环能力。

核心概念

  • ReAct 框架:Thought(思考)→ Action(行动)→ Observation(观察)→ 循环。
  • Agent 与 Chain 的区别:Chain 是固定流水线,Agent 是动态决策。
  • 记忆(Memory):短期记忆(对话历史) vs 长期记忆(向量库)。
  • LangChain / LangGraph 核心组件。

本周任务

  1. 学习 ReAct 概念和 LangChain Agent 的使用。
  2. 实战项目 G:开发一个「研报分析助手」。
    • 用户输入:股票代码(如 600519)。
    • Agent 执行以下步骤:
      1. Thought:用户想了解这只股票的近况,我需要先查新闻和财报。
      2. Action:调用搜索工具/财经 API 获取近期资讯。
      3. Observation:获取到新闻标题和关键数据。
      4. Thought:数据已拿到,现在需要总结并给出风险提示。
      5. Final Answer:输出「3 个核心要点」+「1 个风险提示」。

检验标准:给出一个陌生股票代码,Agent 能自动走完“查资料→分析→总结”的全流程,无需人工干预步骤。


第六周:多工具与记忆 —— Agent 能力增强

目标:让单个 Agent 同时使用多种工具,并具备记忆能力。

核心概念

  • 多工具注册:一个 Agent 同时拥有计算器、搜索、数据库查询等多个工具。
  • 工具选择:模型根据问题自动判断用哪个工具。
  • 记忆管理:让 Agent 记住用户偏好(如“我喜欢简洁的回答”)。

本周任务

  1. 实战项目 H:开发一个「旅行规划 Agent」。
    • 用户输入:“我下周想去西安,预算 3000,一个人。”
    • Agent 自动执行:
      1. 调用天气 API 查询西安未来 7 天天气。
      2. 调用搜索工具查询西安必去景点(或本地知识库)。
      3. LLM 综合天气和景点,推荐 3 天行程。
      4. 生成详细预算表(交通/住宿/门票/餐饮),以 Markdown 表格输出。
    • 要求:Agent 需要调用至少 2 个不同工具。

检验标准:输入一个模糊需求,Agent 能自主拆解任务、调用工具、整合信息,输出可直接参考的行程方案。


第七周:综合项目实战(上)—— 项目选型与设计

目标:整合 RAG + Agent + 工具调用 + 记忆,从零设计一个完整应用。

可选项目(三选一,难度递增)

项目 涉及技术 难度 适合方向
AI 个人学习助手 RAG + Agent + 长期记忆 ⭐⭐⭐ 学生/自我提升
自媒体运营 Agent Agent + 多工具调用 ⭐⭐⭐⭐ 内容创作者
智能导购/客服 RAG + 多轮对话 + 工具 ⭐⭐⭐⭐ 电商/企业服务

本周任务

  1. 选择一个项目进行需求分析。
  2. 画出 Agent 的执行流程图(Markdown 列表或 Mermaid 图)。
  3. 准备数据源(如学习笔记 PDF、商品手册、热点话题列表)。
  4. 搭建基础框架:实现核心 RAG 链路或主要工具接口。

第八周:综合项目实战(下)—— 打磨与交付

目标:完成一个可演示、可讲述的作品。

本周任务

  1. 完成项目核心功能开发。
  2. 使用 Gradio 或 Streamlit 制作一个简易 Web 界面(15 分钟可上手)。
  3. 编写项目 README,包含:
    • 项目介绍(解决了什么问题)
    • 技术栈(用了哪些模型、框架、工具)
    • 运行方式(如何安装依赖、启动)
    • 效果截图或演示说明
  4. 压力测试:自己当用户,连续测试 10 个不同的问题/需求,修复明显 Bug。

交付标准

  • 代码已上传 GitHub(或本地仓库整理好)。
  • 运行 python app.py 能弹出一个可交互的网页。
  • 能向朋友/面试官清晰描述这个 Agent 的工作原理和价值。

每周时间分配建议(共 10 小时)

时间 内容 时长
周二晚上 学习新概念 + 看示例代码 2 小时
周四晚上 动手写代码 + 调试 2 小时
周六下午 实战项目开发 3 小时
周日上午 复习 + 整理笔记 + 向 OpenCode 提问 3 小时

学习路径总览

Week 1-2: Prompt 与 LLM 基础  →  精准驾驭模型,产出文案/纪要
Week 3-4: RAG + 工具调用      →  让 AI 查资料、算数据、调 API
Week 5-6: Agent 框架          →  让 AI 自主思考、拆解任务、循环执行
Week 7-8: 综合项目            →  整合所有技能,产出个人作品

如何与 OpenCode 一起学习

  1. 概念不懂:直接问“什么是 ReAct?”“给我对比一下 RAG 和微调”。
  2. 代码报错:将报错信息和相关代码贴给我,我会帮你分析原因。
  3. 需求实现:告诉我“我想做一个 XXX 功能,给我写个 Demo”。
  4. 代码 review:写完后发给我,我会帮你检查是否有更好的写法或潜在 Bug。
  5. 学习计划调整:如果某一周太忙或太简单,随时告诉我,我们一起调整进度。

推荐前置准备(第一周开始前)

  1. 申请一个 API Key(建议优先选择,成本较低):
  2. 确保本地 Python 环境 >= 3.9。
  3. 安装基础库(后续周会逐步用到):
    pip install openai langchain chromadb faiss-cpu gradio streamlit

祝学习顺利!准备好后,从第一周开始,直接告诉我:“我准备好了,开始第一周的学习。”