适用对象:有 Python 基础、熟悉国内大模型(DeepSeek/Qwen)、数学基础弱、偏向实战
学习方式:通过 OpenCode 进行交互式学习,每周约 10 小时
计划周期:8 周(由浅入深)
- 目标导向:每一周都必须产出可运行的代码/Demo,不追求理论完美。
- 先跑通再优化:遇到报错,优先让代码跑起来,再去理解细节。
- 避开数学:无需理解 Transformer 底层数学,Agent 的核心是工程逻辑。
- 善用 OpenCode:学习中遇到任何问题,直接将报错或疑惑抛给我,我会帮你 debug、解释概念、优化代码。
目标:掌握精准表达需求的能力,让 DeepSeek/Qwen 听懂你的话。
核心概念:
- 角色设定(System Role)
- 少样本提示(Few-shot)
- 思维链(Chain-of-Thought, CoT)
- 结构化输出(JSON / Markdown)
本周任务:
- 学习 Prompt 基础技巧(通过 OpenCode 提问学习)。
- 实战项目 A:开发一个「小红书文案生成器」。
- 输入:产品名称 + 风格关键词。
- 输出:带 emoji、分段、有网感的文案(要求模型以 JSON 格式返回标题和正文)。
检验标准:给定任意商品,模型能稳定按你要求的格式输出文案。
目标:让模型处理多步骤、有约束的复杂任务。
核心概念:
- 任务分解(把大任务拆成 Prompt 里的步骤)
- 输出格式控制(强制 JSON Schema)
- 上下文管理(对话历史的作用)
本周任务:
- 实战项目 B:开发一个「Python 代码解释器」。
- 输入:一段 Python 代码。
- 输出:模型用大白话逐步解释代码逻辑(练习 CoT)。
- 实战项目 C:开发一个「会议纪要助手」。
- 输入:一段口语化的会议录音转文字(或模拟文本)。
- 输出:模型提炼为「待办事项(负责人+截止日期)」+「决议」+「疑问」三段式 Markdown。
检验标准:能够对一段 500 字的混乱口语文本,整理出结构清晰的纪要。
目标:让模型能读取你私有的、外部的知识,不再受限于训练数据。
核心概念:
- RAG(检索增强生成):外接资料 → 切片 → 存向量库 → 检索 → 生成。
- 向量(Embedding):把文字转成数字坐标(只需直观理解,无需数学推导)。
- 向量数据库:FAISS / Chroma(本地轻量)。
本周任务:
- 学习 RAG 流程,了解 LangChain 基础组件。
- 实战项目 D:搭建一个「公司制度问答助手」。
- 输入:一份 PDF/TXT 格式的公司规章制度。
- 流程:文档自动切片 → 存入本地向量库 → 用户提问 → 检索相关片段 → LLM 结合片段回答。
- 要求:能准确回答“年假有几天”“报销流程是什么”等具体问题,并指出信息来源。
检验标准:上传一份陌生文档后,连续提问 5 个细节问题,Agent 能准确回答 4 个以上。
目标:教会 LLM 使用外部工具(API、函数),突破模型自身能力边界。
核心概念:
- Function Calling:模型判断何时调用你写的函数。
- API 对接:天气、计算、搜索等外部服务。
本周任务:
- 实战项目 E:开发一个「天气穿衣助手」。
- 用户输入:“今天北京穿什么?”
- Agent 自动调用天气查询 API → 获取温度/天气 → LLM 根据结果给出穿衣建议。
- 实战项目 F:开发一个「网页摘要与存档助手」。
- 用户提供一个新闻 URL。
- Agent 调用
requests获取网页 → 提取正文 → LLM 生成 3 句话摘要 → 保存为本地 Markdown 文件。
检验标准:Agent 能自主判断何时需要调用工具,而不是只靠模型内部知识瞎编。
目标:进入真正的 Agent 领域,让 AI 具备“思考-行动-观察”的循环能力。
核心概念:
- ReAct 框架:Thought(思考)→ Action(行动)→ Observation(观察)→ 循环。
- Agent 与 Chain 的区别:Chain 是固定流水线,Agent 是动态决策。
- 记忆(Memory):短期记忆(对话历史) vs 长期记忆(向量库)。
- LangChain / LangGraph 核心组件。
本周任务:
- 学习 ReAct 概念和 LangChain Agent 的使用。
- 实战项目 G:开发一个「研报分析助手」。
- 用户输入:股票代码(如 600519)。
- Agent 执行以下步骤:
- Thought:用户想了解这只股票的近况,我需要先查新闻和财报。
- Action:调用搜索工具/财经 API 获取近期资讯。
- Observation:获取到新闻标题和关键数据。
- Thought:数据已拿到,现在需要总结并给出风险提示。
- Final Answer:输出「3 个核心要点」+「1 个风险提示」。
检验标准:给出一个陌生股票代码,Agent 能自动走完“查资料→分析→总结”的全流程,无需人工干预步骤。
目标:让单个 Agent 同时使用多种工具,并具备记忆能力。
核心概念:
- 多工具注册:一个 Agent 同时拥有计算器、搜索、数据库查询等多个工具。
- 工具选择:模型根据问题自动判断用哪个工具。
- 记忆管理:让 Agent 记住用户偏好(如“我喜欢简洁的回答”)。
本周任务:
- 实战项目 H:开发一个「旅行规划 Agent」。
- 用户输入:“我下周想去西安,预算 3000,一个人。”
- Agent 自动执行:
- 调用天气 API 查询西安未来 7 天天气。
- 调用搜索工具查询西安必去景点(或本地知识库)。
- LLM 综合天气和景点,推荐 3 天行程。
- 生成详细预算表(交通/住宿/门票/餐饮),以 Markdown 表格输出。
- 要求:Agent 需要调用至少 2 个不同工具。
检验标准:输入一个模糊需求,Agent 能自主拆解任务、调用工具、整合信息,输出可直接参考的行程方案。
目标:整合 RAG + Agent + 工具调用 + 记忆,从零设计一个完整应用。
可选项目(三选一,难度递增):
| 项目 | 涉及技术 | 难度 | 适合方向 |
|---|---|---|---|
| AI 个人学习助手 | RAG + Agent + 长期记忆 | ⭐⭐⭐ | 学生/自我提升 |
| 自媒体运营 Agent | Agent + 多工具调用 | ⭐⭐⭐⭐ | 内容创作者 |
| 智能导购/客服 | RAG + 多轮对话 + 工具 | ⭐⭐⭐⭐ | 电商/企业服务 |
本周任务:
- 选择一个项目进行需求分析。
- 画出 Agent 的执行流程图(Markdown 列表或 Mermaid 图)。
- 准备数据源(如学习笔记 PDF、商品手册、热点话题列表)。
- 搭建基础框架:实现核心 RAG 链路或主要工具接口。
目标:完成一个可演示、可讲述的作品。
本周任务:
- 完成项目核心功能开发。
- 使用 Gradio 或 Streamlit 制作一个简易 Web 界面(15 分钟可上手)。
- 编写项目 README,包含:
- 项目介绍(解决了什么问题)
- 技术栈(用了哪些模型、框架、工具)
- 运行方式(如何安装依赖、启动)
- 效果截图或演示说明
- 压力测试:自己当用户,连续测试 10 个不同的问题/需求,修复明显 Bug。
交付标准:
- 代码已上传 GitHub(或本地仓库整理好)。
- 运行
python app.py能弹出一个可交互的网页。 - 能向朋友/面试官清晰描述这个 Agent 的工作原理和价值。
| 时间 | 内容 | 时长 |
|---|---|---|
| 周二晚上 | 学习新概念 + 看示例代码 | 2 小时 |
| 周四晚上 | 动手写代码 + 调试 | 2 小时 |
| 周六下午 | 实战项目开发 | 3 小时 |
| 周日上午 | 复习 + 整理笔记 + 向 OpenCode 提问 | 3 小时 |
Week 1-2: Prompt 与 LLM 基础 → 精准驾驭模型,产出文案/纪要
Week 3-4: RAG + 工具调用 → 让 AI 查资料、算数据、调 API
Week 5-6: Agent 框架 → 让 AI 自主思考、拆解任务、循环执行
Week 7-8: 综合项目 → 整合所有技能,产出个人作品
- 概念不懂:直接问“什么是 ReAct?”“给我对比一下 RAG 和微调”。
- 代码报错:将报错信息和相关代码贴给我,我会帮你分析原因。
- 需求实现:告诉我“我想做一个 XXX 功能,给我写个 Demo”。
- 代码 review:写完后发给我,我会帮你检查是否有更好的写法或潜在 Bug。
- 学习计划调整:如果某一周太忙或太简单,随时告诉我,我们一起调整进度。
- 申请一个 API Key(建议优先选择,成本较低):
- DeepSeek 开放平台(便宜、速度快)
- 阿里云百炼(Qwen 系列、中文友好)
- 确保本地 Python 环境 >= 3.9。
- 安装基础库(后续周会逐步用到):
pip install openai langchain chromadb faiss-cpu gradio streamlit
祝学习顺利!准备好后,从第一周开始,直接告诉我:“我准备好了,开始第一周的学习。”