面向 Agentic Coding 的软件工程

对于未来的判断

未来软件工程的组织方式，会从面向人类转变为面向 AI/Agent —— 所有软件工程中执行的部分：coding, documentation, testing, debugging, etc. 都会由 AI/Agent 来完成，而人类的重点将转移到设计面向 AI/Agent 的架构（管理好目录结构、文档、历史记录），以及 review AI/Agent 的输出。

什么是 Agentic Coding

之所以不叫做 AI Coding，是想更准确地定义不同事物、理解各自的职责和范围。

LLM

LLM 本质是一个与 CPU 类似的数字化处理器，接收信息输入，处理后输出信息。区别是，CPU 输出的信息是基于确定的规则的，可重现的；而 LLM 是一种神经网络处理器，输出的信息是基于概率的。因此，LLM 就能用来处理原来再强大的 CPU 也无法处理的非结构化数据与模糊问题。

graph LR
    A1[输入] --> B1[CPU: 基于规则处理] --> C1[确定性输出]
    A2[输入] --> B2[LLM: 基于概率处理] --> C2[概率性输出]
    D[非结构化数据/模糊问题] --> B2
    D -.- |难以处理| B1

之所以通用人工智能的英文是 AGI 而不是 GAI，是因为 General Intelligence 在计算机出现之前就是一个学术名词了 —— 查尔斯·斯皮尔曼（Charles Spearman）于 1904 年提出的 $g$ 因子（general factor）理论，认为智力由一个通用因子（g）和多个特殊因子（s）组成 —— 用于描述多种能力维度的测试表现出的智力上的相关性。

什么是智力？—— 智力就是预测未来的能力，也就是预测未来某个事件发生的概率的准确率。

韦氏智商测试（Wechsler Intelligence Scale）会对这些方面的能力进行量化测试：语言理解（Verbal Comprehension）、语言流畅（Language Fluency）、数字能力（Numerical Ability）、视觉空间/知觉推理（Visual Spatial / Perceptual Reasoning）、流体推理（Fluid Reasoning）、记忆（Working Memory）、处理速度（Processing Speed）、执行功能（Executive Function）。

可以说，LLM 在所有这些方面的表现都会远远优于人类：

逻辑能力（理解、计算、推理）会超过在领域内最尖端的人类，比如 2025 年内很可能出现比所有人类 coding 能力都强的 AI；
处理速度 是人类的 100x。不仅编写代码快，而且设计、重构、测试、管理文档 …… 都很快；

但与人类不同的是，人类有刻在基因里的目标 —— 将基因延续下去，因此需要生存和繁衍。为了实现这些目标，需要个体以及群体合作，因此逐渐进化出情感、自我意识（分工与试错），于是也需要承载自我意识的长期记忆。

Agentic Coding

而 Agent 的工作，或者说 Agentic Coding，就是想办法利用 LLM 的这些长处，设计一套工作流程和规范来补足 LLM 的局限，使得可以快速、高质量地完成我们的工程目标。

目前，AI/Agentic Coding 在实用性上受限于：

LLM 缺乏对整个项目全局的理解，往往只关注完成当前的任务；
LLM 缺乏对人类意图的理解，往往只能完成人类 prompt 的表面工作；
LLM 缺乏对仓库历史的长期记忆，因此缺乏长期维护的能力，往往只能完成短期任务；
LLM 缺乏为减少将来的工作而进行优化的意识 —— 不会整理仓库、删除不必要的文件、重构代码、优化算法、更新注释和文档 …… 等；
如果人工对于仓库手动做了修改，AI/Agent 很难获得这部分信息，因此对于项目的过程的记忆是不完整的。

使用 LLM 来写代码，非常像雇佣了一群新认识的 freelancer。

是一个 24x7 可以响应的、劳动力带宽几乎无限的一群 freelancer；
这群 freelancer 的活不仅质量高、还非常便宜；
但是这群 freelancer 只关注完成你给的特定任务，如果没有具体的 prompt，他们不会想着需要在达成全局目标（或约束）的情况下完成任务，也不会想到我完成之后如何让其他人能方便地接手。

当你给的指令、目标、约束不清晰时，它给你的完成度就是一个刚刚能跑的代码。如何能让这群 freelancer 对齐我们的要求从而更高质量地完成任务，并让项目保持持续可迭代的状态，就是 Agentic Coding 要解决的问题。

解决办法：Agentic Coding 最佳实践框架

使用 Agent-friendly 的目录结构

把 high level 的目标，明确的要求、约束、规范，都落实在项目目录里，并且让 agent 记录留下任务的记录。

一些关于项目目录结构的思路：

README.md：项目概述，包括项目的目标、约束、规范等
CLAUDE.md：Claude Code 需要用到的全局 prompt
.agent/：由 agent 使用和维护，agent 可在没有人类授意的情况下依据自己的判断和工作流的要求而更新其中内容，用于存放所有 agent 生成、以及 agent 今后需要使用的相关文件；在开发过程中，需要让 LLM 在 /.agent/ 下留下可以给自己将来使用的记忆，并不断地思考和反思，更新相应的 /.agent/ 和 /docs/ 目录下的文件
- tasks/：每次执行的任务信息，时间、总结人类的 prompt 和 agent 执行的工作结果与反思信息 —— 文件格式为 YYYY-MM/DD_{TIMESTAMP}.md
- reflections/：agent 执行任务时犯的错误、碰到的问题的总结与反思 —— 文件格式为 YYYY-MM/{REFLECTION_TITLE_SLUG}.md，类似的问题在一个文件中合并
- releases/：每个版本的信息，包括发布日期、版本号、发布说明等 —— 文件格式为 YYYY-MM/v{VERSION_NUMBER}.md
.cursor/：Cursor Editor 的配置文件目录
- rules/：Cursor 用到的规则
docs/：由人类维护（agent 可以在明确指令下修改，但不应该因为自己的需要或工作流的关系自动修改其中的内容），以传统方式存放项目的开发文档
- decisions/：存放所有与项目相关的决策记录，包括决策的背景、理由、以及决策后的结果 —— 文件格式为 YYYY/{THREE_DIGIT_SEQUENCE_NUMBER}_{DECISION_TITLE_SLUG}.md
- debts/：用于存放项目当前的技术债务以及重构的机会 —— 文件格式为 {DEBT_TITLE_SLUG}.md
- metrics/：用于存放项目当前的各类技术指标，需要包括原因和潜在的解决方法，包括：
  - performance-metrics.md：性能指标
  - code-quality-metrics.md：代码质量指标
  - test-coverage.md：测试覆盖率指标
- specs/：存放所有与项目相关的技术规范，包括：
  - architecture.md：架构设计
  - coding-standards.md：编码规范
  - db-schema.md：数据库 schema
  - diagrams.md：系统图表
  - documentation-standards.md：文档格式规范
  - interfaces.md：对外接口
  - testing-standards.md：测试标准

给 LLM 配上工具 —— MCP

LLM 像一个强大的大脑，但是没有眼睛、耳朵、嘴巴、手脚，因此需要借助外部工具来最大化这个智力体的能力，目前发展最迅速的就是 MCP (Model Context Protocol)，大量 MCP Server 可以作为 AI 的眼睛耳朵和手脚。

我把 MCP 分为两类：接收器（collector）和执行器（executor）：

接收器（collector）：接收信息输入，并将其转换为 LLM 可以理解的信息，给 LLM 提供更多的知识和上下文；例如：Fetch, Firecrawl, Brave Search 等，让 LLM 可以获取互联网上的信息；
执行器（executor）：接收 LLM 的输出，并将其转换为可以执行的指令，让 LLM 可以实际甚至物理上操作其他工具；BlenderMCP, Unity MCP Package, Figma Context MCP。

一般来说，我们把类似 Claude Code 或 Cursor 这样的 LLM 作为 MCP 的 Client。

解决方案

以上是完整的上下文，解决方案由 AI 输出，保存在 PLAN.md。prompt 如下：

Follow the steps below:
1. Read `README.md` and `CLAUDE.md` and use `git diff` to fully understand the context.
2. Think harder to create a practical agentic coding framework and an implementation plan that is elegant, efficient, and easy to practice.
3. Insert it into `PLAN.md`, ensuring the language is concise yet sufficiently detailed to be actionable. By concise, I mean to avoid general rules that you would naturally follow even without documentation, thereby minimizing word redundancy and emphasizing specific instructions ones.
4. Check `PLAN.md` to see if it aligns with the context. Revise `PLAN.md` if necessary needed.

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.agent		.agent
.claude/commands		.claude/commands
.cursor/rules		.cursor/rules
.github		.github
.husky		.husky
.vscode		.vscode
docs		docs
tests		tests
utils		utils
.autocorrectignore		.autocorrectignore
.autocorrectrc		.autocorrectrc
.gitattributes		.gitattributes
.gitignore		.gitignore
.markdownlint.json		.markdownlint.json
CHANGELOG.md		CHANGELOG.md
CLAUDE.md		CLAUDE.md
PLAN.md		PLAN.md
README.md		README.md
biome.json		biome.json
bun.lock		bun.lock
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

面向 Agentic Coding 的软件工程

对于未来的判断

什么是 Agentic Coding

LLM

Agentic Coding

解决办法：Agentic Coding 最佳实践框架

使用 Agent-friendly 的目录结构

给 LLM 配上工具 —— MCP

解决方案

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

面向 Agentic Coding 的软件工程

对于未来的判断

什么是 Agentic Coding

LLM

Agentic Coding

解决办法：Agentic Coding 最佳实践框架

使用 Agent-friendly 的目录结构

给 LLM 配上工具 —— MCP

解决方案

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages