Skip to content

Hugin-Z/tender-writer-v4

Repository files navigation

tender-writer-v4

License Python Platform AI

项目状态

稳定可用(主开发环境) — 当前主线已推进到 V4-7a:V3 主流程已封板,V4 完成 B 模式保真、C-attachment、整标合并浅层规范化等增量。Linux / macOS 未验证。

  • 测试覆盖: 16 个测试文件 / ./run_script.bat tests/run_all.py 全 PASS
  • demo 项目: projects/demo_cadre_training/ 端到端可重跑(parse_tender → ... → export_deliverables 11 步)
  • 主开发环境: Windows 10+ + Python 3.11,Linux/macOS 未验证

把政府类项目技术标的首轮结构化拆解与初稿组装压缩到分钟级;正式投标仍需人工扩写、校核和审稿。

💡 完整端到端流程见 projects/demo_cadre_training/,clone 下来跑一遍即知工具链能力边界。


快速开始

# 1. clone
git clone https://github.com/Hugin-Z/tender-writer-v4.git
cd tender-writer-v4

# 2. 装依赖(Windows 双击即可)
install.bat

# 3. 打开 VSCode + Claude Code,告诉它:
#    "请读 SKILL.md,开始处理 projects/demo_cadre_training 的标书编制"

示范项目位于 projects/demo_cadre_training/,Clone 下来即可跑通端到端。


系统依赖

  • Python: 3.11+(实测版本;3.10 未做兼容性验证)
  • OS: Windows 10+(主开发环境);Linux / macOS 未在 CI 验证,社区贡献欢迎
  • git: 必装(scripts/demo_reset.py 等运维工具依赖 git CLI)
  • Python 包: 8 个核心包(pdfplumber / python-docx / docxtpl / PyYAML / docxcompose / opencc / lxml / pypinyin),完整清单 requirements.txt
  • 可选: OCR 工具(扫描版 PDF 处理时按需,详见 docs/FAQ.md Q4)

依赖通过 install.bat 自动装到隔离虚拟环境(.venv/),不污染系统 Python。


核心能力

  • 五阶段主干工作流:招标文件解析 → 评分矩阵 → 提纲 → 分章节撰写 → 合规终审,每阶段可 review;另含并列阶段 4-B(B 模式材料组装) / 4-C(C 模式模板填充) / 6(交付层导出)
  • 评分矩阵追踪:10 列 CSV 把每一分拆到应答章节,杜绝漏答
  • 项目类型识别:工程 / 平台 / 研究 / 规划 / 其他 5 类自动选 outline 模板
  • docx 渲染质量:统一中文宋体、黑色标题、图占位区块、字号相对规则、空格自动清理
  • B 模式材料组装(表格 + 段落样式保真,V4-1a):asset 注入 assembled.docx 走 OXML element 拷贝,表格(含列宽)、段落级样式、字体、加粗保真;图片保真留 V4-1b 实现层,当前结构层会对含图段落插入可见占位并产 missing_elements.yaml;公章不做(签章是用户的法律动作,工具不代为生成,投标时用户自行处理公章页)。无命中时产占位 + .pending_marker,V45 合并器列入 pending_manual_work.md
  • C 模式非交互填充:一键跑完所有 C 模式 Part,变量缺失时 filled.docx 写入"【待填:变量描述】"显式占位
  • C-attachment 附件挂载(V4-4):独立附件不并入主响应文件,由 attachments.yaml 记录源文件状态,V45 合并器拷贝附件并在操作清单中提示待人工放置项
  • D 模式(已决策不做):线上查资质类(信用中国"无违法记录"查询截图)已决策不做 — 低频人工操作 ROI 低于自动化工程成本,这类合规截图人工处理(同"证书图人工放原件"的人机分工)
  • V45 整标合并(V4-7a):合并后接 master 规范做 style 层字体统一和表格 cell 字号统一;列宽、section、页码 reset 仍留 V4-7b 由真实多 Part 产物驱动
  • 跨章节一致性检查:团队成本 vs 预算、承诺时间 vs 工期等自相矛盾类错误自动捕获
  • Claude Code 深度协作契约:CLAUDE.md 定义 6 条硬红线,AI 行为可预期

版本演进

V4-7a(当前) — 在 v3.0.0 稳定主流程基础上继续补齐材料组装、附件挂载和整标合并质量:

  • V4-1a(B asset 深度保真):B asset 表格、段落样式、字体、字号保真;图片/页眉页脚留 V4-1b 实现层,但结构层已可见占位不静默丢图
  • V4-2a(选材防盲写):B 模式选材读取 assets_inventory.json,防止 AI 盲写库内不存在的素材
  • V4-4(C-attachment 真做):C-attachment 从挂档变为真实业务分支,extract/fill/merge/export 端到端跑通
  • V4-skel(结构层补全 + 占位喊话地图):V4-1b / V4-2b / V4-7 的结构层和占位喊话地图落地
  • V4-7a(合并器浅做):V45 合并器完成 style 层字体规范和表格 cell 字号规范;V4-7b 深度格式协调仍押后

v3.0.0 — 在 v2.0.x 基础上完成 14 项改进(V3-1 至 V3-14):

  • 测试覆盖:从 1 个测试文件扩到 12 个文件,涵盖 parse_tender / build_scoring_matrix / generate_outline / b_mode / c_mode / compliance_check / check_chapter / check_cross_consistency 等核心模块
  • B 模式真实组装:CuratedLocalAssetsProvider 默认走 assets/<类别>/<company_id>/_raw/ 真实命中,不再纯占位
  • 合规检查扩展:V3-2 字体安全(段落级 + fontTable.xml 级)/ V3-4 正文级缝合句作弊检测 / V3-5 --section-only 跳封面目录 / V3-9 跨章节字段一致性 / 简历 vs 架构图人名一致性 / 章节交叉引用编号有效性
  • 扫描版 PDF 处理(V3-6):parse_tender.py 自动检测扫描版 PDF(全文平均 < 50 字/页),提供 --ocr-text fallback 通道(用户外部 OCR 后塞回 txt 走后续解析)
  • 工具链可重跑(V3-13):scripts/demo_reset.py 提供 demo 项目无破坏重跑的标准化路径
  • timing 埋点(V3-3):_timing_hook.py 给 7 个核心脚本加阶段耗时埋点 + _timing_report.md 产出
  • Word 直切集成(V3-7):c_mode_run 自动分流模板填充 vs 整段直切场景
  • 文档口径统一(V3-10/V3-11/V3-12):五阶段主干 + 并列阶段措辞统一 / B 模式 README 诚实化 / SKILL.md description 关键词从 25 精简到 10

详见 docs/v3_planning.mddocs/changelog.md

v2.0.x — 基于 v1.1 两轮迭代沉淀,核心变化:AI 输出规则常驻化(R1-R10)、docx 渲染质量总攻、非交互化、项目类型识别。详见 docs/v2_design_notes.md


与 AI 工具的兼容性

  • Claude Code(推荐):项目级协作深度最优,读取 SKILL.md + CLAUDE.md 走完整五阶段主干 + 并列阶段;进阶用户建议读 CLAUDE.md 了解工具链协作契约
  • Cline / Cursor / 通义灵码 / 等其他 AI IDE 插件:能读 SKILL.md 即可工作,部分硬红线靠 references/ai_output_rules.md 兜底
  • 纯对话 AI(ChatGPT / DeepSeek Web 等):把 SKILL.md 和当前阶段文件发给 AI,按阶段手工推进

典型应用场景

  • 政府采购公开招标 / 竞争性磋商 / 竞争性谈判 技术标(25-500 万元规模)
  • 事业单位 / 国有企业公开采购 技术响应文件
  • 外部专业咨询 / 培训服务 / 工程咨询 等服务类项目投标

深度文档

文档 面向
SKILL.md 五阶段主干 + 并列阶段工作流细节,AI 入口,必读
CLAUDE.md Claude Code 协作契约,6 条硬红线
docs/DESIGN.md 设计哲学 / 为什么这么设计
docs/v4_backlog.md V4 剩余工作快照与已完成项边界
docs/v3_planning.md V3 改进路线图 + 完成判定(14 项)
docs/manifest_schema.md manifest.yaml 字段定义(B 模式 assembly_order schema)
docs/v2_design_notes.md v2 设计决策记录
docs/v2_roadmap.md v2 路线图(已完成,留作历史)
docs/changelog.md 版本变更日志
docs/FAQ.md 常见问题

许可证

MIT © 2026 Hugin-Z · 问题反馈:提 Issue

About

把政府类项目技术标的首轮结构化拆解与初稿组装压缩到分钟级;正式投标仍需人工扩写、校核和审稿。

Resources

License

Contributing

Stars

Watchers

Forks

Packages

 
 
 

Contributors