Skip to content
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Original file line number Diff line number Diff line change
@@ -0,0 +1,33 @@
### 姓名

ZhijunLStudio

### 实习项目

AutoTrainer 自动化训练工具

### 本周工作

1. 架构 v2 重构:拆分 PipelineOrchestrator God Class(887行 → 80行),拆分为 7 个独立的 PhaseHandler(ablation / data_prepare / env_check / evaluation / full_training / report / task_confirm),每个 handler 职责单一、可独立测试

2. 状态管理升级:将原先散布在 4 个 JSON 文件中的状态统一迁移到 SQLite 存储(4 张表),支持事务性读写和断点恢复

3. 任务注册机制:将 hardcoded 的 paddleocr-vl 配置改为 manifest.yaml 插件注册方式,新增 TaskSpec 接口定义,ConfigBuilder 改为基于 TaskSpec 驱动,移除了 71 行硬编码默认配置

4. 实验管理统一:抽取重复的 CRUD 逻辑为 ExperimentService,新增 CheckpointService,统一实验全生命周期管理

5. 新增 train_cmd.py CLI 入口,串联 data → train 完整工作流

6. 修复 ValidationResult 缺少 warnings 参数导致的运行时异常

7. 新增 46 个测试用例(总计 74 个测试,全部通过),覆盖 phases / pipeline / registry / services / store 各模块

8. README 双语化:拆分为 README.md(英文)和 README-zh.md(中文),添加语言切换链接

### 导师点评

### 下周工作

1. 持续完善 manifest.yaml 的任务参数定义,补充超参搜索空间配置
2. 在实际 OCR 数据上测试 v2 架构端到端流程稳定性
3. 补充 architecture v2 的架构文档和模块说明