MiMo 模型退化循环问题的完整调查报告。
使用 xiaomimimo/mimo-v2.5-pro 模型时,当 reasoning=True,模型有约 30% 的概率进入退化循环:
- 同一段输出重复 8-11 次
- 持续约 6 分钟
- 输出语言从中文切换为英文
- 不执行任何工具调用
mimo-loop-report/
├── README.md # 本文档
├── logs/
│ └── degenerate_loop_raw.log # 原始日志(含系统配置和完整时间线)
├── reproduce/
│ └── test_loop_reproduce.sh # 复现脚本(需要 API 密钥)
└── analysis/
└── root_cause_analysis.md # 根因分析
cat logs/degenerate_loop_raw.log日志包含完整的系统配置、模型参数和循环时间线。
cat analysis/root_cause_analysis.md分析涵盖:
- 退化循环的详细特征
- 语言切换机制分析
- Token 概率分布塌缩的推测
- 各修复方案的原理和效果评估
export MIMO_API_KEY="your_key_here"
bash reproduce/test_loop_reproduce.sh --count 10 --timeout 300概率约 30%,需要多次测试才能捕获循环。
- 根因:
reasoning=True中的英文推理引擎在特定输入条件下进入固定点收敛 - 参数修复无效:
frequency_penalty、temperature、System Prompt 调整均无效 - 工程修复有效:
timeoutSeconds=180+maxTokens=8000可在工程侧阻止循环 - 行为检测有效:输出模式检测可提前终止循环
详见 analysis/root_cause_analysis.md。
检测脚本和防护措施参考 mimo-stable 项目。
MIT