需求
支持用户自定义常用词库,提升专有名词的识别和输出准确率。
背景
提示词调优实验中发现,剩余的润色质量 gap 主要来自 ASR 级别的专有名词识别问题:
| ASR 输出 |
期望输出 |
类型 |
| 泰普勒斯 |
Typeless |
品牌名 |
| 克劳德 |
Claude |
品牌名 |
| 杠 rule |
/review |
命令 |
| 点 cloud |
.Claude |
路径 |
| C M |
CRM |
缩写 |
这类问题无法通过提示词解决,需要词库机制。
待研究
- 词库来源:产品自动归纳高频词 vs 用户手动添加 vs 两者结合
- 词库生效位置:
- ASR 阶段:阿里云 ASR API 支持 hotwords 参数,可在语音识别时直接偏向特定词汇
- LLM 阶段:将词库注入 system prompt,让 LLM 在润色时参考替换
- 两者结合效果可能最佳
- 存储方案:本地 JSON/plist 文件,ConfigManager 管理
- UI:设置面板中增加词库管理入口(添加/删除/导入导出)
参考
- 阿里云 ASR hotwords 文档
- 当前 ASR 调用在
QwenCloudEngine.swift
- LLM 提示词在
ConfigManager.swift:defaultSystemPrompt
需求
支持用户自定义常用词库,提升专有名词的识别和输出准确率。
背景
提示词调优实验中发现,剩余的润色质量 gap 主要来自 ASR 级别的专有名词识别问题:
这类问题无法通过提示词解决,需要词库机制。
待研究
参考
QwenCloudEngine.swiftConfigManager.swift:defaultSystemPrompt