Skip to content

feat: 常用词库支持 #2

Description

@zch200

需求

支持用户自定义常用词库,提升专有名词的识别和输出准确率。

背景

提示词调优实验中发现,剩余的润色质量 gap 主要来自 ASR 级别的专有名词识别问题:

ASR 输出 期望输出 类型
泰普勒斯 Typeless 品牌名
克劳德 Claude 品牌名
杠 rule /review 命令
点 cloud .Claude 路径
C M CRM 缩写

这类问题无法通过提示词解决,需要词库机制。

待研究

  1. 词库来源:产品自动归纳高频词 vs 用户手动添加 vs 两者结合
  2. 词库生效位置
    • ASR 阶段:阿里云 ASR API 支持 hotwords 参数,可在语音识别时直接偏向特定词汇
    • LLM 阶段:将词库注入 system prompt,让 LLM 在润色时参考替换
    • 两者结合效果可能最佳
  3. 存储方案:本地 JSON/plist 文件,ConfigManager 管理
  4. UI:设置面板中增加词库管理入口(添加/删除/导入导出)

参考

  • 阿里云 ASR hotwords 文档
  • 当前 ASR 调用在 QwenCloudEngine.swift
  • LLM 提示词在 ConfigManager.swift:defaultSystemPrompt

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions