听写工作原理
TalkWriter 通过多阶段流程将你的语音转化为润色后的即用文本。
听写流程
🎤 语音输入 → 📝 语音转文字 → ✨ AI 润色 → 📋 粘贴
阶段 1:语音输入
麦克风捕获你的语音,TalkWriter 实时将音频数据流式传输到云端。
提示
为获得最佳效果,请清晰说话,保持麦克风距离嘴部 15-30 厘米。详见麦克风最佳实践。
阶段 2:语音转文字(Soniox STT)
专业级语音识别引擎(Soniox)将音频实时转换为原始文本。支持 100+ 种语言,能处理口音、快速语速和专业词汇。
阶段 3:AI 润色
TalkWriter 的 AI 引擎清理原始转录文本:
| 转换 | 之前 | 之后 |
|---|---|---|
| 去除填充词 | "嗯"、"呃"、"那个" | 已移除 |
| 添加标点 | "你好吗" | "你好吗?" |
| 修正大小写 | "i went to new york" | "I went to New York" |
| 格式化数字 | "二十五美元" | "$25" |
专业版功能
TalkTone 在 AI 润色之后额外添加风格化处理。如果你有专业版,文本会被改写为所选的写作风格。立即升级 →
阶段 4:粘贴
润色后的文本被插入到活跃应用中光标所在的位置。
流程总结
| 阶段 | 引擎 | 位置 | 速度 |
|---|---|---|---|
| 语音输入 | 你的麦克风 | Mac 本地 | 即时 |
| 语音转文字 | Soniox(云端) | 实时流式传输 | ~200ms 延迟 |
| AI 润色 | TalkWriter AI(云端) | 语音结束后 | ~500ms-1s |
| 粘贴 | macOS 辅助功能 | Mac 本地 | 即时 |
常见问题
可以跳过 AI 润色获取原始转录吗? 可以。在设置 > AI 润色中关闭即可。
我的音频会存储在服务器上吗? 音频仅用于实时处理流式传输,不会永久存储。
TalkWriter 为什么需要互联网? 语音转文字引擎和 AI 润色都在云端运行。所有听写都需要互联网连接。