跳到主要内容

听写工作原理

TalkWriter 通过多阶段流程将你的语音转化为润色后的即用文本。


听写流程

🎤 语音输入 → 📝 语音转文字 → ✨ AI 润色 → 📋 粘贴

阶段 1:语音输入

麦克风捕获你的语音,TalkWriter 实时将音频数据流式传输到云端。

提示

为获得最佳效果,请清晰说话,保持麦克风距离嘴部 15-30 厘米。详见麦克风最佳实践


阶段 2:语音转文字(Soniox STT)

专业级语音识别引擎(Soniox)将音频实时转换为原始文本。支持 100+ 种语言,能处理口音、快速语速和专业词汇。


阶段 3:AI 润色

TalkWriter 的 AI 引擎清理原始转录文本:

转换之前之后
去除填充词"嗯"、"呃"、"那个"已移除
添加标点"你好吗""你好吗?"
修正大小写"i went to new york""I went to New York"
格式化数字"二十五美元""$25"
专业版功能

TalkTone 在 AI 润色之后额外添加风格化处理。如果你有专业版,文本会被改写为所选的写作风格。立即升级 →


阶段 4:粘贴

润色后的文本被插入到活跃应用中光标所在的位置。


流程总结

阶段引擎位置速度
语音输入你的麦克风Mac 本地即时
语音转文字Soniox(云端)实时流式传输~200ms 延迟
AI 润色TalkWriter AI(云端)语音结束后~500ms-1s
粘贴macOS 辅助功能Mac 本地即时

常见问题

可以跳过 AI 润色获取原始转录吗? 可以。在设置 > AI 润色中关闭即可。

我的音频会存储在服务器上吗? 音频仅用于实时处理流式传输,不会永久存储。

TalkWriter 为什么需要互联网? 语音转文字引擎和 AI 润色都在云端运行。所有听写都需要互联网连接。