
Live Translator 是一个开源的 macOS 实时音频翻译工具,目标场景很明确:你在 Mac 上播放 YouTube、播客、会议、电影或任意系统音频,它把正在播放的内容识别出来,再用 AI 翻译成悬浮在屏幕上的字幕。
它不是简单地逐句丢给翻译接口。项目采用的是 live document model:识别到的上下文会持续累积,翻译结果像一篇正在生长的文档一样更新,新变化会被高亮。这样在听播客或会议时,不容易因为半句话、停顿或前后文断裂而读到一堆碎片化字幕。
技术路径也很贴近 macOS。音频捕获使用 ScreenCaptureKit,因此不需要额外安装虚拟声卡或音频驱动;默认语音识别走系统端的 SFSpeechRecognizer,README 里明确说明默认情况下音频不会离开你的 Mac,发送给翻译提供商的是文本。需要更低延迟时,也可以开启 OpenAI Realtime 模式,但这会把音频流发送给 provider,隐私取舍就要自己判断。
翻译端支持 OpenAI 和 Google Gemini,并且在 v0.1.0 里做了多 provider 架构:设置里可以切换 provider、API key、模型、TTS 和语言。它还带离线 Piper TTS,也可以选择 OpenAI 或 Gemini 的语音,把翻译读出来。对看外语直播、跨语言会议、外语课程或长视频的人来说,这比复制字幕再翻译顺手得多。
项目目前约 27 stars,MIT 许可证,最新版本 v0.1.0 发布于 2026 年 5 月 20 日,提供 macOS DMG,也可以通过 Homebrew cask 或源码方式安装。需要注意的是,它要求 macOS 13+,并且翻译 provider 通常需要你自己的 OpenAI 或 Gemini API key。
项目地址
项目地址:https://github.com/umutcetinkaya/live-translator
原创文章,如若转载,请注明出处:https://wefound.cc/p/4261.html