「Live Translator」开源 macOS 实时音频翻译器：把 YouTube、会议和播客变成悬浮字幕

Live Translator 是一个开源的 macOS 实时音频翻译工具，目标场景很明确：你在 Mac 上播放 YouTube、播客、会议、电影或任意系统音频，它把正在播放的内容识别出来，再用 AI 翻译成悬浮在屏幕上的字幕。

它不是简单地逐句丢给翻译接口。项目采用的是 live document model：识别到的上下文会持续累积，翻译结果像一篇正在生长的文档一样更新，新变化会被高亮。这样在听播客或会议时，不容易因为半句话、停顿或前后文断裂而读到一堆碎片化字幕。

技术路径也很贴近 macOS。音频捕获使用 ScreenCaptureKit，因此不需要额外安装虚拟声卡或音频驱动；默认语音识别走系统端的 SFSpeechRecognizer，README 里明确说明默认情况下音频不会离开你的 Mac，发送给翻译提供商的是文本。需要更低延迟时，也可以开启 OpenAI Realtime 模式，但这会把音频流发送给 provider，隐私取舍就要自己判断。

翻译端支持 OpenAI 和 Google Gemini，并且在 v0.1.0 里做了多 provider 架构：设置里可以切换 provider、API key、模型、TTS 和语言。它还带离线 Piper TTS，也可以选择 OpenAI 或 Gemini 的语音，把翻译读出来。对看外语直播、跨语言会议、外语课程或长视频的人来说，这比复制字幕再翻译顺手得多。

项目目前约 27 stars，MIT 许可证，最新版本 v0.1.0 发布于 2026 年 5 月 20 日，提供 macOS DMG，也可以通过 Homebrew cask 或源码方式安装。需要注意的是，它要求 macOS 13+，并且翻译 provider 通常需要你自己的 OpenAI 或 Gemini API key。