「Live Translator」macOS 菜单栏实时翻译工具:把系统音频转成屏幕字幕

Live Translator 在 macOS 上实时翻译 YouTube 系统音频

Live Translator 是一个 macOS 菜单栏工具,解决的是一个很直接的场景:你在 Mac 上看 YouTube、听 podcast、开外语会议或看电影,系统里正在播放的音频会被实时转写、翻译,并显示在屏幕上的浮动面板里。

它不是让你复制字幕、上传音频文件,或者在浏览器标签之间来回切换。README 里描述的链路是:ScreenCaptureKit 捕获系统音频,SFSpeechRecognizer 在本机做语音识别,然后把累积文本交给 OpenAI 或 Google Gemini 做上下文翻译,最后用 WebKit 浮窗显示出来。

像一层悬浮字幕

Live Translator 的设计重点是“听什么翻什么”。它支持英语、德语、法语、西班牙语、意大利语、日语、中文、韩语、俄语、阿拉伯语、葡萄牙语等源语言,也能翻译到多种目标语言。新翻译会高亮,整个翻译结果像一份不断增长的 live document,而不是一句一句互不相干的碎片字幕。

它还带有 TTS:默认可以用离线的 Piper,也可以选择 OpenAI 或 Gemini 语音。设置里能切换翻译提供商、API key、模型、语言和语音参数;安装方式则包括 GitHub Releases 的 DMG、Homebrew cask,以及从源码运行。

隐私边界要看模式

这个项目比较值得注意的一点,是它默认把语音识别放在本机做。也就是说,默认模式下音频不离开 Mac,发给翻译提供商的是识别后的文本。但它也提供可选的低延迟 Realtime 模式,此时音频会直接流式发送给 OpenAI 的 Realtime Translation 模型,换来更低延迟,但隐私边界也变了。

仓库目前是 MIT 许可证,主要语言是 Python,包含一部分 Swift/C/Shell,用于 macOS app、设置向导、系统音频捕获和打包流程。最新 release 是 v0.1.0,README 写明需要 macOS 13+、Python 3.11+,以及 OpenAI API key;项目还很年轻,Star 数不高,但思路很清楚,适合想在 Mac 上做“任何音频实时字幕翻译”的人试试。

传送门

https://github.com/umutcetinkaya/live-translator

原创文章,如若转载,请注明出处:https://wefound.cc/p/3347.html

(0)
「Markdown Preview」免费开源的原生 macOS Markdown 阅读器,支持 Quick Look 和大纲跳转
上一篇 2026年 5月 23日 上午8:48
「Vibe-Trading」开源个人交易研究 Agent:用自然语言跑市场数据、回测和多智能体分析
下一篇 2026年 5月 23日 上午11:08

相关推荐