「auto-subs」本地字幕生成器：把转录、说话人识别和剪辑软件导出接在一起

auto-subs 最有意思的地方，不是“能自动生成字幕”这件事本身，而是它把字幕生成放回了剪辑师真正工作的地方：本地电脑、时间轴、SRT 文件、Resolve、Premiere 和 After Effects。它可以把音频或视频转成带时间戳的字幕，也能在需要时做说话人识别和翻译，最后把结果导出成 SRT、纯文本，或者送回常用剪辑软件里继续处理。

这类工具的关键差别在于工作流。很多在线字幕服务适合临时处理一个视频，但素材要上传，隐私、费用和等待队列都不完全可控。auto-subs 的 AI 转录跑在设备端，不需要订阅；模型第一次使用时会下载到本地，之后可以在 Whisper、Parakeet、Moonshine 等模型之间切换。对采访、课程、播客切片、短视频批量生产来说，本地化不是噱头，而是少一次上传、少一层权限顾虑。

它现在也不只是一个独立桌面应用。README 里把三条路线写得很清楚：独立模式下选择文件、模型和语言，生成后导出字幕；DaVinci Resolve 里可以通过脚本入口处理时间线，并把带样式的字幕送回 Resolve；Premiere Pro 和 After Effects 则通过捆绑的 CEP 扩展和桌面端沟通。做 Adobe 工作流的人，可以把时间线音频导出给 auto-subs，再把字幕导回宿主软件，Premiere 中是 caption tracks，After Effects 中则生成文本层。

新版 v3.5 还补上了不少“每天会用到”的细节：语音活动检测可以先剔除非语音片段，让转录更快也更干净；说话人标签模型升级后，多人对话的整理成本会低一些；字幕支持自由文本编辑，历史记录可以重新打开过去的转录结果；界面也加入了中文、日文、韩文、法文等多语言。本地命令行入口同样值得注意，装好 autosubs 后，可以直接在终端里把 interview.mp4 转成 text、srt、vtt 或 json，这对脚本化处理素材尤其顺手。

项目目前约 3542 个 Star，MIT 许可证，主语言是 TypeScript，支持 Windows、macOS 和 Linux；macOS 用户还可以通过 Homebrew cask 安装。它的边界也要说清楚：转录质量仍然取决于模型、语种、音频质量和机器性能；如果你用的是 Mac App Store 版 DaVinci Resolve，项目文档也明确提醒需要换成官网版本。换句话说，它不是一键替代所有字幕后期，但很适合想把字幕、说话人、翻译和剪辑软件导出集中到本地链路里的创作者。