「auto-subs」本地字幕生成器:把转录、说话人识别和剪辑软件导出接在一起

auto-subs 产品界面

auto-subs 最有意思的地方,不是“能自动生成字幕”这件事本身,而是它把字幕生成放回了剪辑师真正工作的地方:本地电脑、时间轴、SRT 文件、Resolve、Premiere 和 After Effects。它可以把音频或视频转成带时间戳的字幕,也能在需要时做说话人识别和翻译,最后把结果导出成 SRT、纯文本,或者送回常用剪辑软件里继续处理。

这类工具的关键差别在于工作流。很多在线字幕服务适合临时处理一个视频,但素材要上传,隐私、费用和等待队列都不完全可控。auto-subs 的 AI 转录跑在设备端,不需要订阅;模型第一次使用时会下载到本地,之后可以在 Whisper、Parakeet、Moonshine 等模型之间切换。对采访、课程、播客切片、短视频批量生产来说,本地化不是噱头,而是少一次上传、少一层权限顾虑。

它现在也不只是一个独立桌面应用。README 里把三条路线写得很清楚:独立模式下选择文件、模型和语言,生成后导出字幕;DaVinci Resolve 里可以通过脚本入口处理时间线,并把带样式的字幕送回 Resolve;Premiere Pro 和 After Effects 则通过捆绑的 CEP 扩展和桌面端沟通。做 Adobe 工作流的人,可以把时间线音频导出给 auto-subs,再把字幕导回宿主软件,Premiere 中是 caption tracks,After Effects 中则生成文本层。

新版 v3.5 还补上了不少“每天会用到”的细节:语音活动检测可以先剔除非语音片段,让转录更快也更干净;说话人标签模型升级后,多人对话的整理成本会低一些;字幕支持自由文本编辑,历史记录可以重新打开过去的转录结果;界面也加入了中文、日文、韩文、法文等多语言。本地命令行入口同样值得注意,装好 autosubs 后,可以直接在终端里把 interview.mp4 转成 text、srt、vtt 或 json,这对脚本化处理素材尤其顺手。

项目目前约 3542 个 Star,MIT 许可证,主语言是 TypeScript,支持 Windows、macOS 和 Linux;macOS 用户还可以通过 Homebrew cask 安装。它的边界也要说清楚:转录质量仍然取决于模型、语种、音频质量和机器性能;如果你用的是 Mac App Store 版 DaVinci Resolve,项目文档也明确提醒需要换成官网版本。换句话说,它不是一键替代所有字幕后期,但很适合想把字幕、说话人、翻译和剪辑软件导出集中到本地链路里的创作者。

项目地址

官网:https://tom-moroney.com/auto-subs/
项目地址:https://github.com/tmoroney/auto-subs

原创文章,如若转载,请注明出处:https://wefound.cc/p/4530.html

(0)
「Image Provenance」浏览器端 AI 图片溯源工具:检测 C2PA、SynthID 和频域痕迹
上一篇 10小时前
「banana-slides」AI 原生 PPT 工作台:按模板、素材和口头指令生成可编辑演示文稿
下一篇 8小时前

相关推荐