「MioSub」一站式 AI 字幕工作台:自动转录、翻译、对齐并压制成片

MioSub 的字幕编辑器、视频预览和搜索替换界面

MioSub 是一个开源的 AI 字幕编辑器,原名 Gemini-Subtitle-Pro,现在定位更接近“一站式字幕工作台”:下载素材、语音转文字、翻译、时间轴对齐、说话人标注、字幕编辑、导出 SRT/ASS,甚至一键把字幕压制进视频,尽量把字幕组和视频本地化里那些重复步骤串起来。

项目当前约 609 stars,AGPL-3.0 协议,基于 TypeScript、React 19 和 Electron。它支持 Windows、macOS、Linux,既可以处理视频,也可以处理播客、电台、有声书这类纯音频文件。对创作者来说,比较有吸引力的是“粘贴链接或导入本地文件,然后等成品”的工作流,不必在下载器、转录工具、翻译工具、时间轴软件之间来回切。

MioSub 的 AI 部分主要围绕 Gemini 和 Whisper 类能力展开:Gemini 负责上下文感知翻译、术语一致性和多语言处理,本地 Whisper/whisper.cpp 可以用于转录;内置 CTC 对齐器用来做毫秒级时间轴对齐。README 里给的典型场景包括日语电台、铁道 vlog、电影解说这类长音频或术语密集内容。

它不是只给你一份机器字幕,而是提供了一个可继续编辑的界面。你可以边看视频边改字幕,搜索替换专有名词,检查说话人标注,导出双语字幕,或直接压制成硬字幕视频。对于做 B 站/YouTube 多语言搬运、播客转录、字幕组初稿的人,这种“先自动跑完,再人工精修”的形态会比单点工具顺手很多。

使用前要注意两点:一是 Gemini API Key 和模型可用性会影响效果和成本;二是 AGPL-3.0 对二次开发和网络服务分发有明确要求。如果只是个人使用或字幕工作流提效,它会是一个很值得试的开源桌面应用。

项目地址

官网:https://miosub.app
项目地址:https://github.com/corvo007/MioSub

原创文章,如若转载,请注明出处:https://wefound.cc/p/4490.html

(0)
「CUPS Web」把家用 USB 打印机变成可远程访问的网页打印服务
上一篇 13小时前
「CanIRun.ai」检测你的硬件,判断本机能跑哪些本地 AI 模型
下一篇 13小时前

相关推荐