字幕生成
「Videocut Skills」开源口播剪辑 Agent:用 Claude Code Skills 识别口误、重复和静音段
Videocut Skills 是一个用 Claude Code Skills 搭出来的口播视频剪辑 Agent。它瞄准的是一个很具体的痛点:剪映这类“智能剪口播”通常能识别静音,…
「auto-subs」本地字幕生成器:把转录、说话人识别和剪辑软件导出接在一起
auto-subs 最有意思的地方,不是“能自动生成字幕”这件事本身,而是它把字幕生成放回了剪辑师真正工作的地方:本地电脑、时间轴、SRT 文件、Resolve、Premiere …
「Whisper」OpenAI 开源语音识别模型:多语言转写、翻译和语言识别一站完成
Whisper 是 OpenAI 开源的通用语音识别模型,也是过去几年最常被开发者集成到转写、字幕、语音搜索和会议记录产品里的基础工具之一。它训练在大规模、多样化音频数据上,目标是…