语音转文字
「voice-to-text-tools」纯前端音视频转文字工具:用讯飞 API 处理长音频和自动分段
voice-to-text-tools 是一个纯前端的音视频转文字工具,适合把会议录音、访谈、课程音频或视频文件快速转成文本。它的特点是无需后端服务器,直接部署静态文件即可运行,核…
「TypeWhisper」开源 macOS 听写工具:本地 Whisper 转写、工作流改写和插件扩展一站完成
TypeWhisper 是一个面向 macOS 的开源听写和语音转文字工具。它把本地语音识别、云端转写、AI 文本处理和可复用工作流放在一个菜单栏应用里,适合想把“说话”变成日常输…
「EnviousWispr」本地端 AI 听写工具:Whisper + Parakeet 双引擎、离线转写和一键粘贴
EnviousWispr 是一个 macOS 本地端 AI 听写工具:按住快捷键说话,它会在 Apple Silicon 上本地转写,再把整理好的文本粘回你正在使用的应用。官方给它…
「OpenDictation」免费开源的 Mac 听写工具:把 Whisper 放进刘海区和光标里
OpenDictation 是一个很 Mac 的听写小工具:它不做复杂工作台,也不把你拉进订阅制,而是把录音反馈放进 MacBook 的刘海区域,按下 Option + Space…
「Voice-Pro」开源 Gradio 配音工作台:Whisper 转写、翻译、TTS 与零样本声音克隆
Voice-Pro 是一个面向创作者和开发者的 AI 音频/配音 WebUI。它把 YouTube 下载、音频提取、人声分离、语音识别、字幕生成、翻译、TTS 和声音克隆放在同一个…
「Whisper」OpenAI 开源语音识别模型:多语言转写、翻译和语言识别一站完成
Whisper 是 OpenAI 开源的通用语音识别模型,也是过去几年最常被开发者集成到转写、字幕、语音搜索和会议记录产品里的基础工具之一。它训练在大规模、多样化音频数据上,目标是…
「Handy」离线语音转文字输入神器,基于本地模型运行,绝对隐私安全
在 AI 语音识别技术日益成熟的今天,我们习惯了对着手机或电脑说话来转成文字。但你是否想过:当你使用 Siri、Google 语音输入或各种在线听写工具时,你的每一次发声、每一句私…