「Voxt」把 macOS 语音输入变成可本地运行的转录、翻译和改写工作流

Voxt macOS 语音输入界面预览

Voxt 是一个放在 macOS 菜单栏里的语音输入和翻译应用,核心交互很直接:按住快捷键说话,松开后把转录结果粘贴到当前输入框。它更有意思的地方不只是“把语音变成文字”,而是把转录、文本增强、翻译和改写放进同一套快捷键工作流里。

对经常写邮件、聊天、做会议记录或在代码编辑器里整理想法的人来说,这类工具最怕变成另一个需要频繁切换的窗口。Voxt 的设计是让语音结果直接回到当前应用,并且可以按不同 app 或 URL 配不同增强规则。比如聊天时更口语,写正式邮件时自动补标点、去口头禅,进入开发场景时再用另一套提示词处理。

模型路由是它比较值得关注的一点。项目把 ASR 和 LLM 分开配置:语音识别可以走 Apple Dictation、WhisperKit、MLX Audio 或远程 ASR,后续的润色、翻译、改写再交给本地或远程 LLM。README 里列出的本地 ASR 覆盖 Qwen3-ASR、Voxtral Realtime、Parakeet、SenseVoice 等系列,Whisper 也作为独立引擎存在;这意味着你可以在隐私、延迟、准确率和下载体积之间自己取舍。

它也不是只给“听写”用的。Voxt 提供语音翻译、选中文本翻译、语音改写选中文本,以及把语音当成 prompt 来生成内容的模式。用起来更像一个贴在系统输入层旁边的轻量 AI 助手,而不是单独打开的转录软件。

项目目前是 Swift 写的 macOS 应用,GitHub 上约 633 stars,最新版 v1.11.9 在 2026 年 5 月 30 日发布,并提供 DMG、PKG、ZIP 和 Homebrew cask 安装方式。许可证文件是 Apache 2.0。如果你想找一个更可控的 macOS 语音输入方案,尤其希望本地模型和远程服务能按任务拆开配置,Voxt 值得试一下。

项目地址

官网:https://voxt.actnow.dev
项目地址:https://github.com/hehehai/voxt

原创文章,如若转载,请注明出处:https://wefound.cc/p/4257.html

(0)
「DMG Maker」开源 macOS DMG 制作器:SwiftUI 背景、玻璃效果和 CLI 打包
上一篇 4天前
「Live Translator」开源 macOS 实时音频翻译器:把 YouTube、会议和播客变成悬浮字幕
下一篇 4天前

相关推荐