「Open-LLM-VTuber」8.1k Star 本地 AI 伴侣:语音对话、Live2D 形象和跨平台桌面宠物

Open-LLM-VTuber Live2D 语音交互界面

Open-LLM-VTuber 是一个本地运行的语音交互 AI 伴侣项目:你可以和任意 LLM 做免手持语音对话,同时让 Live2D 形象在屏幕上回应。它支持语音打断、视觉感知、表情映射、聊天记录持久化,也能用桌面客户端切到透明背景的桌面宠物模式。

它的重点不是“再做一个聊天窗口”,而是把 LLM、ASR、TTS 和 Live2D 组合成一个可定制角色。后端支持 Ollama、OpenAI-compatible API、Gemini、Claude、Mistral、DeepSeek、LM Studio、vLLM 等;语音识别可以接 sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp 等;TTS 则覆盖 MeloTTS、Coqui-TTS、GPT-SoVITS、Bark、CosyVoice、Edge TTS、Fish Audio、Azure TTS 等。

项目也强调离线运行和跨平台:Windows、macOS、Linux 都在支持范围内,可以用本地模型让对话留在自己的电脑上,也可以用云 API 节省本地算力。Web 版和桌面客户端两种模式都支持;如果要远程访问麦克风,需要按文档配置 HTTPS,因为浏览器的 getUserMedia 只能在安全上下文或 localhost 下工作。

目前仓库有 8.1k+ Star,主语言是 Python。README 也提醒,项目仍在活跃开发中,团队正在规划 v2.0 的完整重写;另外 Live2D sample models 使用单独的 Live2D 相关许可,不完全等同于项目代码许可证。如果你想做一个能说话、能显示形象、能在桌面陪伴的本地 AI 角色,这是一个很完整的开源起点。

项目地址

官网:https://open-llm-vtuber.github.io/
项目地址:https://github.com/Open-LLM-VTuber/Open-LLM-VTuber

原创文章,如若转载,请注明出处:https://wefound.cc/p/4470.html

(0)
「Production Agentic RAG Course」6.2k Star 实战课:从 BM25 搜索到 LangGraph Agentic RAG
上一篇 1天前
「SkillSpector」NVIDIA 开源 AI Agent 技能安全扫描器:安装前先查恶意指令和供应链风险
下一篇 18小时前

相关推荐