
AutoGLM 这类手机操作模型真正落到日常使用时,问题往往不只是“模型能不能点屏幕”,而是怎么连接设备、怎么观察执行过程、怎么把重复任务做成稳定流程。AutoGLM-GUI 做的就是这层产品化封装:给 AutoGLM Phone Agent 加上一套现代 Web 图形界面,把 Android 自动化从一次性的演示,推进到可管理、可部署、可定时运行的生产力工具。
这个项目支持通过聊天界面控制 Android 设备,也能直接在实时屏幕预览上点击、滑动;底层通过 ADB 和 scrcpy 做设备控制与视频流。对 Android 11+ 设备,它还支持二维码无线配对,省掉反复插线和手动配置的麻烦。对于需要长期跑手机任务的人来说,这些细节比单纯“能自动操作”重要得多。
从手机助手变成自动化中枢
v1.5 之后,AutoGLM-GUI 的定位明显从个人助手扩展到了自动化中枢。它加入了 Cron 风格的定时任务、对话历史、立即打断、多设备管理和 Docker 部署。典型场景是把它部署到服务器上,配合 WiFi 调试连接设备,让 AI 在固定时间执行签到、检查、信息收集、周期性 App 操作等任务。
分层代理也是一个值得注意的设计:规划层负责任务拆解、多轮推理和异常恢复,执行层专注观察屏幕并完成点击、滑动、输入等动作。README 里的界面截图可以看到每一步工具调用和执行结果,这让复杂任务不再像黑盒一样一跑到底,而是可以边执行边追溯。
给不同部署方式都留了入口
如果只是想试用,它提供了 Windows EXE、macOS Apple Silicon DMG、Linux AppImage / deb / tar.gz 等桌面包,桌面版内置 Python、ADB 等依赖。开发者也可以用 pip install autoglm-gui 或 uvx autoglm-gui 启动;如果要长期运行,则可以用 Docker 或 docker-compose 部署,并通过 Web 界面配置 OpenAI 兼容模型服务。
模型侧的选择也比较灵活:可以接智谱 BigModel 的 autoglm-phone,可以接 ModelScope 上的 ZhipuAI/AutoGLM-Phone-9B,也可以自建 vLLM / SGLang 服务。项目还内置 MCP 服务器,能接到 Claude Desktop、Cursor 等 AI 应用里,让手机自动化能力变成外部 agent 可调用的工具。
截至我查看时,AutoGLM-GUI 使用 Apache-2.0 License,主语言是 Python,最新 release 是 v1.5.16,GitHub 上有 1040 个 Star、156 个 Fork。它适合那些想让 AI 真正去操作手机 App、又不想停留在一次性脚本阶段的人:设备连接、任务历史、定时执行、多设备隔离和远程部署都已经被放进了一个相对完整的控制台里。
项目地址
官网:https://autoglm-gui.vercel.app
项目地址:https://github.com/suyiiyii/AutoGLM-GUI
原创文章,如若转载,请注明出处:https://wefound.cc/p/3683.html