「AutoGLM-GUI」开源 Android 自动化中枢：让 AI 定时控制手机、管理多设备和工作流

AutoGLM 这类手机操作模型真正落到日常使用时，问题往往不只是“模型能不能点屏幕”，而是怎么连接设备、怎么观察执行过程、怎么把重复任务做成稳定流程。AutoGLM-GUI 做的就是这层产品化封装：给 AutoGLM Phone Agent 加上一套现代 Web 图形界面，把 Android 自动化从一次性的演示，推进到可管理、可部署、可定时运行的生产力工具。

这个项目支持通过聊天界面控制 Android 设备，也能直接在实时屏幕预览上点击、滑动；底层通过 ADB 和 scrcpy 做设备控制与视频流。对 Android 11+ 设备，它还支持二维码无线配对，省掉反复插线和手动配置的麻烦。对于需要长期跑手机任务的人来说，这些细节比单纯“能自动操作”重要得多。

从手机助手变成自动化中枢

v1.5 之后，AutoGLM-GUI 的定位明显从个人助手扩展到了自动化中枢。它加入了 Cron 风格的定时任务、对话历史、立即打断、多设备管理和 Docker 部署。典型场景是把它部署到服务器上，配合 WiFi 调试连接设备，让 AI 在固定时间执行签到、检查、信息收集、周期性 App 操作等任务。

分层代理也是一个值得注意的设计：规划层负责任务拆解、多轮推理和异常恢复，执行层专注观察屏幕并完成点击、滑动、输入等动作。README 里的界面截图可以看到每一步工具调用和执行结果，这让复杂任务不再像黑盒一样一跑到底，而是可以边执行边追溯。

给不同部署方式都留了入口

如果只是想试用，它提供了 Windows EXE、macOS Apple Silicon DMG、Linux AppImage / deb / tar.gz 等桌面包，桌面版内置 Python、ADB 等依赖。开发者也可以用 pip install autoglm-gui 或 uvx autoglm-gui 启动；如果要长期运行，则可以用 Docker 或 docker-compose 部署，并通过 Web 界面配置 OpenAI 兼容模型服务。

模型侧的选择也比较灵活：可以接智谱 BigModel 的 autoglm-phone，可以接 ModelScope 上的 ZhipuAI/AutoGLM-Phone-9B，也可以自建 vLLM / SGLang 服务。项目还内置 MCP 服务器，能接到 Claude Desktop、Cursor 等 AI 应用里，让手机自动化能力变成外部 agent 可调用的工具。

截至我查看时，AutoGLM-GUI 使用 Apache-2.0 License，主语言是 Python，最新 release 是 v1.5.16，GitHub 上有 1040 个 Star、156 个 Fork。它适合那些想让 AI 真正去操作手机 App、又不想停留在一次性脚本阶段的人：设备连接、任务历史、定时执行、多设备隔离和远程部署都已经被放进了一个相对完整的控制台里。