「GPU Kill」跨 NVIDIA、AMD、Intel 和 Apple Silicon 的 GPU 进程管理 CLI

GPU Kill 的 GPU 集群监控 Dashboard

GPU Kill 是一个用 Rust 写的 GPU 管理 CLI,面向经常被训练任务、推理服务或异常进程占住显卡的开发者和团队。它可以列出 GPU、实时看使用率、显存、温度和进程,也可以按 PID 或 GPU index 终止卡上的任务,适合在多用户服务器、实验室机器和本地工作站上快速“救卡”。

它覆盖的硬件范围比较广:README 里写明支持 NVIDIA、AMD、Intel 和 Apple Silicon。NVIDIA 需要驱动,AMD 依赖 ROCm,Intel 依赖 intel-gpu-tools,Apple Silicon 则要求 macOS 与 M 系列芯片。系统层面支持 Linux、macOS 和 Windows,源码构建需要 Rust 1.70 以上。

日常使用很像一个专门面向 GPU 的 kill/ps/top 组合。比如 gpukill –list 可以列出显卡,gpukill watch 可以实时观察,gpukill 12345 可以按 PID 结束进程,gpukill –kill –gpu 0 可以清理 GPU 0 上的任务,gpukill 12345 –safe 则先做 dry-run,不直接动手。

除了“看”和“杀”,GPU Kill 还把安全和策略管理放进了工具里。它可以扫描 crypto miner 和可疑活动,Guard Mode 可以做资源滥用防护和策略执行,Remote 模式用于跨多台服务器管理 GPU。仓库里还带了一个本地 dashboard,用来查看集群节点、显卡数量、显存容量、平均利用率、blocked GPUs 和 top users。

对 AI 工作流更有意思的是,它还包含 MCP server。启动后,AI assistant 可以读取 GPU 状态、进程、审计数据、策略和安全扫描结果,也可以调用工具去 kill 进程、reset GPU、创建策略或扫描威胁。换句话说,它不只是给人用的命令行,也能变成 AI 运维代理的一组 GPU 操作能力。

安装方式包括 cargo install gpukill、macOS/Linux 的一行安装脚本,以及 Windows PowerShell 安装脚本;GitHub Releases 里也提供 Linux x86_64、macOS aarch64 和 Windows x86_64 构建。截至 2026 年 6 月 9 日,GPU Kill 在 GitHub 上大约有 469 stars,最新版本是 v0.1.20,发布于 2026 年 3 月 4 日,修复了 rogue detection 配置生效、SSH 日志泄露风险和 MCP JSON-RPC 兼容性等问题。

需要注意 license:仓库标的是 Functional Source License 1.1 with MIT Future License,不是立即生效的普通 MIT。它允许内部使用、非商业教育/研究和专业服务等用途,但对竞争性商业产品/服务有限制;如果你准备把它做进商业 GPU 管理产品,最好先认真读一下 LICENSE。

项目地址

官网:https://gpukill.com
GitHub:https://github.com/treadiehq/gpu-kill

原创文章,如若转载,请注明出处:https://wefound.cc/p/4943.html

(0)
「ElegantClipboard」Windows 本地离线剪贴板:低占用、高性能、支持 CJK 搜索和虚拟列表
上一篇 2小时前
「CursorLens」免费开源的录屏与编辑器:做产品演示视频不用订阅也没有水印
下一篇 1小时前

相关推荐