「BrowserWing」开源浏览器自动化平台:把网页操作录成 MCP 命令和 Claude Skill

BrowserWing 浏览器自动化平台界面

浏览器自动化一直有个很实际的矛盾:AI agent 能看页面、点按钮、读结果,但如果每一步都靠截图和自然语言来回描述,速度慢、token 消耗高,稳定性也不太好。BrowserWing 的思路是把常见网页操作沉淀成可复用命令,让 agent 直接调用结构化能力,而不是每次都重新“看图猜操作”。

它是一个开源浏览器自动化平台,可以把浏览器动作转成 MCP commands 或 Claude Skill,让支持 MCP / Skills 协议的 AI 工具直接控制浏览器。项目同时提供 Web UI、CLI、HTTP API、脚本录制器和内置 AI Agent,对想把浏览器任务接进自动化流水线的人来说,定位很清楚:少一点慢吞吞的视觉交互,多一点可复用、可组合的命令接口。

从录制网页操作,到导出给 AI 工具调用

BrowserWing 的一个亮点是视觉脚本录制。你可以把一段浏览器操作录下来,在界面里编辑和回放,再把它导出成 MCP 命令或 Skill 文件。这样一来,团队里反复做的网页任务,比如抓热门榜单、跑搜索、打开某个后台页面读取数据,就不必每次让 agent 从零开始摸索页面。

README 里提到它内置了 78 个脚本,覆盖 GitHub Trending、Hacker News、Bilibili、YouTube、Reddit、Steam、BBC、Bloomberg、Reuters、Google Scholar、Binance、Amazon、微博、知乎、CNKI、Yahoo Finance 等站点。CLI 也比较适合给 agent 用:先用 browserwing ls --format=json 发现脚本,再用 browserwing run <name> 拿 JSON 或 CSV 输出,后面可以继续接 jq、表格、数据库或其他自动化步骤。

MCP、Skills、CLI 和 API 放在同一个入口里

它不是只做一个浏览器控制库,而是把几种接入方式都放在了一起。你可以把本地服务配置成 MCP Server,地址类似 http://localhost:8080/api/v1/mcp/message;也可以下载仓库里的 SKILL.md,导入支持 Skills 协议的 AI 工具;如果只是想跑现成脚本,直接走命令行也可以。

更偏工程侧的部分,则包括 26+ HTTP API 端点、cookie 和 storage 会话管理、LLM 语义抽取,以及内置 AI Agent。项目要求本机有 Chrome 或 Chromium;安装方式支持 npm 全局安装、一行脚本、手动下载预编译二进制,也可以从源码构建。

截至我查看时,BrowserWing 是 MIT License,主语言是 Go,前端使用 React / TypeScript / Vite,GitHub 上有 1280 个 Star、112 个 Fork。它适合那些已经在用 Claude Code、Cursor、OpenClaw 或其他 agent 工具的人:当任务从“临时点一个网页”变成“长期反复跑一批网页流程”时,把操作抽象成 MCP / Skill 会明显更稳。

项目地址

官网:https://www.browserwing.com
项目地址:https://github.com/browserwing/browserwing

原创文章,如若转载,请注明出处:https://wefound.cc/p/3679.html

(0)
「designmd.supply」开源的 DESIGN.md 生成器:把任意网站变成可喂给 AI agent 的设计文档
上一篇 2026年 5月 26日 下午4:30
「AutoGLM-GUI」开源 Android 自动化中枢:让 AI 定时控制手机、管理多设备和工作流
下一篇 2026年 5月 26日 下午4:43

相关推荐