
Browser Use Terminal 最值得看的地方,不是又多了一个“让 AI 帮你点网页”的入口,而是它把浏览器 agent 的执行过程放回一个可控的终端界面里。你可以在 TUI 里启动任务、看它正在操作哪个浏览器、随时暂停或恢复,也能保留历史、截图、产物和后续动作。对于经常要处理网页登录态、后台表单、运营流程的人来说,这比把任务丢给一个黑盒更安心。
它是 Browser Use 官方做的 Rust TUI,目前仓库显示约 224 stars,MIT 许可证,核心方向是 browser automation、CDP、terminal 和 TUI。README 里给出的安装方式很短:通过安装脚本装好之后运行 browser,然后在界面里用 /auth 登录、用 /model 选模型、用 /browser 选择本地 Chrome、headless Chromium 或 Browser Use Cloud。
更适合“要看得见过程”的浏览器任务
传统浏览器自动化很容易卡在两个极端:要么是脚本式的 Playwright/Selenium,稳定但每个流程都要工程化;要么是聊天式 agent,灵活但执行过程不好接手。Browser Use Terminal 试图站在中间:底层仍然给模型 CDP、截图、页面脚本和文件能力,但外层用 Ratatui 做一个可以观察、转向、停止、重试和恢复的工作台。
这个设计在真实账号任务里尤其有意义。比如处理酒店订单、后台权限、停车许可、SaaS 管理台这类事情,任务本身往往不难,难的是你不希望 agent 一路蒙眼点下去。Terminal UI 让你更容易判断它是不是在正确页面、是不是已经进入危险操作、是否需要人工接管。
Rust harness 和可恢复状态
项目把 agent loop、持久状态和终端渲染放在 Rust 侧,浏览器运行时负责连接真实 Chrome、headless Chromium 或云端浏览器。README 还提到它会保留 SQLite event log,用来记录 history、screenshots、artifacts 和 traces。这意味着它不是一次性的“发起一个任务然后等结果”,而更像一个可追溯的浏览器任务控制台。
另一个值得注意的点是成本和速度目标。官方 README 写到它使用新的 LLM harness,目标是比 Browser Harness 便宜和更快。这个数字需要在具体任务里验证,但方向很清楚:把浏览器任务做成长期可运行、可恢复、可调度的工作流,而不是每次都从零启动一段松散对话。
如果你已经在用 Claude、Codex 或其他 agent 做网页里的重复工作,Browser Use Terminal 可以先从低风险任务试起:查资料、下载报表、检查后台配置、整理订单状态。等你确认它的恢复、历史和浏览器 profile 行为符合预期,再把更长的运营流程交给它跑。
项目地址
官网:https://browser-use.com/terminal
项目地址:https://github.com/browser-use/terminal
原创文章,如若转载,请注明出处:https://wefound.cc/p/3529.html