🤖

Agent Browser

基于 Rust 的高速无头浏览器自动化 CLI,支持 Node.js 回退,让 AI 智能体能够通过结构化命令导航、点击、输入并截取页面。

作者 TheSethRosev1.0.0
Browser & AutomationProductivityOpen SourceAutomationCLIDeveloper Tool
正在连接 VM...
正在连接 VM...
npx clawhub@latest install agent-browser
1.0k当前安装数
957累计安装数
v1.0.0版本
Agent Browser 是一款专为 AI 智能体设计的无头浏览器自动化工具。它提供 CLI 接口,可通过简单、可组合的命令导航网页、与元素交互、提取结构化数据并运行 JavaScript。其核心基于高性能的 Rust 实现,同时提供 Node.js 回退层以确保广泛兼容性。

工作原理

1

Step 1

导航
使用 agent-browser navigate <url> 将浏览器指向任意 URL
2

Step 2

快照
使用 agent-browser snapshot 捕获页面结构,了解可用元素
3

Step 3

交互
根据快照中的引用,对元素执行点击、输入、滚动和选择操作
4

Step 4

验证
再次截取快照或截图,在继续操作前确认结果

核心功能

导航 & 快照
打开页面并获取结构化元素引用,实现可靠交互
点击、输入 & 滚动
使用结构化命令与任意页面元素交互
JavaScript 执行
通过 evaluate 在页面上下文中运行任意 JS
标签页管理
以编程方式列出、打开、切换和关闭浏览器标签页
截图功能
在自动化工作流的任意节点截取截图
等待 & 条件
暂停执行指定时长,或等待某个条件满足
Rust 核心与 Node.js 回退
高性能与广泛兼容性兼顾

系统要求

Node.js
Node.js 回退层所需的运行时
npm
通过 npm install -g agent-browser 进行全局安装
无需 API 密钥
完全本地执行,无需任何外部服务

使用场景

Web 自动化
自动化重复性浏览器任务,如表单提交和多步骤工作流
数据提取
从动态渲染页面中抓取并提取结构化数据
表单填写
以编程方式填写并提交带有输入内容的表单
UI 测试
通过 CLI 命令模拟用户交互,测试 Web 界面

安装方式

1
Run in your terminal
npx clawhub@latest install agent-browser
or
2
Click the Install button at the top of this page for one-click setup

常见问题

评价

0 条评价

登录后撰写评价

暂无评价。来分享你的使用体验吧!