agent-browser
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseAgent Browser Skill
Agent Browser Skill
ブラウザ自動化を行うスキル。agent-browser CLI を使用して、UI デバッグ・検証・自動操作を実行します。
这是一项实现浏览器自动化的Skill。使用agent-browser CLI执行UI调试、验证与自动化操作。
トリガーフレーズ
触发短语
このスキルは以下のフレーズで自動起動します:
- 「ページを開いて」「URLを確認して」
- 「クリックして」「入力して」「フォームに」
- 「スクリーンショットを撮って」
- 「UIを確認して」「画面をテストして」
- "open this page", "click on", "fill the form", "screenshot"
此Skill会在出现以下短语时自动启动:
- 「打开页面」「查看URL」
- 「点击」「输入」「填写表单」
- 「截图」
- 「检查UI」「测试页面」
- "open this page", "click on", "fill the form", "screenshot"
機能詳細
功能详情
| 機能 | 詳細 |
|---|---|
| ブラウザ自動化 | See references/browser-automation.md |
| AI スナップショットワークフロー | See references/ai-snapshot-workflow.md |
| 功能 | 详情 |
|---|---|
| 浏览器自动化 | 参见 references/browser-automation.md |
| AI 快照工作流 | 参见 references/ai-snapshot-workflow.md |
実行手順
执行步骤
Step 0: agent-browser の確認
Step 0: 确认agent-browser
bash
undefinedbash
undefinedインストール確認
检查安装情况
which agent-browser
which agent-browser
未インストールの場合
未安装时执行
npm install -g agent-browser
agent-browser install
undefinednpm install -g agent-browser
agent-browser install
undefinedStep 1: ユーザーのリクエストを分類
Step 1: 分类用户请求
| リクエストタイプ | 対応アクション |
|---|---|
| URL を開く | |
| 要素をクリック | スナップショット → |
| フォーム入力 | スナップショット → |
| 状態確認 | |
| スクリーンショット | |
| デバッグ | |
| 请求类型 | 对应操作 |
|---|---|
| 打开URL | |
| 点击元素 | 快照 → |
| 填写表单 | 快照 → |
| 状态检查 | |
| 截图 | |
| 调试 | |
Step 2: AI スナップショットワークフロー(推奨)
Step 2: AI 快照工作流(推荐)
ほとんどの操作で、まずスナップショットを取得してから要素参照で操作します:
bash
undefined大多数操作中,建议先获取快照,再通过元素引用进行操作:
bash
undefined1. ページを開く
1. 打开页面
agent-browser open https://example.com
agent-browser open https://example.com
2. スナップショット取得(AI 向け、インタラクティブ要素のみ)
2. 获取快照(面向AI,仅包含交互元素)
agent-browser snapshot -i -c
agent-browser snapshot -i -c
出力例:
输出示例:
- link "Home" [ref=e1]
- link "Home" [ref=e1]
- button "Login" [ref=e2]
- button "Login" [ref=e2]
- input "Email" [ref=e3]
- input "Email" [ref=e3]
- input "Password" [ref=e4]
- input "Password" [ref=e4]
- button "Submit" [ref=e5]
- button "Submit" [ref=e5]
3. 要素参照で操作
3. 通过元素引用执行操作
agent-browser click @e2 # Login ボタンをクリック
agent-browser fill @e3 "user@example.com"
agent-browser fill @e4 "password123"
agent-browser click @e5 # Submit
undefinedagent-browser click @e2 # 点击Login按钮
agent-browser fill @e3 "user@example.com"
agent-browser fill @e4 "password123"
agent-browser click @e5 # 点击Submit按钮
undefinedStep 3: 結果の確認
Step 3: 确认结果
bash
undefinedbash
undefined現在の状態をスナップショットで確認
通过快照确认当前状态
agent-browser snapshot -i -c
agent-browser snapshot -i -c
または URL を確認
或查看当前URL
agent-browser get url
agent-browser get url
スクリーンショットを取得
获取截图
agent-browser screenshot result.png
---agent-browser screenshot result.png
---クイックリファレンス
快速参考
基本操作
基本操作
| コマンド | 説明 |
|---|---|
| URL を開く |
| AI 向けスナップショット |
| 要素をクリック |
| フォームに入力 |
| テキストを入力 |
| キーを押す |
| スクリーンショット |
| ブラウザを閉じる |
| 命令 | 说明 |
|---|---|
| 打开URL |
| 面向AI的快照 |
| 点击元素 |
| 填写表单 |
| 输入文本 |
| 按下按键 |
| 截图 |
| 关闭浏览器 |
ナビゲーション
导航操作
| コマンド | 説明 |
|---|---|
| 戻る |
| 進む |
| リロード |
| 命令 | 说明 |
|---|---|
| 返回上一页 |
| 前进到下一页 |
| 刷新页面 |
情報取得
信息获取
| コマンド | 説明 |
|---|---|
| テキスト取得 |
| HTML 取得 |
| 現在の URL |
| ページタイトル |
| 命令 | 说明 |
|---|---|
| 获取文本 |
| 获取HTML |
| 获取当前URL |
| 获取页面标题 |
待機
等待操作
| コマンド | 説明 |
|---|---|
| 要素を待機 |
| 1秒待機 |
| 命令 | 说明 |
|---|---|
| 等待元素加载 |
| 等待1秒 |
デバッグ
调试操作
| コマンド | 説明 |
|---|---|
| ブラウザを表示 |
| コンソールログ |
| ページエラー |
| 要素をハイライト |
| 命令 | 说明 |
|---|---|
| 显示浏览器界面 |
| 查看控制台日志 |
| 查看页面错误 |
| 高亮元素 |
セッション管理
会话管理
複数のタブ/セッションを並列管理:
bash
undefined可并行管理多个标签页/会话:
bash
undefinedセッションを指定
指定会话
agent-browser --session admin open https://admin.example.com
agent-browser --session user open https://example.com
agent-browser --session admin open https://admin.example.com
agent-browser --session user open https://example.com
セッション一覧
查看会话列表
agent-browser session list
agent-browser session list
特定セッションで操作
在指定会话中执行操作
agent-browser --session admin snapshot -i -c
---agent-browser --session admin snapshot -i -c
---MCP ブラウザツールとの使い分け
与MCP浏览器工具的使用区分
| ツール | 推奨度 | 用途 |
|---|---|---|
| agent-browser | ★★★ | 第一選択。AI 向けスナップショットが強力 |
| chrome-devtools MCP | ★★☆ | Chrome が既に開いている場合 |
| playwright MCP | ★★☆ | 複雑な E2E テスト |
原則: まず agent-browser を試し、うまくいかない場合のみ MCP ツールを使用。
| 工具 | 推荐度 | 用途 |
|---|---|---|
| agent-browser | ★★★ | 首选工具。面向AI的快照功能强大 |
| chrome-devtools MCP | ★★☆ | Chrome已打开时使用 |
| playwright MCP | ★★☆ | 复杂端到端测试场景 |
原则: 优先尝试agent-browser,若无法实现需求再使用MCP工具。
注意事項
注意事项
- agent-browser はヘッドレスモードがデフォルト
- オプションでブラウザを表示可能
--headed - セッションは明示的に するまで維持される
close - 認証が必要なサイトはセッションを活用
- agent-browser默认使用无头模式
- 可通过选项显示浏览器界面
--headed - 会话会一直保留,直到显式执行命令
close - 对需要认证的网站,可利用会话功能维持登录状态