Agent browserとは

AGENT BROWSER

読み: エージェントブラウザ

公開日 2026.03.28 最終更新 2026.04.03

Agent browserとは、Vercel Labs発のAIエージェント専用ブラウザ自動化ツール

読み: エージェントブラウザ

Agent browserとは、Vercel Labs発のAIエージェント専用ブラウザ自動化ツール。操作可能な要素に一意IDを振るREFシステムにより、従来のPlaywright MCP比でトークン消費を93%削減。Rust実装で50ms未満のレスポンス。MCP標準対応。

かんたんに言うと

人間用のブラウザではなく、AIが操作しやすいように再設計された「AI専用ブラウザ」。AIは「click @e5」と言うだけでボタンをクリックできる。HTMLを解析する手間がゼロ。

REFシステムによるトークン93%削減

従来のSeleniumやPlaywrightはHTMLの構造解析に膨大なトークンを消費した。Agent-browserは操作可能な要素に一意のID（@e1, @e2等）を振ったアクセシビリティ・ツリーだけをAIに提示する。
AIはCSSセレクタやXPathを探す必要がない。スナップショットを見て「click @e5」と送るだけで正確に操作できる。2026年3月の検証でPlaywright MCP比93%のトークン削減が報告されている。

Rust実装の爆速レスポンスとMCP対応

内部はRust実装で、AIのコマンドからブラウザ反応まで50ms未満。クッキーやログイン状態をAIが操作・保持でき、認証が必要なダッシュボードの自動操作も可能。
MCP標準対応でClaude Codeと即座に連携。npx Agent browserを実行するだけでAIがインターネットを自由に操作できるようになる。Context7（知識源）、React Grab（UI→コード変換）と並ぶ2026年のAI開発スタックの重要ピース。

当社の見解

当社ではClaude Code、Antigravity（Gemini）、Codex（OpenAI）の3つのAIエージェントを日常業務で併用している（2026年4月現在）。この体制により、社員1人あたり複数のAIが並行して作業を進め、人間は判断とレビューに集中できるようになった。エージェント間の記憶共有により「別のAIに同じ説明を繰り返す」無駄が消え、プロジェクトの引き継ぎコストがゼロに近づいた。失敗の教訓が自動で次の作業に注入される仕組み（Agentic RAG）も構築し、同じミスの再発率を構造的に下げている。さらにProactive AI（意図先読み型アシスタント）を実装し、ユーザーがメッセージを送る前に関連する過去の記憶を自動検索・注入する仕組みを稼働させている（意図分類精度80%、応答時間3.6秒）。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する