Agent browserとは
Agent browserとは、Vercel Labs発のAIエージェント専用ブラウザ自動化ツール
読み: エージェントブラウザ
Agent browserとは、Vercel Labs発のAIエージェント専用ブラウザ自動化ツール。操作可能な要素に一意IDを振るREFシステムにより、従来のPlaywright MCP比でトークン消費を93%削減。Rust実装で50ms未満のレスポンス。MCP標準対応。
かんたんに言うと
人間用のブラウザではなく、AIが操作しやすいように再設計された「AI専用ブラウザ」。AIは「click @e5」と言うだけでボタンをクリックできる。HTMLを解析する手間がゼロ。
REFシステムによるトークン93%削減
従来のSeleniumやPlaywrightはHTMLの構造解析に膨大なトークンを消費した。Agent-browserは操作可能な要素に一意のID(@e1, @e2等)を振ったアクセシビリティ・ツリーだけをAIに提示する。
AIはCSSセレクタやXPathを探す必要がない。スナップショットを見て「click @e5」と送るだけで正確に操作できる。2026年3月の検証でPlaywright MCP比93%のトークン削減が報告されている。
Rust実装の爆速レスポンスとMCP対応
内部はRust実装で、AIのコマンドからブラウザ反応まで50ms未満。クッキーやログイン状態をAIが操作・保持でき、認証が必要なダッシュボードの自動操作も可能。
MCP標準対応でClaude Codeと即座に連携。npx Agent browserを実行するだけでAIがインターネットを自由に操作できるようになる。Context7(知識源)、React Grab(UI→コード変換)と並ぶ2026年のAI開発スタックの重要ピース。
当社の見解
当社ではClaude Code、Antigravity(Gemini)、Codex(OpenAI)の3つのAIエージェントを日常業務で併用している(2026年4月現在)。この体制により、社員1人あたり複数のAIが並行して作業を進め、人間は判断とレビューに集中できるようになった。エージェント間の記憶共有により「別のAIに同じ説明を繰り返す」無駄が消え、プロジェクトの引き継ぎコストがゼロに近づいた。失敗の教訓が自動で次の作業に注入される仕組み(Agentic RAG)も構築し、同じミスの再発率を構造的に下げている。さらにProactive AI(意図先読み型アシスタント)を実装し、ユーザーがメッセージを送る前に関連する過去の記憶を自動検索・注入する仕組みを稼働させている(意図分類精度80%、応答時間3.6秒)。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
