Toolverse
All skills

agent-browser

by vercel-labs

Browser automation CLI for AI agents. Use when the user needs to interact with websites, including navigating pages, filling forms, clicking buttons, taking screenshots, extracting data, testing web apps, or automating any browser task. Triggers include requests to \

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
Frontend
Views
56

About this skill

Browser automation CLI for AI agents. Use when the user needs to interact with websites, including navigating pages, filling forms, clicking buttons, taking screenshots, extracting data, testing web apps, or automating any browser task. Triggers include requests to \

How to use

  1. Zainstaluj skill agent-browser w swoim środowisku agenta AI (dostępny w repozytorium Vercel Labs). Upewnij się, że masz dostęp do poleceń bash poprzez narzędzie agent-browser.

  2. Aby otworzyć stronę, użyj polecenia agent-browser open <URL> — na przykład agent-browser open https://example.com/form. To uruchomi przeglądarkę i przejdzie do podanego adresu.

  3. Po załadowaniu strony wykonaj agent-browser snapshot -i, aby uzyskać interaktywne elementy ze zidentyfikowanymi referencjami (takimi jak @e1, @e2, @e3). Te referencje reprezentują pola wejściowe, przyciski i inne elementy, którymi możesz manipulować.

  4. Wchodzić w interakcję z elementami za pomocą ich referencji: użyj agent-browser fill @e1 "tekst" do wypełnienia pola, agent-browser click @e3 do kliknięcia przycisku, lub agent-browser select @e1 "opcja" do wybrania opcji z listy rozwijanej.

  5. Po każdej akcji, która zmienia zawartość strony (nawigacja, kliknięcie przycisku), czekaj na załadowanie za pomocą agent-browser wait --load networkidle, a następnie wykonaj nowy snapshot (agent-browser snapshot -i), aby pobrać zaktualizowane referencje elementów.

  6. Powtarzaj kroki 4-5, aż osiągniesz cel — czy to wypełnienie formularza, zalogowanie się, czy ekstrakcję danych ze strony.

Related skills