Toolverse
All skills

web-scraper

by openclaw

Configurable web scraping service. Extract structured data from any public website with built-in security controls.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
openclaw
Category
Backend
Views
21

About this skill

Configurable web scraping service. Extract structured data from any public website with built-in security controls.

How to use

  1. Zainstaluj wymagane biblioteki: npm install puppeteer cheerio. Puppeteer obsługuje strony dynamiczne (wymagające JavaScript), cheerio służy do parsowania HTML stron statycznych.

  2. Przygotuj URL strony docelowej i określ, jakie dane chcesz wyciągnąć – nazwy produktów, ceny, obrazy, opisy, adresy, dane kontaktowe lub inne elementy widoczne na stronie.

  3. Dla stron statycznych użyj prostego polecenia: "Wyciągnij wszystkie nazwy produktów z [URL]" lub "Ekstrahuj ceny i opisy z [strona]". Narzędzie automatycznie pobierze HTML i wyodrębni żądane dane.

  4. Dla stron dynamicznych, które ładują zawartość przez JavaScript, określ szczegółowo: URL, listę pól do ekstrakcji (np. name, price, image, description), maksymalną liczbę stron do przetworzenia oraz format wyjściowy (CSV, JSON lub Excel).

  5. Narzędzie automatycznie stosuje ochronę przed blokowaniem – dodaje losowe opóźnienia między żądaniami (2–5 sekund) i rotuje User-Agent, aby uniknąć wykrycia przez systemy anty-bot.

  6. Otrzymasz dane w wybranym formacie, gotowe do importu do bazy danych, arkusza kalkulacyjnego lub systemu analitycznego.

Related skills