web-scraper
Configurable web scraping service. Extract structured data from any public website with built-in security controls.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Configurable web scraping service. Extract structured data from any public website with built-in security controls.
How to use
Zainstaluj wymagane biblioteki: npm install puppeteer cheerio. Puppeteer obsługuje strony dynamiczne (wymagające JavaScript), cheerio służy do parsowania HTML stron statycznych.
Przygotuj URL strony docelowej i określ, jakie dane chcesz wyciągnąć – nazwy produktów, ceny, obrazy, opisy, adresy, dane kontaktowe lub inne elementy widoczne na stronie.
Dla stron statycznych użyj prostego polecenia: "Wyciągnij wszystkie nazwy produktów z [URL]" lub "Ekstrahuj ceny i opisy z [strona]". Narzędzie automatycznie pobierze HTML i wyodrębni żądane dane.
Dla stron dynamicznych, które ładują zawartość przez JavaScript, określ szczegółowo: URL, listę pól do ekstrakcji (np. name, price, image, description), maksymalną liczbę stron do przetworzenia oraz format wyjściowy (CSV, JSON lub Excel).
Narzędzie automatycznie stosuje ochronę przed blokowaniem – dodaje losowe opóźnienia między żądaniami (2–5 sekund) i rotuje User-Agent, aby uniknąć wykrycia przez systemy anty-bot.
Otrzymasz dane w wybranym formacie, gotowe do importu do bazy danych, arkusza kalkulacyjnego lub systemu analitycznego.