baoyu-danger-gemini-web
Generates images and text via reverse-engineered Gemini Web API. Supports text generation, image generation from prompts, reference images for vision input, and multi-turn conversations. Use when other skills need image generation backend, or when user requests \
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Generates images and text via reverse-engineered Gemini Web API. Supports text generation, image generation from prompts, reference images for vision input, and multi-turn conversations. Use when other skills need image generation backend, or when user requests \
How to use
Upewnij się, że masz zainstalowany Bun lub dostęp do npx. Jeśli nie masz Buna, zainstaluj go lub będziesz mógł użyć npx -y bun do uruchomienia skryptów.
Przed pierwszym użyciem umiejętności sprawdź plik zgody (consent.json) w katalogu konfiguracyjnym systemu (na macOS: ~/Library/Application Support/baoyu-skills/gemini-web/, na Linuksie: ~/.local/share/baoyu-skills/gemini-web/, na Windows: %APPDATA%\baoyu-skills\gemini-web). Jeśli plik nie istnieje, umiejętność wyświetli zastrzeżenie i poprosi o potwierdzenie akceptacji użycia odwrotnie inżynierowanego API.
Po zaakceptowaniu warrunków agent automatycznie utworzy plik zgody. Możesz teraz używać umiejętności do generowania tekstu i obrazów.
Aby wygenerować obraz, poproś agenta o "wygenerowanie obrazu za pomocą Gemini" lub "generowanie obrazu z promptu". Umiejętność przetworzy Twój opis i zwróci wygenerowany obraz.
Aby wygenerować tekst, użyj standardowych promptów tekstowych. Umiejętność obsługuje wieloturowe rozmowy, więc możesz kontynuować konwersację, a agent będzie pamiętać kontekst.
Jeśli chcesz, aby Gemini przeanalizował obraz, dołącz obraz referencyjny do swojego żądania. Umiejętność wyśle obraz do API wizyjnego Gemini i zwróci analizę.