openrouter-caching-strategy
Implement response caching for OpenRouter efficiency. Use when optimizing costs or reducing latency for repeated queries. Trigger with phrases like 'openrouter cache', 'cache llm responses', 'openrouter redis', 'semantic caching'.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Implement response caching for OpenRouter efficiency. Use when optimizing costs or reducing latency for repeated queries. Trigger with phrases like 'openrouter cache', 'cache llm responses', 'openrouter redis', 'semantic caching'.
How to use
Zainstaluj skill w swoim projekcie Claude Code lub Codex, upewniając się, że masz dostęp do narzędzi Read, Write, Edit, Bash i Grep.
Skonfiguruj zmienną środowiskową OPENROUTER_API_KEY z Twoim kluczem API OpenRouter oraz ustaw nagłówki HTTP (HTTP-Referer i X-Title) wskazujące na Twoją aplikację.
Zainicjalizuj klasę LLMCache z wybranym czasem wygaśnięcia (TTL) — domyślnie 3600 sekund. Klasa automatycznie zarządza pamięcią podręczną i śledzi liczbę trafień i chybień.
Przed wysłaniem żądania do OpenRouter sprawdź cache za pomocą metody get(), przekazując model, listę wiadomości i dodatkowe parametry (np. temperature). Jeśli odpowiedź znajduje się w cache i nie wygasła, zostanie zwrócona natychmiast.
Jeśli żądanie nie znajduje się w cache, wyślij je do OpenRouter normalnie, a następnie zapisz wynik w cache za pomocą metody set() — zapewnia to, że kolejne identyczne zapytania będą obsługiwane z cache'u.
Monitoruj wydajność cache'u, sprawdzając właściwości hits i misses klasy LLMCache — wysoki stosunek trafień wskazuje na efektywne zmniejszenie kosztów API.