prompt-caching

Name: prompt-caching
Author: davila7

Caching strategies for LLM prompts including Anthropic prompt caching, response caching, and CAG (Cache Augmented Generation) Use when: prompt caching, cache prompt, response cache, cag, cache augmented.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: davila7
Category: Data Science
Views: 38

GitHub repo

About this skill

How to use

Zainstaluj umiejętność prompt-caching z repozytorium davila7. Skill zawiera trzy główne strategie cachowania dostosowane do różnych przypadków użycia.
Wybierz poziom cachowania w zależności od Twojego scenariusza. Dla powtarzających się prefiksów promptów użyj natywnego cachowania Anthropica Claude'a. Dla identycznych lub podobnych zapytań zastosuj cachowanie pełnych odpowiedzi. Dla dużych dokumentów, które chcesz wielokrotnie wykorzystywać, wdrażaj Cache Augmented Generation zamiast tradycyjnego RAG.
Strukturuj swoje prompty z myślą o cachowaniu. Umieszczaj stałe instrukcje systemowe i kontekst na początku, aby maksymalnie wykorzystać cachowanie prefiksów. Pamiętaj, że zmiana nawet małej części prefiksu unieważnia cache.
Implementuj właściwą inwaliację cache'a. Monitoruj, kiedy cached odpowiedzi stają się nieaktualne, i usuwaj je z cache'a. Unikaj sytuacji, w której stare dane są serwowane jako aktualne.
Optymalizuj dla cache misses, nie tylko dla trafień. Przygotuj się na opóźnienia, gdy prompt nie trafi do cache'a — dodatkowy narzut jest znaczący. Projektuj system tak, aby graceful degradation działał nawet bez cache'a.
Unikaj cachowania przy wysokiej temperaturze i nie cachuj wszystkiego bez sensu. Cachowanie ma sens dla deterministycznych odpowiedzi i powtarzających się wzorców. Dla kreatywnych, zmiennych odpowiedzi cachowanie może być kontrproduktywne.

Related skills

openrouter

by rawveg

OpenRouter API - Unified access to 400+ AI models through one API

Data Science

17138

notebooklm

by leegonzales

Query Google NotebookLM for source-grounded, citation-backed answers from uploaded documents. Reduces hallucinations through Gemini's document-only responses. Browser automation with library management and persistent authentication.

Data Science

142112

a-stock-analysis

by openclaw

A股实时行情与分时量能分析。获取沪深股票实时价格、涨跌、成交量，分析分时量能分布（早盘/尾盘放量）、主力动向（抢筹/出货信号）、涨停封单。支持持仓管理和盈亏分析。Use when: (1) 查询A股实时行情, (2) 分析主力资金动向, (3) 查看分时成交量分布, (4) 管理股票持仓, (5) 分析持仓盈亏。

Data Science

48153

market-analysis

by xbklairith

Use when analyzing markets or interpreting charts - applies technical indicators (RSI, MACD, Moving Averages), identifies support/resistance, analyzes multi-timeframe trends, checks fundamentals and sentiment. Activates when user says \

Data Science

29144

codex

by Lucklyric

Invoke Codex CLI for complex coding tasks requiring high reasoning capabilities. This skill should be invoked when users explicitly mention \

Data Science

16163

prompt-optimizer

by solatis

Optimize system prompts for Claude Code agents using proven prompt engineering patterns. Use when users request prompt improvement, optimization, or refinement for agent workflows, tool instructions, or system behaviors.

Data Science

15109