rag-skills
RAG-specific best practices for LlamaIndex, ChromaDB, and Celery workers. Covers ingestion, retrieval, embeddings, and performance.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
RAG-specific best practices for LlamaIndex, ChromaDB, and Celery workers. Covers ingestion, retrieval, embeddings, and performance.
How to use
Zainstaluj umiejętność w swoim projekcie LlamaFarm, upewniając się, że masz Python 3.11+, LlamaIndex 0.13+, ChromaDB 1.0+ i Celery 5.5+. Umiejętność rozszerza python-skills, więc wszystkie praktyki Pythona mają zastosowanie.
Skonfiguruj Celery w pliku celery_app.py, definiując brokera wiadomości i backendu wyników. Umiejętność zawiera gotowe szablony konfiguracji dla typowych ustawień.
Wybierz dostawcę embeddings (OpenAI, Ollama lub uniwersalny) i skonfiguruj go w komponencie embedders/. Umiejętność zawiera moduł embedding_safety.py z circuit breakerem i walidacją, aby chronić przed błędami API.
Zdefiniuj pipeline pozyskiwania dokumentów, korzystając z ingest_handler.py do bezpiecznego ładowania plików i blob_processor.py do przetwarzania plików binarnych. Wybierz parser z komponenty parsers/ zgodnie z formatem dokumentów (PDF, TXT, Markdown itp.).
Uruchom asynchroniczne zadania indeksowania za pomocą ingest_tasks.py, które będą przetwarzać dokumenty w tle. Monitoruj postęp za pomocą health_tasks.py i stats_tasks.py.
Wdrażaj zapytania poprzez search_tasks.py lub query_tasks.py, wybierając strategię retrieval z komponenty retrievers/. API w api.py udostępnia interfejsy do wyszukiwania i dostępu do bazy wektorowej ChromaDB.