Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Systematically evaluate your LLM application with TruLens
How to use
- Zainstaluj skill TruLens Evaluation Workflow w swoim środowisku agenta Claude/Copilot. 2. Odpowiedz na pytanie diagnostyczne dotyczące typu Twojej aplikacji — wskaż framework, na którym zbudowałeś system (LangChain, LangGraph/Deep Agents, LlamaIndex lub Custom). 3. Wybierz zestaw metryk ewaluacji dostosowany do Twojego przypadku: dla aplikacji RAG użyj RAG Triad (Context Relevance, Groundedness, Answer Relevance), dla agentów wybierz Agent GPA (Tool Selection, Tool Calling, Execution Efficiency), dla prostych aplikacji wystarczy Answer Relevance. 4. Jeśli Twój agent zawiera etap jawnego planowania, włącz dodatkowe metryki Plan Quality i Adherence. 5. Opcjonalnie dodaj metryki uzupełniające takie jak Coherence, Conciseness lub Harmlessness, jeśli chcesz pogłębić ewaluację. 6. Skill przeprowadzi Cię przez workflow instrumentacji kodu, kuracji danych testowych i konfiguracji funkcji feedbacku, aby uruchomić pełny cykl ewaluacji Twojej aplikacji LLM.