Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Execute TruLens evaluations and view results
How to use
Upewnij się, że masz zainstalowany TruLens i że Twoja aplikacja jest już zinstrumentowana (zobacz skill instrumentation) oraz że skonfigurowałeś funkcje feedback (zobacz skill evaluation-setup).
Zaimportuj TruSession i wybierz odpowiedni wrapper dla Twojego frameworka: TruChain dla LangChain, TruGraph dla LangGraph, TruLlama lub TruLlamaWorkflow dla LlamaIndex, lub TruApp dla aplikacji custom. Owinąć swoją aplikację, przekazując skonfigurowane feedbacki jako parametr.
Użyj context managera (with tru_app as recording) do uruchomienia aplikacji i rejestracji śladów. Możesz wykonać jedno zapytanie lub pętlę przez listę testowych zapytań — każde zostanie automatycznie śledzane.
Po wykonaniu zapytań czekaj na asynchroniczne wyniki ewaluacji, wywołując retrieve_feedback_results() na obiekcie recording. Możesz ustawić timeout (domyślnie 180 sekund) kontrolujący maksymalny czas oczekiwania.
Wyniki zwrócone zostaną w postaci DataFrame, którą możesz wydrukować lub dalej analizować. Dla pojedynczego rekordu użyj recording[0].retrieve_feedback_results().
Aby uzyskać podsumowanie rankingowe wszystkich rekordów, użyj session.get_leaderboard() — narzędzie wyświetli porównanie wyników ewaluacji dla wszystkich wykonanych zapytań.