Toolverse
All skills

trulens-running-evaluations

by truera

Execute TruLens evaluations and view results

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
truera
Category
Data Science
Views
5

About this skill

Execute TruLens evaluations and view results

How to use

  1. Upewnij się, że masz zainstalowany TruLens i że Twoja aplikacja jest już zinstrumentowana (zobacz skill instrumentation) oraz że skonfigurowałeś funkcje feedback (zobacz skill evaluation-setup).

  2. Zaimportuj TruSession i wybierz odpowiedni wrapper dla Twojego frameworka: TruChain dla LangChain, TruGraph dla LangGraph, TruLlama lub TruLlamaWorkflow dla LlamaIndex, lub TruApp dla aplikacji custom. Owinąć swoją aplikację, przekazując skonfigurowane feedbacki jako parametr.

  3. Użyj context managera (with tru_app as recording) do uruchomienia aplikacji i rejestracji śladów. Możesz wykonać jedno zapytanie lub pętlę przez listę testowych zapytań — każde zostanie automatycznie śledzane.

  4. Po wykonaniu zapytań czekaj na asynchroniczne wyniki ewaluacji, wywołując retrieve_feedback_results() na obiekcie recording. Możesz ustawić timeout (domyślnie 180 sekund) kontrolujący maksymalny czas oczekiwania.

  5. Wyniki zwrócone zostaną w postaci DataFrame, którą możesz wydrukować lub dalej analizować. Dla pojedynczego rekordu użyj recording[0].retrieve_feedback_results().

  6. Aby uzyskać podsumowanie rankingowe wszystkich rekordów, użyj session.get_leaderboard() — narzędzie wyświetli porównanie wyników ewaluacji dla wszystkich wykonanych zapytań.

Related skills

nano-banana-pro

by garg-aayush

Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) API. Use when the user asks to generate, create, edit, modify, change, alter, or update images. Also use when user references an existing image file and asks to modify it in any way (e.g., \

Data Science
535772

ml-paper-writing

by davila7

Write publication-ready ML/AI papers for NeurIPS, ICML, ICLR, ACL, AAAI, COLM. Use when drafting papers from research repos, structuring arguments, verifying citations, or preparing camera-ready submissions. Includes LaTeX templates, reviewer guidelines, and citation

Data Science
2681

arxiv-search

by langchain-ai

Search arXiv preprint repository for papers in physics, mathematics, computer science, quantitative biology, and related fields

Data Science
76172

prompt-optimizer

by solatis

Optimize system prompts for Claude Code agents using proven prompt engineering patterns. Use when users request prompt improvement, optimization, or refinement for agent workflows, tool instructions, or system behaviors.

Data Science
15109

xlsx

by anthropics

Comprehensive spreadsheet creation, editing, and analysis with support for formulas, formatting, data analysis, and visualization. When Claude needs to work with spreadsheets (.xlsx, .xlsm, .csv, .tsv, etc) for: (1) Creating new spreadsheets with formulas and formatting, (2)

Data Science
40128

pdf-processing

by Ming-Kai-LC

Comprehensive PDF processing techniques for handling large files that exceed Claude Code's reading limits, including chunking strategies, text/table extraction, and OCR for scanned documents. Use when working with PDFs larger than 10-15MB or more than 30-50 pages.

Data Science
23134