hybrid-search-implementation

Name: hybrid-search-implementation
Author: wshobson

Combine vector and keyword search for improved retrieval. Use when implementing RAG systems, building search engines, or when neither approach alone provides sufficient recall.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: wshobson
Category: Data Science
Views: 74

GitHub repo

About this skill

Combine vector and keyword search for improved retrieval. Use when implementing RAG systems, building search engines, or when neither approach alone provides sufficient recall.

How to use

Zainstaluj skill w swoim projekcie agenta, dodając moduł hybrid-search-implementation do katalogu umiejętności. Skill zawiera gotowe szablony implementacyjne w Pythonie, które możesz zintegrować z istniejącym kodem.
Przygotuj dwie listy wyników: jedną z wyszukiwania wektorowego (semantic search) oraz drugą z wyszukiwania słownikowego (keyword search). Każdy wynik powinien zawierać identyfikator dokumentu i wynik (score).
Wybierz metodę fuzji odpowiednią do Twojego przypadku użycia. Dla większości scenariuszy zacznij od Reciprocal Rank Fusion (RRF), która jest uniwersalna i nie wymaga dostrajania. Jeśli potrzebujesz kontroli nad wagą każdego podejścia, użyj metody Linear. Dla najwyższej jakości wyników zastosuj Cross-encoder, który ponownie klasyfikuje połączone kandydaty za pomocą modelu neuronowego.
Zaimplementuj wybraną metodę fuzji, przekazując obie listy wyników. W przypadku RRF użyj dostarczonego szablonu z parametrem k (domyślnie 60) – wyższa wartość k daje większą wagę wynikom z niższych pozycji rankingu.
Przetestuj system na zapytaniach zawierających konkretne terminy (nazwy, kody) oraz zapytaniach semantycznych. Hybrid search powinien zwrócić lepsze wyniki niż każde z podejść osobno, szczególnie dla domeny z specjalistycznym słownictwem.
Dostosuj parametry (wagi, wartość k, próg filtrowania w metodzie Cascade) na podstawie wyników testów, aby osiągnąć optymalny balans między precyzją a recall dla Twojego systemu RAG.

Related skills

pdf-processing

by Ming-Kai-LC

Comprehensive PDF processing techniques for handling large files that exceed Claude Code's reading limits, including chunking strategies, text/table extraction, and OCR for scanned documents. Use when working with PDFs larger than 10-15MB or more than 30-50 pages.

Data Science

23134

claude-automation-recommender

by anthropics

Analyze a codebase and recommend Claude Code automations (hooks, subagents, skills, plugins, MCP servers). Use when user asks for automation recommendations, wants to optimize their Claude Code setup, mentions improving Claude Code workflows, asks how to first set up Claude Code

Data Science

1787

notebooklm

by leegonzales

Query Google NotebookLM for source-grounded, citation-backed answers from uploaded documents. Reduces hallucinations through Gemini's document-only responses. Browser automation with library management and persistent authentication.

Data Science

142112

deep-research

by davidorex

Multi-agent parallel investigation for complex VCV Rack problems

Data Science

16151

ml-paper-writing

by davila7

Write publication-ready ML/AI papers for NeurIPS, ICML, ICLR, ACL, AAAI, COLM. Use when drafting papers from research repos, structuring arguments, verifying citations, or preparing camera-ready submissions. Includes LaTeX templates, reviewer guidelines, and citation

Data Science

2681

prompt-optimizer

by solatis

Optimize system prompts for Claude Code agents using proven prompt engineering patterns. Use when users request prompt improvement, optimization, or refinement for agent workflows, tool instructions, or system behaviors.

Data Science

15109