hybrid-search-implementation
Combine vector and keyword search for improved retrieval. Use when implementing RAG systems, building search engines, or when neither approach alone provides sufficient recall.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Combine vector and keyword search for improved retrieval. Use when implementing RAG systems, building search engines, or when neither approach alone provides sufficient recall.
How to use
Zainstaluj skill w swoim projekcie agenta, dodając moduł hybrid-search-implementation do katalogu umiejętności. Skill zawiera gotowe szablony implementacyjne w Pythonie, które możesz zintegrować z istniejącym kodem.
Przygotuj dwie listy wyników: jedną z wyszukiwania wektorowego (semantic search) oraz drugą z wyszukiwania słownikowego (keyword search). Każdy wynik powinien zawierać identyfikator dokumentu i wynik (score).
Wybierz metodę fuzji odpowiednią do Twojego przypadku użycia. Dla większości scenariuszy zacznij od Reciprocal Rank Fusion (RRF), która jest uniwersalna i nie wymaga dostrajania. Jeśli potrzebujesz kontroli nad wagą każdego podejścia, użyj metody Linear. Dla najwyższej jakości wyników zastosuj Cross-encoder, który ponownie klasyfikuje połączone kandydaty za pomocą modelu neuronowego.
Zaimplementuj wybraną metodę fuzji, przekazując obie listy wyników. W przypadku RRF użyj dostarczonego szablonu z parametrem k (domyślnie 60) – wyższa wartość k daje większą wagę wynikom z niższych pozycji rankingu.
Przetestuj system na zapytaniach zawierających konkretne terminy (nazwy, kody) oraz zapytaniach semantycznych. Hybrid search powinien zwrócić lepsze wyniki niż każde z podejść osobno, szczególnie dla domeny z specjalistycznym słownictwem.
Dostosuj parametry (wagi, wartość k, próg filtrowania w metodzie Cascade) na podstawie wyników testów, aby osiągnąć optymalny balans między precyzją a recall dla Twojego systemu RAG.