similarity-search-patterns

Name: similarity-search-patterns
Author: wshobson

Implement efficient similarity search with vector databases. Use when building semantic search, implementing nearest neighbor queries, or optimizing retrieval performance.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: wshobson
Category: Data Science
Views: 46

GitHub repo

About this skill

Implement efficient similarity search with vector databases. Use when building semantic search, implementing nearest neighbor queries, or optimizing retrieval performance.

How to use

Zainstaluj umiejętność w swoim projekcie agenta, dodając repozytorium do ścieżki skills. Upewnij się, że masz dostęp do wybranej bazy wektorowej (Pinecone, Weaviate lub inna) i klucz API.
Wybierz metrykę odległości odpowiednią dla Twoich danych: cosinus dla znormalizowanych embeddingów, euklidesową dla surowych wektorów, dot product gdy ważna jest wielkość wektora, lub Manhattan dla rzadkich wektorów.
Zdecyduj o typie indeksu na podstawie rozmiaru danych: flat dla małych zbiorów (dokładne wyniki), HNSW dla średnich i dużych zbiorów (szybkie, ~95-99% recall), lub IVF+PQ dla bardzo dużych zbiorów (skompresowane, ~90-95% recall).
Skorzystaj z dostarczonego szablonu Pinecone lub dostosuj go do wybranej bazy wektorowej. Zainicjuj połączenie z API, definiując wymiar wektorów (np. 1536 dla OpenAI) i metrykę.
Implementuj wyszukiwanie semantyczne poprzez konwersję zapytań użytkownika na embeddingi, a następnie wyszukaj najbliższe wektory w indeksie. Dla RAG retrieval zwróć dokumenty powiązane z topowymi wynikami.
Opcjonalnie połącz wyszukiwanie semantyczne z tradycyjnym wyszukiwaniem słownikowym, aby poprawić trafność wyników dla zapytań zawierających specjalistyczne terminy lub nazwy własne.

Related skills

prompt-optimizer

by solatis

Optimize system prompts for Claude Code agents using proven prompt engineering patterns. Use when users request prompt improvement, optimization, or refinement for agent workflows, tool instructions, or system behaviors.

Data Science

15109

rust-coding-skill

by UtakataKyosui

Guides Claude in writing idiomatic, efficient, well-structured Rust code using proper data modeling, traits, impl organization, macros, and build-speed best practices.

Data Science

248325

market-research-reports

by davila7

Generate comprehensive market research reports (50+ pages) in the style of top consulting firms (McKinsey, BCG, Gartner). Features professional LaTeX formatting, extensive visual generation with scientific-schematics and generate-image, deep integration with research-lookup for

Data Science

16115

market-analysis

by xbklairith

Use when analyzing markets or interpreting charts - applies technical indicators (RSI, MACD, Moving Averages), identifies support/resistance, analyzes multi-timeframe trends, checks fundamentals and sentiment. Activates when user says \

Data Science

29144

skill-installer

by openai

Install Codex skills into $CODEX_HOME/skills from a curated list or a GitHub repo path. Use when a user asks to list installable skills, install a curated skill, or install a skill from another repo (including private repos).

Data Science

23118

deep-research

by davidorex

Multi-agent parallel investigation for complex VCV Rack problems

Data Science

16151