Toolverse
All skills

google-gemini-file-search

by jezweb

Build document Qu0026A and searchable knowledge bases with Google Gemini File Search - fully managed RAG with automatic chunking, embeddings, and citations. Upload 100+ file formats (PDF, Word, Excel, code), configure semantic search, and query with natural language.Use when:

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
jezweb
Category
Data Science
Views
76

About this skill

Build document Qu0026A and searchable knowledge bases with Google Gemini File Search - fully managed RAG with automatic chunking, embeddings, and citations. Upload 100+ file formats (PDF, Word, Excel, code), configure semantic search, and query with natural language.Use when: building document Qu0026A systems, creating searchable knowledge bases, implementing semantic search without managing embeddings, indexing large document collections (100+ formats), or troubleshooting document immutability errors (delete+re-upload required), storage quota issues (3x input size for embeddings), chunking configuration (500 tokens/chunk recommended), metadata limits (20 key-value pairs max), indexing cost surprises ($0.15/1M tokens one-time), operation polling timeouts (wait for done: true), force delete errors, or model compatibility (Gemini 2.5 Pro/Flash only).

How to use

  1. Utwórz klucz API na https://aistudio.google.com/apikey — będzie potrzebny do autoryzacji w Google Gemini File Search.

  2. Zainstaluj umiejętność w swoim środowisku Claude, upewniając się, że masz dostęp do narzędzi Bash, Read, Write, Glob, Grep i WebFetch wymaganych do konfiguracji.

  3. Przygotuj dokumenty do wgrania — obsługiwane są PDF, dokumenty Word, arkusze Excel, pliki kodów i ponad 100 innych formatów. Pamiętaj, że każdy dokument zajmuje trzy razy więcej miejsca na przechowywanie niż jego rozmiar wejściowy ze względu na embedingi.

  4. Wgraj pliki do magazynu File Search za pośrednictwem API Google Gemini — system automatycznie podzieli je na fragmenty (rekomendacja: 500 tokenów na fragment) i utworzy indeksy do wyszukiwania semantycznego.

  5. Wysyłaj pytania w naturalnym języku do indeksowanych dokumentów — Google Gemini zwróci odpowiedzi z cytowaniem źródeł. Pamiętaj, że zapytania działają tylko z modelami Gemini 2.5 Pro lub Flash.

  6. Monitoruj koszty indeksowania (0,15 USD za 1 milion tokenów, jednorazowo) i limity darmowego planu (1 GB pamięci, 1500 zapytań dziennie). Jeśli musisz usunąć dokument, usuń go całkowicie i wgraj ponownie — dokumenty nie mogą być zmieniane w miejscu.

Related skills

a-stock-analysis

by openclaw

A股实时行情与分时量能分析。获取沪深股票实时价格、涨跌、成交量,分析分时量能分布(早盘/尾盘放量)、主力动向(抢筹/出货信号)、涨停封单。支持持仓管理和盈亏分析。Use when: (1) 查询A股实时行情, (2) 分析主力资金动向, (3) 查看分时成交量分布, (4) 管理股票持仓, (5) 分析持仓盈亏。

Data Science
48153

market-analysis

by xbklairith

Use when analyzing markets or interpreting charts - applies technical indicators (RSI, MACD, Moving Averages), identifies support/resistance, analyzes multi-timeframe trends, checks fundamentals and sentiment. Activates when user says \

Data Science
29144

pdf-processing

by Ming-Kai-LC

Comprehensive PDF processing techniques for handling large files that exceed Claude Code's reading limits, including chunking strategies, text/table extraction, and OCR for scanned documents. Use when working with PDFs larger than 10-15MB or more than 30-50 pages.

Data Science
23134

web-artifacts-builder

by anthropics

Suite of tools for creating elaborate, multi-component claude.ai HTML artifacts using modern frontend web technologies (React, Tailwind CSS, shadcn/ui). Use for complex artifacts requiring state management, routing, or shadcn/ui components - not for simple single-file HTML/JSX

Data Science
37124

openrouter

by rawveg

OpenRouter API - Unified access to 400+ AI models through one API

Data Science
17138

pdf

by anthropics

Comprehensive PDF manipulation toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. When Claude needs to fill in a PDF form or programmatically process, generate, or analyze PDF documents at scale.

Data Science
31144