ab-test-setup

Name: ab-test-setup
Author: sickn33

by sickn33

Structured guide for setting up A/B tests with mandatory gates for hypothesis, metrics, and execution readiness.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: sickn33
Category: Testing
Views: 14

GitHub repo

About this skill

Structured guide for setting up A/B tests with mandatory gates for hypothesis, metrics, and execution readiness.

How to use

Przygotuj materiały wstępne: zidentyfikuj konkretny problem użytkownika, który chcesz rozwiązać, upewnij się, że masz dostęp do źródła analityk i oszacuj przybliżony dzienny lub miesięczny ruch na stronie lub w aplikacji.
Sformułuj hipotezę testową, która zawiera: obserwację lub dowód uzasadniający test, jedną konkretną zmianę, którą chcesz przetestować, kierunkowe oczekiwanie wyniku (wzrost czy spadek), jasno zdefiniowaną grupę docelową oraz mierzalne kryteria sukcesu.
Zablokuj hipotezę przed przystąpieniem do projektowania wariantów. Przedstaw finalną hipotezę, wskaż grupę docelową, główną metrykę sukcesu, oczekiwany kierunek efektu i minimalny wykrywalny efekt (MDE). Poproś o potwierdzenie, że to ostateczna wersja hipotezy, na którą się zobowiązujesz.
Przeanalizuj założenia i zagrożenia: wypisz założenia dotyczące stabilności ruchu, niezależności użytkowników, niezawodności metryk, jakości randomizacji oraz czynników zewnętrznych (sezonowość, kampanie, wydania nowych funkcji). Jeśli któreś założenie jest słabe, rozważ opóźnienie lub przeprojektowanie testu.
Wybierz najprostszy typ testu spełniający Twoje potrzeby: test A/B dla jednej zmiany i dwóch wariantów, test A/B/n dla wielu wariantów (wymaga większego ruchu), test multiwariantowy dla efektów interakcji (wymaga bardzo dużego ruchu) lub test URL dla dużych zmian strukturalnych. Domyślnie wybieraj test A/B, chyba że masz konkretny powód, aby wybrać inny.
Zdefiniuj metryki: określ jedną główną metrykę bezpośrednio związaną z hipotezą i zamroź ją przed uruchomieniem testu. Dodaj metryki towarzyszące do monitorowania niezamierzonych efektów ubocznych.

Related skills

lean4-theorem-proving

by cameronfreer

Use when developing Lean 4 proofs, facing type class synthesis errors, managing sorries/axioms, or searching mathlib - provides build-first workflow, instance management patterns (haveI/letI), and domain-specific tactics

Testing

9108

pair-trade-screener

by tradermonty

Statistical arbitrage tool for identifying and analyzing pair trading opportunities. Detects cointegrated stock pairs within sectors, analyzes spread behavior, calculates z-scores, and provides entry/exit recommendations for market-neutral strategies. Use when user requests pair

Testing

994

langchain

by zechenzhangAGI

Framework for building LLM-powered applications with agents, chains, and RAG. Supports multiple providers (OpenAI, Anthropic, Google), 500+ integrations, ReAct agents, tool calling, memory management, and vector store retrieval. Use for building chatbots, question-answering

Testing

21123

langgraph-docs

by langchain-ai

Use this skill for requests related to LangGraph in order to fetch relevant documentation to provide accurate, up-to-date guidance.

Testing

23127

nextjs-developer

by zenobi-us

Expert Next.js developer mastering Next.js 14+ with App Router and full-stack features. Specializes in server components, server actions, performance optimization, and production deployment with focus on building fast, SEO-friendly applications.

Testing

166226

wcag-audit-patterns

by wshobson

Conduct WCAG 2.2 accessibility audits with automated testing, manual verification, and remediation guidance. Use when auditing websites for accessibility, fixing WCAG violations, or implementing accessible design patterns.

Testing

1893