transcription

Name: transcription
Author: MadAppGang

Audio/video transcription using OpenAI Whisper. Covers installation, model selection, transcript formats (SRT, VTT, JSON), timing synchronization, and speaker diarization. Use when transcribing media or generating subtitles.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: MadAppGang
Category: Data Science
Views: 2

GitHub repo

About this skill

How to use

Zainstaluj Whisper – wybierz jedną z trzech opcji: standardowy OpenAI Whisper przez pip (pip install openai-whisper), szybszą wersję whisper.cpp (brew install whisper-cpp na macOS lub budowanie ze źródła na Linuxie), lub GPU-przyspieszony wariant (pip install insanely-fast-whisper). Zweryfikuj instalację poleceniem whisper --help.
Wybierz model w zależności od Twojego sprzętu i wymagań jakości. Model tiny (39M, ~1GB VRAM) nadaje się do szybkich podglądów, base (74M) do roboczych transkrypcji, small (244M, ~2GB) to dobry kompromis między szybkością a jakością, medium (769M, ~5GB) dla lepszej dokładności, a large-v3 (1550M, ~10GB) dla produkcyjnych transkrypcji najwyższej jakości.
Uruchom transkrypcję podstawową poleceniem whisper audio.mp3 --model small, które automatycznie wykryje język. Jeśli chcesz określić język, dodaj flagę --language en (lub inny kod języka).
Wybierz format wyjściowy – dodaj --output_format srt dla napisów SRT, vtt dla VTT, json dla JSON, lub all aby wygenerować wszystkie formaty jednocześnie.
Aby uzyskać dokładne czasy na poziomie słów, dodaj flagę --word_timestamps True do polecenia. Ta opcja przydaje się przy tworzeniu zaawansowanych napisów lub edycji wideo.
Czekaj na zakończenie przetwarzania – czas zależy od długości pliku, wybranego modelu i dostępnych zasobów sprzętowych. Po zakończeniu transkrypcja zostanie zapisana w wybranym formacie w tym samym katalogu co plik źródłowy.

Related skills

pdf

by anthropics

Comprehensive PDF manipulation toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. When Claude needs to fill in a PDF form or programmatically process, generate, or analyze PDF documents at scale.

Data Science

31144

market-analysis

by xbklairith

Use when analyzing markets or interpreting charts - applies technical indicators (RSI, MACD, Moving Averages), identifies support/resistance, analyzes multi-timeframe trends, checks fundamentals and sentiment. Activates when user says \

Data Science

29144

rust-coding-skill

by UtakataKyosui

Guides Claude in writing idiomatic, efficient, well-structured Rust code using proper data modeling, traits, impl organization, macros, and build-speed best practices.

Data Science

248325

a-stock-analysis

by openclaw

A股实时行情与分时量能分析。获取沪深股票实时价格、涨跌、成交量，分析分时量能分布（早盘/尾盘放量）、主力动向（抢筹/出货信号）、涨停封单。支持持仓管理和盈亏分析。Use when: (1) 查询A股实时行情, (2) 分析主力资金动向, (3) 查看分时成交量分布, (4) 管理股票持仓, (5) 分析持仓盈亏。

Data Science

48153

skill-creator

by anthropics

Guide for creating effective skills. This skill should be used when users want to create a new skill (or update an existing skill) that extends Claude's capabilities with specialized knowledge, workflows, or tool integrations.

Data Science

59147

threejs

by mrgoonie

Build 3D web apps with Three.js (WebGL/WebGPU). Use for 3D scenes, animations, custom shaders, PBR materials, VR/XR experiences, games, data visualizations, product configurators.

Data Science

1743