Toolverse
All skills

linux-gui-control

by openclaw

Control the Linux desktop GUI using xdotool, wmctrl, and dogtail. Use when you need to interact with non-browser applications, simulate mouse/keyboard input, manage windows, or inspect the UI hierarchy of applications on X11/GNOME. Supports: (1) Clicking/typing in apps, (2)

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
openclaw
Category
Frontend
Views
2

About this skill

Control the Linux desktop GUI using xdotool, wmctrl, and dogtail. Use when you need to interact with non-browser applications, simulate mouse/keyboard input, manage windows, or inspect the UI hierarchy of applications on X11/GNOME. Supports: (1) Clicking/typing in apps, (2) Resizing/moving windows, (3) Extracting text-based UI trees from apps (A11y), (4) Taking screenshots for visual analysis.

How to use

  1. Zainstaluj umiejętność w swoim środowisku agenta (sklonuj repozytorium i dodaj do katalogu skills).

  2. Zidentyfikuj okno docelowe, uruchamiając wmctrl -l — wyświetli listę wszystkich otwartych okien z ich nazwami.

  3. Dla aplikacji wspierających dostępność (aplikacje GNOME, Electron z flagą --force-renderer-accessibility) uruchom skrypt inspekcji, aby odczytać strukturę przycisków i pól wejściowych bez robienia zrzutów: python3 scripts/inspect_ui.py "nazwa_aplikacji".

  4. Wykonuj akcje za pomocą skryptów pomocniczych — aktywuj okno (./scripts/gui_action.sh activate "nazwa_okna"), klikaj w współrzędne (./scripts/gui_action.sh click 500 500), pisz tekst (./scripts/gui_action.sh type "Twój tekst") lub naciskaj klawisze (./scripts/gui_action.sh key "Return").

  5. Jeśli inspekcja tekstowa zawiedzie, zrób zrzut ekranu i użyj analizy wizualnej do identyfikacji elementów interfejsu.

  6. Dla aplikacji Electron (VS Code, Discord, Chrome), które nie ujawniają struktury UI, zamknij aplikację i uruchom ją z flagą --force-renderer-accessibility, aby włączyć dostępność.

Related skills

google-official-seo-guide

by littleben

Official Google SEO guide covering search optimization, best practices, Search Console, crawling, indexing, and improving website search visibility based on official Google documentation

Frontend
101196

keyword-research

by openclaw

Discovers high-value keywords with search intent analysis, difficulty assessment, and content opportunity mapping. Essential for starting any SEO or GEO content strategy.

Frontend
24138

frontend-slides

by sickn33

Create stunning, animation-rich HTML presentations from scratch or by converting PowerPoint files. Use when the user wants to build a presentation, convert a PPT/PPTX to web, or create slides for a talk/pitch. Helps non-designers discover their aesthetic through visual

Frontend
65135

screenshot-to-code

by OneWave-AI

Convert UI screenshots into working HTML/CSS/React/Vue code. Detects design patterns, components, and generates responsive layouts. Use this when users provide screenshots of websites, apps, or UI designs and want code implementation.

Frontend
94209

bubbletea

by hmans

Browse Bubbletea TUI framework documentation and examples. Use when working with Bubbletea components, models, commands, or building terminal user interfaces in Go.

Frontend
2158

shadcn-ui

by josechifflet

shadcn/ui component patterns for Next.js 16 applications. This skill should be used when adding UI components, customizing component styles, composing primitives, or integrating forms with react-hook-form. Covers installation, customization, composition patterns, and

Frontend
157206