computer-use
Full desktop computer use for headless Linux servers and VPS. Creates a virtual display (Xvfb + XFCE) to control GUI applications without a physical monitor. Screenshots, mouse clicks, keyboard input, scrolling, dragging — all 17 standard actions. Includes VNC setup for live
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Full desktop computer use for headless Linux servers and VPS. Creates a virtual display (Xvfb + XFCE) to control GUI applications without a physical monitor. Screenshots, mouse clicks, keyboard input, scrolling, dragging — all 17 standard actions. Includes VNC setup for live remote viewing and interaction. Model-agnostic, works with any LLM.
How to use
Uruchom skrypt konfiguracyjny
./scripts/setup-vnc.sh, który zainstaluje Xvfb (wirtualny wyświetlacz na:99), minimalny pulpit XFCE4, x11vnc oraz noVNC do dostępu przez przeglądarkę. Wszystkie usługi uruchomią się automatycznie przy starcie systemu.Zweryfikuj, że wirtualny wyświetlacz działa, wykonując zrzut ekranu za pomocą akcji
screenshot— powinna zwrócić obraz w formacie base64 PNG rozdzielczości 1024x768.Aby kontrolować mysz, użyj akcji
left_clickz współrzędnymi (x, y) — na przykładleft_click 512 384kliknie w środek ekranu. Dla bardziej złożonych interakcji dostępne sąright_click,double_click,triple_clickorazleft_click_dragdo przeciągania.Do wpisywania tekstu użyj akcji
type— skill automatycznie dzieli tekst na porcje 50 znaków z opóźnieniem 12ms między nimi, co zapobiega utracie danych. Dla klawiszy specjalnych (Enter, Tab, Ctrl+C) użyj akcjikeyz odpowiednią kombinacją.Aby zobaczyć na żywo, co robi LLM, otwórz noVNC w przeglądarce na porcie wskazanym przez skrypt — możesz obserwować i ręcznie interweniować w sesję.
Integruj skill z dowolnym LLM, przekazując mu dostępne akcje (screenshot, cursor_position, mouse_move, click, drag, type, key, scroll) — model będzie samodzielnie decydować, które akcje wykonać, aby osiągnąć cel.