Toolverse
All skills

badge-evaluation

by benchflow-ai

Evaluate research artifacts against NDSS badge criteria (Available, Functional, Reproduced) by checking DOI, documentation, exercisability, and reproducibility requirements.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
Security

About this skill

Evaluate research artifacts against NDSS badge criteria (Available, Functional, Reproduced) by checking DOI, documentation, exercisability, and reproducibility requirements.

How to use

  1. Przygotuj artefakt badawczy — upewnij się, że zawiera dokumentację, skrypty, dane oraz plik LICENSE. Jeśli chcesz ubiegać się o odznaką dostępności, umieść artefakt w repozytorium permanentnym (Zenodo, FigShare, Dryad) i uzyskaj DOI.

  2. Wybierz typ odznaki do oceny: Available (dostępność), Functional (funkcjonalność) lub Reproduced (reprodukowalność). Każdy typ ma inne wymagania — dostępność wymaga DOI i metadanych, funkcjonalność wymaga działającego kodu i dokumentacji, reprodukowalność wymaga powtarzalnych wyników.

  3. Dla odznaki dostępności sprawdź listę kontrolną: czy artefakt jest w permanentnym repozytorium, czy ma przypisany DOI, czy DOI jest wymieniony w dodatku pracy, czy README odwołuje się do artykułu, czy obecny jest plik LICENSE.

  4. Dla odznaki funkcjonalności zweryfikuj dokumentację (czy wystarczy do użytku), kompletność (czy zawiera wszystkie kluczowe komponenty z pracy), wykonalność (czy skrypty i dane pozwalają na uruchomienie eksperymentów) oraz czy kod uruchamia się bez błędów na maszynie ewaluatora.

  5. Dla odznaki reprodukowalności powtórz główne eksperymenty niezależnie, porównaj wyniki z oryginalnymi (dopuszczalna jest tolerancja) i sprawdź, czy wyniki potwierdzają główne twierdzenia pracy.

  6. Dokumentuj wyniki oceny dla każdego kryterium — skill wspiera proces weryfikacji artefaktów zgodnie ze standardami NDSS, ułatwiając przyznawanie odznak i poprawiając przejrzystość badań naukowych.

Related skills