Instrukcja zakładania konta i deponowania danych w RepOD

Logo RepOD

RepOD (Repozytorium Otwartych Danych)

bezpłatne, polskie repozytorium interdyscyplinarne, które powstało w ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych realizowanego przez zespoły projektowe w ICM UW, ISS UW, IFiS PAN w Warszawie i UAM w Poznaniu. Repozytorium to jest przeznaczone dla tzw. małych danych – limit wielkości pojedynczego pliku wynosi 5 GB (limit wielkości sumy przesyłanych jednocześnie plików wynosi 20 GB), przy czym nie ma określonego limitu na wielkość zestawu danych (choć lepiej nie więcej niż 2 TB). Wszystkie wersje zbiorów danych w RepOD mają ten sam identyfikator DOI, ich wyróżnikiem jest numer wersji. RepOD jest zarejestrowane w re3data.org oraz od maja 2025 r. ma certyfikat CoreTrustSeal przyznawany zaufanym repozytoriom na okres trzech lat.

Adres strony internetowej RepOD – https://repod.icm.edu.pl/

Instrukcja w wersji do pobrania

Zakładanie konta i logowanie

Uzupełnianie metadanych

Wybór kolekcji SGGW
Należy wybrać kolekcję naszej uczelni – można to zrobić na dwa sposoby:
1. W menu prezentującym ikony z linkami do kolekcji poszczególnych instytucji trzeba odszukać nazwę naszej uczelni: Warsaw University of Life Sciences.
A następnie można wybrać przycisk ‘Dodaj dane’ → ‘Nowy zbiór danych’.

2. W górnym menu można wybrać zakładkę ‘Dodaj zbiór danych’. Pojawi się okienko, w którym będzie można wybrać kolekcję Warsaw University of Life Sciences albo za pomocą wyszukiwarki, albo za pomocą drzewka.

Po wybraniu kolekcji należy zatwierdzić wybór przyciskiem 'Dodaj zbiór danych do wybranej kolekcji’.

Uwaga: użytkownik może wybrać jedynie te kolekcje, w których ma uprawnienia do deponowania zbiorów danych. Kolekcje instytucjonalne, które wymagają rejestracji przy użyciu adresu e-mail w konkretnej domenie, będą widoczne wyłącznie dla kont spełniających ten warunek. Przy czym czasami może pojawić się błąd i pomimo zalogowania przy użyciu domeny sggw.edu.pl, kolekcja Warsaw University of Life Sciences może nie być widoczna – należy wtedy zalogować się jeszcze raz.

Wprowadzanie metadanych

Tytuł

Grupa pól dotyczących autora

Opis

Słowa kluczowe

Powiązana publikacja / powiązany zbiór danych
Należy wprowadzać tylko publikacje / zbiory danych, które już się ukazały / zostały opublikowane. Wszystkie podpola powinny zostać uzupełnione.

Pole 'Cytowanie’ powinno zawierać następujące informacje:
- dla publikacji: autor/autorzy, rok, tytuł, wydawnictwo/czasopismo, numer/tom czasopisma, numery stron, identyfikator DOI (lub inny), najlepiej w postaci adresu URL. Informacje należy podać zgodnie z preferowanym standardem cytowania;
- dla zbioru danych: autor/autorzy, rok publikacji, tytuł, identyfikator, nazwa repozytorium, numer wersji.
’Rodzaj powiązania’ powinien być przemyślany i dobrze oddawać relację między zbiorem a publikacją.

Jeżeli wskazano DOI jako typ identyfikatora publikacji/zbioru, należy podać je w zwykłej postaci, a nie w formie adresu URL.

Jeśli to możliwe, adres URL publikacji/zbioru powinien bazować na trwałym identyfikatorze DOI.

Informacje o grancie
Pola 'Instytucja finansująca’, 'Skrócona nazwa instytucji’, 'ROR instytucji finansującej’ i 'Program grantowy’ są polami podpowiadającymi. Należy korzystać z sugerowanych informacji i nie dodawać do nich zbędnych elementów, np. numeru konkursu grantowego:
- dobrze: OPUS,
- źle: Opus 16.

Deponowanie zbioru danych

Przygotowanie plików
Nazwy plików powinny składać się jedynie ze znaków a–Z, 0–9, _ i nie zawierać spacji, polskich znaków ani innych znaków specjalnych. Dotyczy to również plików znajdujących się wewnątrz archiwów ZIP.

Nie należy stosować oznaczeń kolorystycznych jako elementu formatowania tekstu. Należy mieć na uwadze dostępność wszystkich materiałów dla osób z niepełnosprawnościami oraz korzystających z różnych urządzeń. Oznaczenie w taki sposób danych tabelarycznych sprawia, że stają się one trudniejsze do przeanalizowania.

Plik readme to element dokumentacji zbioru; jeżeli zostanie dodany, powinien znajdować się na szczycie listy plików. Właściwe kodowanie pliku to UTF-8, a właściwy format – TXT. Można skorzystać z szablonu dostępnego na stronie: https://data.research.cornell.edu/data-management/sharing/readme/ i przystosować go do swoich potrzeb.

Sugerujemy zapisywanie danych w ogólnodostępnych formatach plików, łatwych do odczytania i interpretowania. Korzystanie ze standardowych i wymiennych lub otwartych formatów danych zapewnia długoterminową użyteczność danych.

Zalecane formaty plików:
- tekst: txt, odt, html, xml,
- obrazy: png, jpeg2000, tiff,
- audio: wav,
- wideo: mkv, ogg, ogv, dopuszczalne: mp4, mov,
- archiwa: zip,
- CAD: step,
- dane tabelaryczne, arkusze kalkulacyjne: csv, tab, ods, rdata, sav/spv (wyjściowe z SPSS).
Pliki csv, tab, xlsx, sav/spv przechodzą próbę automatycznej analizy — jeśli będzie ona udana, plik będzie dostępny dodatkowo w formatach tab, rdata i sav, będzie też możliwość jego przeglądania online.

Dla plików xlsx, które z różnych względów nie przejdą analizy, zostanie wygenerowana kopia w formacie ods.

Aby zapewnić pomyślną analizę z trafnymi wynikami, plik danych tabelarycznych powinien:
- składać się tylko z jednego arkusza danych,
- zawierać tylko jedną tabelę w układzie pionowym, tj. każda użyta kolumna powinna zawierać jedną zmienną, a poszczególne wiersze — wartości zmiennych dla jednego przypadku,
- nie zawierać komórek scalonych (program analizujący dokona próby rozdzielenia scalonych komórek, ale zrobi to źle),
- nie zawierać pustych kolumn ani wierszy, w tym „marginesów” górnych ani lewych: tabela powinna zaczynać się od kolumny A i od wiersza 1,
- w wierszu 1. zawierać wyłącznie kompletne nazwy zmiennych,
- od wiersza 2. aż do końca zawierać tylko wartości zmiennych,
- nie zawierać komentarzy, objaśnień stosowanych jednostek i skrótów, opisów warunków pomiaru itp. — te powinny się znaleźć w opisie pliku, opisie zbioru i/lub w specjalnie przygotowanym pliku readme.txt (wzór).
Pliki niespełniające tych warunków nie będą odrzucane w procesie weryfikacji, ale mogą go znacząco wydłużyć. Pliki, które nie przeszły analizy, są trudniejsze w odbiorze i trudniejsze do ponownego wykorzystania.

Przesyłanie plików

Wybór licencji

Zapisywanie wersji roboczej zbioru danych

Udostępnianie linku do wersji roboczej zbioru danych (wersji nieopublikowanej)

Edycja wersji roboczej zbioru danych
Na stronie wersji roboczej zbioru dostępny jest przycisk Edytuj, który umożliwia m.in.:
- dodanie kolejnych plików do zbioru → Pliki (przesyłanie),
- edycję formularza metadanych → Metadane,
- nałożenie embarga na pliki → Embargo; funkcjonalność pozwalająca ograniczyć widoczność przesłanych plików na określony czas po opublikowaniu zbioru — maksymalnie 36 miesięcy; wcześniejsze zdjęcie embarga jest możliwe, ale nie jest możliwe jego przywrócenie ani przedłużenie; embargo można ustawić tylko w przypadku tych zbiorów, które nie posiadają jeszcze żadnej opublikowanej wersji,
- można również wybrać opcję → Usuń zbiór danych i trwale usunąć zapisaną wersję roboczą; operacja ta jest ostateczna – usuniętej wersji roboczej nie można przywrócić; po opublikowaniu zbioru ta opcja nie będzie dostępna – raz opublikowany zbiór nie może zostać usunięty.

Przekazanie zbioru danych do weryfikacji

Modyfikowanie opublikowanego zbioru danych

Więcej informacji:

Weryfikacja zdeponowanych zbiorów danych w SGGW:
Oddział Otwartych Zasobów Nauki Biblioteka Główna SGGW, pokój nr 134
dr Agnieszka Adamiec, mgr Dominika Semeniuk tel. 22 59 35 720; e-mail – otwartanauka@sggw.edu.pl

Instrukcja zakładania konta i deponowania danych w RepOD

RepOD (Repozytorium Otwartych Danych)

Zakładanie konta i logowanie

Uzupełnianie metadanych

Wybór kolekcji SGGW

Wprowadzanie metadanych

Tytuł

Grupa pól dotyczących autora

Opis

Słowa kluczowe

Powiązana publikacja / powiązany zbiór danych

Informacje o grancie

Deponowanie zbioru danych

Przygotowanie plików

Przesyłanie plików

Wybór licencji

Zapisywanie wersji roboczej zbioru danych

Udostępnianie linku do wersji roboczej zbioru danych (wersji nieopublikowanej)

Edycja wersji roboczej zbioru danych

Przekazanie zbioru danych do weryfikacji

Modyfikowanie opublikowanego zbioru danych