Instrukcja zakładania konta i deponowania danych w RepOD

  • Zakładanie konta i logowanie

    Logowanie – przed pierwszym deponowaniem danych należy utworzyć konto:

    Dane badawcze mogą deponować tylko osoby zalogowane. Prosimy o logowanie przy użyciu adresu mailowego z domeny uczelnianej (xxxx@sggw.edu.pl).

    W kolejnym kroku należy uzupełnić wymagane informacje oraz przeczytać i zaakceptować regulamin. W razie wątpliwości można skorzystać z objaśnień — wystarczy najechać kursorem na symbol znaku zapytania obok wybranego pola. W polu 'Afiliacja’ zalecamy podać angielską wersję nazwy naszej uczelni: Warsaw University of Life Sciences (SGGW). Wprowadzone informacje należy zapisać za pomocą przycisku 'Utwórz konto’.

    Po utworzeniu konta na wskazany adres e-mail zostanie przysłana wiadomość z linkiem zawierająca prośbę o weryfikację e-maila. Prosimy postępować wg instrukcji zawartych w tej wiadomości. Po pomyślnej weryfikacji można już dodawać zbiory danych.

    Po zalogowaniu można dodawać i edytować zbiory danych, usuwać wersje robocze oraz zarządzać ograniczonymi uprawnieniami do zbiorów (np. udzielać uprawnień innym osobom do działań na konkretnym pliku lub zbiorze plików).

  • Wybór kolekcji SGGW

    Należy wybrać kolekcję naszej uczelni – można to zrobić na dwa sposoby:

    1. W menu prezentującym ikony z linkami do kolekcji poszczególnych instytucji trzeba odszukać nazwę naszej uczelni: Warsaw University of Life Sciences.

    Zrzut ekranu strony głównej RepOD z zaznaczonymi na czerwono ikonami z linkiem do kolekcji SGGW i formularza służącego do dodawania danych i/lub metadanych

    A następnie można wybrać przycisk ‘Dodaj dane’ → ‘Nowy zbiór danych’.

    2. W górnym menu można wybrać zakładkę ‘Dodaj zbiór danych’. Pojawi się okienko, w którym będzie można wybrać kolekcję Warsaw University of Life Sciences albo za pomocą wyszukiwarki, albo za pomocą drzewka.

    Po wybraniu kolekcji należy zatwierdzić wybór przyciskiem 'Dodaj zbiór danych do wybranej kolekcji’.

    Uwaga: użytkownik może wybrać jedynie te kolekcje, w których ma uprawnienia do deponowania zbiorów danych. Kolekcje instytucjonalne, które wymagają rejestracji przy użyciu adresu e-mail w konkretnej domenie, będą widoczne wyłącznie dla kont spełniających ten warunek. Przy czym czasami może pojawić się błąd i pomimo zalogowania przy użyciu domeny sggw.edu.pl, kolekcja Warsaw University of Life Sciences może nie być widoczna – należy wtedy zalogować się jeszcze raz.

  • Wprowadzanie metadanych

    Metadane to ustrukturyzowane informacje o zbiorze danych. Umożliwiają odnalezienie danych i ułatwiają ich ponowne wykorzystanie.

    W sekcji: 'Metadane cytowania’ trzeba wypełnić pola z formularza (wprowadzane informacje powinny być w j. angielskim). Pola obowiązkowe są oznaczone gwiazdką, warto jednak wypełnić jak największą liczbę pól nieobowiązkowych. Dzięki temu dane będą łatwiejsze do odnalezienia i interpretacji.

    Przy każdym okienku znajduje się znak zapytania na niebieskim tle – po najechaniu na niego kursorem pojawia się pole z krótką podpowiedzią, co należy w danej rubryce wpisać.

  • Tytuł

    Tytuł powinien w skrótowy i jasny sposób identyfikować zawartość zbioru, wskazywać wprost na treść deponowanych danych, nie zawierać informacji nadmiarowych, np. imion i nazwisk autorów czy źródła finansowania. W tytule zbioru danych nie powinno się stosować frazy: „research data for…”. Nie najlepszym rozwiązaniem jest posługiwanie się takim samym tytułem w przypadku zbioru danych badawczych i opublikowanego artykułu – dane mogą posłużyć do przygotowania kolejnych publikacji. Wielką literą powinno być zapisane tylko pierwsze słowo tytułu (oraz ewentualne nazwy własne).

  • Grupa pól dotyczących autora

    Pola te w większości są uzupełniane automatycznie informacjami podanymi w profilu zalogowanego użytkownika.

    Kolejnych autorów (jeżeli jest ich więcej) można dodawać za pomocą znaku '+’.

    Najczęściej wskazywanym systemem identyfikacji jest ORCID. Właściwy format identyfikatora ORCID to XXXX-XXXX-XXXX-XXXX.

    Pole 'ROR instytucji afiliującej’ to pole podpowiadające – po wprowadzeniu fragmentu nazwy instytucji (lub innej informacji identyfikującej) należy wybrać z listy odpowiednią nazwę. Numer ROR SGGW: https://ror.org/05srvzs48

  • Opis

    W tym polu powinny znaleźć się przede wszystkim informacje o deponowanych plikach lub zestawach plików z danymi: ich zawartości, rodzaju, strukturze, sposobie wewnętrznej organizacji (szczególnie jeśli dołączono archiwa ZIP). Należy podać informacje o oprogramowaniu użytym do wytworzenia danych, opisać kontekst projektu, a także podać wszelkie informacje, które mogą okazać się przydatne dla potencjalnego użytkownika, np. objaśnienia zastosowanych skrótów.

    Dobrą praktyką jest utworzenie i dołączenie do zbioru pliku readme, zawierającego szczegółowy opis danych. Jego przygotowanie może ułatwić szablon pliku readme. Należy zapisać plik w jak najprostszym formacie, np. TXT. W opisie zbioru można zasygnalizować obecność pliku readme wśród zdeponowanych materiałów, np. dopiskiem „for detailed description please consult readme.txt file”.

    Informacje dotyczące powiązanej publikacji lub grantu mogą znaleźć się w polu 'Opis’ tylko w charakterze uzupełnienia. Powinny zostać umieszczone przede wszystkim w odpowiednich polach metadanych (’Powiązana publikacja’, 'Informacje o grancie’).

  • Słowa kluczowe

    Opisywanie zbiorów za pomocą słów kluczowych ułatwia wyszukiwanie efektów badań.

    Każde słowo kluczowe powinno znaleźć się w oddzielnym polu (kolejne terminy można dodawać za pomocą znaku '+’). Słowa wprowadzone do jednego pola należy rozdzielić (można skorzystać z separatorów automatycznie rozdzielających elementy między przecinkami lub średnikami).

    Względem poszczególnych słów kluczowych można zastosować słownictwo kontrolowane zgodne z dziedziną badań, np. słownik terminów medycznych.

  • Powiązana publikacja / powiązany zbiór danych

    Należy wprowadzać tylko publikacje / zbiory danych, które już się ukazały / zostały opublikowane. Wszystkie podpola powinny zostać uzupełnione.

    Pole 'Cytowanie’ powinno zawierać następujące informacje:

    • dla publikacji: autor/autorzy, rok, tytuł, wydawnictwo/czasopismo, numer/tom czasopisma, numery stron, identyfikator DOI (lub inny), najlepiej w postaci adresu URL. Informacje należy podać zgodnie z preferowanym standardem cytowania;
    • dla zbioru danych: autor/autorzy, rok publikacji, tytuł, identyfikator, nazwa repozytorium, numer wersji.

    ’Rodzaj powiązania’ powinien być przemyślany i dobrze oddawać relację między zbiorem a publikacją.

    Jeżeli wskazano DOI jako typ identyfikatora publikacji/zbioru, należy podać je w zwykłej postaci, a nie w formie adresu URL.

    Jeśli to możliwe, adres URL publikacji/zbioru powinien bazować na trwałym identyfikatorze DOI.

  • Informacje o grancie

    Pola 'Instytucja finansująca’, 'Skrócona nazwa instytucji’, 'ROR instytucji finansującej’ i 'Program grantowy’ są polami podpowiadającymi. Należy korzystać z sugerowanych informacji i nie dodawać do nich zbędnych elementów, np. numeru konkursu grantowego:

    • dobrze: OPUS,
    • źle: Opus 16.
  • Przygotowanie plików

    Nazwy plików powinny składać się jedynie ze znaków a–Z, 0–9, _ i nie zawierać spacji, polskich znaków ani innych znaków specjalnych. Dotyczy to również plików znajdujących się wewnątrz archiwów ZIP.

    Nie należy stosować oznaczeń kolorystycznych jako elementu formatowania tekstu. Należy mieć na uwadze dostępność wszystkich materiałów dla osób z niepełnosprawnościami oraz korzystających z różnych urządzeń. Oznaczenie w taki sposób danych tabelarycznych sprawia, że stają się one trudniejsze do przeanalizowania.

    Plik readme to element dokumentacji zbioru; jeżeli zostanie dodany, powinien znajdować się na szczycie listy plików. Właściwe kodowanie pliku to UTF-8, a właściwy format – TXT. Można skorzystać z szablonu dostępnego na stronie: https://data.research.cornell.edu/data-management/sharing/readme/ i przystosować go do swoich potrzeb.

    Sugerujemy zapisywanie danych w ogólnodostępnych formatach plików, łatwych do odczytania i interpretowania. Korzystanie ze standardowych i wymiennych lub otwartych formatów danych zapewnia długoterminową użyteczność danych.

    Zalecane formaty plików:

    • tekst: txt, odt, html, xml,
    • obrazy: png, jpeg2000, tiff,
    • audio: wav,
    • wideo: mkv, ogg, ogv, dopuszczalne: mp4, mov,
    • archiwa: zip,
    • CAD: step,
    • dane tabelaryczne, arkusze kalkulacyjne: csv, tab, ods, rdata, sav/spv (wyjściowe z SPSS).

    Pliki csv, tab, xlsx, sav/spv przechodzą próbę automatycznej analizy — jeśli będzie ona udana, plik będzie dostępny dodatkowo w formatach tab, rdata i sav, będzie też możliwość jego przeglądania online.

    Dla plików xlsx, które z różnych względów nie przejdą analizy, zostanie wygenerowana kopia w formacie ods.

    Aby zapewnić pomyślną analizę z trafnymi wynikami, plik danych tabelarycznych powinien:

    • składać się tylko z jednego arkusza danych,
    • zawierać tylko jedną tabelę w układzie pionowym, tj. każda użyta kolumna powinna zawierać jedną zmienną, a poszczególne wiersze — wartości zmiennych dla jednego przypadku,
    • nie zawierać komórek scalonych (program analizujący dokona próby rozdzielenia scalonych komórek, ale zrobi to źle),
    • nie zawierać pustych kolumn ani wierszy, w tym „marginesów” górnych ani lewych: tabela powinna zaczynać się od kolumny A i od wiersza 1,
    • w wierszu 1. zawierać wyłącznie kompletne nazwy zmiennych,
    • od wiersza 2. aż do końca zawierać tylko wartości zmiennych,
    • nie zawierać komentarzy, objaśnień stosowanych jednostek i skrótów, opisów warunków pomiaru itp. — te powinny się znaleźć w opisie pliku, opisie zbioru i/lub w specjalnie przygotowanym pliku readme.txt (wzór).

    Pliki niespełniające tych warunków nie będą odrzucane w procesie weryfikacji, ale mogą go znacząco wydłużyć. Pliki, które nie przeszły analizy, są trudniejsze w odbiorze i trudniejsze do ponownego wykorzystania.

  • Przesyłanie plików

    Odpowiednio przygotowane pliki z danymi należy wybrać ze swojego urządzenia i przesłać przy użyciu przycisku 'Wybierz pliki do dodania’, lub przeciągnąć i upuścić we wskazanym obszarze strony.

    Limit wielkości pojedynczego pliku to 5 GB. Limit wielkości sumy przesyłanych jednocześnie plików wynosi 20 GB. Nie ma limitu wielkości całego zbioru.

    Można również edytować nazwę każdego pliku i dodać krótki opis.

  • Wybór licencji

    Każdy przesłany plik należy oznaczyć licencją poprzez wybranie odpowiedniej propozycji z rozwijanej listy (domyślnie jest to licencja CC0).

    Więcej informacji na temat licencji Creative Commons można znaleźć na stronie im poświęconej: Licencje Creative Commons.

    Repozytorium pozwala też na łatwą zmianę licencji większej liczby plików. W tym celu należy zaznaczyć pliki, których licencje mają zostać zmienione, kliknąć przycisk 'Edytuj’ i z menu rozwijanego wybrać pozycję 'Licencja’. Na ekranie pojawi się okno, w którym należy wskazać docelową licencję, a następnie zatwierdzić wybór. 

  • Zapisywanie wersji roboczej zbioru danych

    Po dodaniu plików i uzupełnieniu formularza metadanych należy zapisać zbiór danych przy użyciu przycisku u dołu ekranu.

    Zrzut ekranu strony internetowej RepOD z zaznaczonym przyciskiem służącym do zapisania wersji roboczej zbioru danych

    Zbiór danych zostanie zapisany jako wersja robocza, co znaczy, że na tym etapie można jeszcze edytować metadane i pliki. Zarazem zapisanie zbioru nie oznacza jego publikacji – wersja robocza nie jest widoczna dla innych użytkowników i przed opublikowaniem musi zostać przesłana do weryfikacji. Wersję roboczą można również usunąć.

    Na tym etapie widoczny jest zarezerwowany dla zbioru danych identyfikator DOI. Nie jest on jeszcze aktywny — jego aktywacja nastąpi  w momencie opublikowania zbioru przez administratora kolekcji.

  • Udostępnianie linku do wersji roboczej zbioru danych (wersji nieopublikowanej)

    W celu udostępnienia wybranym osobom linku do zbioru danych po ich zapisaniu, ale przed ich udostępnieniem, należy wybrać w górnym menu po prawej stronie pole 'Edytuj’, a następnie zakładkę 'Prywatny adres URL’.

    W kolejnym kroku należy wybrać przycisk 'Utwórz prywatny URL’. W ten sposób utworzony prywatny link można podawać innym, np. można go wkleić do tabeli Otwarte dane i metadane w raporcie końcowym z realizacji projektów i działań naukowych NCN, jeżeli beneficjent chce czekać z udostępnieniem danych do czasu opublikowania artykułu opartego na tym zbiorze danych.

  • Edycja wersji roboczej zbioru danych

    Na stronie wersji roboczej zbioru dostępny jest przycisk Edytuj, który umożliwia m.in.:

    • dodanie kolejnych plików do zbioru → Pliki (przesyłanie),
    • edycję formularza metadanych → Metadane,
    • nałożenie embarga na pliki → Embargo; funkcjonalność pozwalająca ograniczyć widoczność przesłanych plików na określony czas po opublikowaniu zbioru — maksymalnie 36 miesięcy; wcześniejsze zdjęcie embarga jest możliwe, ale nie jest możliwe jego przywrócenie ani przedłużenie; embargo można ustawić tylko w przypadku tych zbiorów, które nie posiadają jeszcze żadnej opublikowanej wersji,
    • można również wybrać opcję → Usuń zbiór danych i trwale usunąć zapisaną wersję roboczą; operacja ta jest ostateczna – usuniętej wersji roboczej nie można przywrócić; po opublikowaniu zbioru ta opcja nie będzie dostępna – raz opublikowany zbiór nie może zostać usunięty.

  • Przekazanie zbioru danych do weryfikacji

    Po zakończeniu pracy nad zbiorem należy przesłać go do weryfikacji za pomocą przycisku 'Przekaż do weryfikacji’.

    Zbiór danych trafi do administratorów kolekcji w SGGW (Oddział Otwartych Zasobów Nauki), którzy ocenią poprawność metadanych oraz danych, a następnie opublikują zbiór albo zwrócą go do poprawy. Autor zbioru otrzyma wówczas na podany podczas rejestracji adres e-mail odpowiednie powiadomienie wraz z komentarzem administratora.

    Jeżeli konieczne będą uzupełnienia, należy poddać zbiór edycji i ponownie przesłać go do weryfikacji.     

    Jeżeli zbiór nie będzie wymagał poprawek, zostanie opublikowany

  • Modyfikowanie opublikowanego zbioru danych

    Opublikowany zbiór danych nie może zostać usunięty. Możliwe jest jednak zmodyfikowanie istniejącego zbioru poprzez utworzenie jego nowej wersji. Należy wprowadzić zmiany, a następnie przesłać zbiór do ponownej weryfikacji. Zbiór po zmianach zostanie opublikowany jako kolejna wersja istniejącego już zasobu. Wszystkie wcześniejsze wersje pozostają dostępne dla użytkowników — można je przeglądać w zakładce 'Wersje’ na stronie zbioru.

    Zrzut ekranu strony internetowej RepOD po wprowadzeniu zmian we wcześniej opublikowanym rekordzie

    Identyfikator DOI pozostaje taki sam dla wszystkich wersji zbioru. Zawsze prowadzi do wersji najnowszej.