Plany zarządzania danymi badawczymi w konkursach NCN
We wrześniu 2018 roku Narodowe Centrum Nauki (NCN) stało się jednym z sygnatariuszy porozumienia cOAlition S. Celem przyjętego przez koalicjantów Planu S jest wprowadzenie otwartego dostępu do publikacji i wyników badań naukowych finansowanych ze środków publicznych.
W 2019 r. NCN zobowiązało autorów wniosków o dofinansowanie projektów badawczych do dołączania do zgłoszeń planu zarządzania danymi badawczymi.
Więcej na temat wymagań NCN na stronie:
https://www.ncn.gov.pl/finansowanie-nauki/informacje-dla-wnioskodawcow
Wytyczne NCN dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym:
W maju 2020 r. NCN przyjęło politykę otwartego dostępu. Treść tego dokumentu została oparta na założeniach Planu S. Polityka zawiera informacje o ścieżkach publikacyjnych spełniających kryteria zgodności z Planem S, o kwalifikowalności kosztów oraz pozostałe wytyczne, w tym dotyczące danych badawczych:
- dane powinny być udostępnione w otwartym repozytorium, tam gdzie to możliwe, zgodnie z warunkami licencji Creative Commons (najlepiej Public Domain CC0),
- metadane powinny spełniać wytyczne podane przez OpenAIRE, w tym powinny zawierać adnotację o finansowaniu ze środków projektu (Narodowe Centrum Nauki, numer projektu),
- standardy cytowania danych powinny być zgodne z wytycznymi Declaration of Data Citation Principles by FORCE 11 oraz TOP Guidelines (przykład: autor(zy), rok, tytuł danych, repozytorium, wersja, stały identyfikator).
Kwestionariusz planu zarządzania danymi badawczymi w konkursach NCN został oparty w niemal 95% na Practical guide to the international alignment of research data management – zbiorze wytycznych dotyczących planów zarządzania danymi badawczymi opracowanym przez Science Europe.
Plan zarządzani danymi badawczymi w konkursach NCN składa się z sześciu części, z których każda podzielona jest na dwie lub maksymalnie cztery podkategorie. W prawie każdym punkcie planu może być maksymalnie 1000 znaków ze spacjami. Wyjątkiem jest punkt 2.1, w którym można wpisać 2000 znaków ze spacjami.
1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
1.1. Sposób pozyskiwania i opracowywania nowych danych i/lub ponownego wykorzystania dostępnych danych
- informacje na temat standardów, metod i oprogramowania (nazwa oprogramowania), które posłużą do pozyskiwania lub wytwarzania nowych danych
- podanie rodzaju danych, np. teksty, obrazy, zdjęcia, pomiary, statystyki, próbki fizyczne, kody
- wymienienie procesów kontroli jakości i spójności, np. procesy kalibracji, powtórne pobieranie próbek lub ponowne wykonywanie pomiarów, wykorzystanie narzuconego słownictwa, walidacja wprowadzanych danych, specjalistyczne recenzje
- informacja, czy jakieś dane już istniejące (własne lub będące w posiadaniu strony trzeciej) zostaną ponownie wykorzystane, a jeżeli tak, zapewnienie, że przestrzegane będą wszelkie ograniczenia związane z ponownym wykorzystaniem danych
- informacja, czy konieczne będzie przekształcenie do postaci cyfrowej danych analogowych lub digitalizacja danych wydanych w formie papierowej (np. mapy, fotografie, teksty)
- opisanie sposobu organizacji plików i zarządzania ich różnymi wersjami – posługiwanie się odpowiednim nazewnictwem plików, tj. nadanie nazwy umożliwiającej szybką identyfikację typu danych, oznaczenie każdej wersji kolejnym numerem, podanie dokładnej daty
1.2. Pozyskiwane lub opracowywane dane (np. rodzaj, format, ilość)
- wymienienie formatów danych (najlepiej formaty otwarte lub przynajmniej szeroko stosowane wśród naukowców z danej dyscypliny): pliki tekstowe: .txt, .rtf, .odt, .pdf; ankiety online: html; zdjęcia, obrazy: .bmp, .gif, .jpg, .png; nagrania: .wav, .aif, .flac, .wv, .apl, .mp3; bazy danych: .xls, .spv, .dbs
- podanie szacunkowej objętości danych wytworzonych, pozyskanych, ponownie wykorzystanych (kB, MB, GB, TB)
2. Dokumentacja i jakość danych
2.1. Metadane i dokumenty (np. metodologia lub pozyskiwanie danych oraz sposób porządkowania danych) towarzyszące danym
- opisanie sposobu organizacji plików i zarządzania ich różnymi wersjami (np. struktura folderów, wersjonowanie danych)
- przedstawienie sposobu i miejsca utworzenia dokumentacji towarzyszącej danym badawczym, w tym informacji o metodologii i organizacji danych w trakcie projektu (np. baza danych z łączem prowadzącym do poszczególnych elementów, pliki README, książka kodowa itd.)
- podanie informacji o standardach metadanych, które będą opisywać dane badawcze, w tym dane zdeponowane w wybranym (zaufanym) repozytorium (międzynarodowe standardy lub schematy służące do organizacji metadanych, np. Dublin Core, DDI, DataCite – Digital Curation Centre (DCC) prowadzi listę szeroko stosowanych standardów metadanych)
2.2. Stosowane środki kontroli jakości danych
- opisanie procesów kontroli jakości i spójności, np. badania laboratoryjne – procesy kalibracji, powtórne pobieranie próbek lub ponowne wykonywanie pomiarów, walidacja wprowadzanych danych; badania ankietowe – nieterenowe metody kontroli (np. merytoryczna analiza wypełnionych kwestionariuszy), terenowe metody kontroli (np. powtórny wywiad kontrolny); różne – zastosowanie narzuconego słownictwa (ang. controlled vocabulary), specjalistyczne recenzje
- informacja o minimalizacji ryzyka dotyczącego poprawności danych (wskazanie przyjętych w instytucji mechanizmów mających na celu zabezpieczenie danych przed nieuprawnioną modyfikacją), np. pliki zabezpieczone silnym hasłem
3. Przechowywanie i tworzenie kopii zapasowych podczas badań
3.1. Przechowywanie i tworzenie kopii zapasowych danych i metadanych podczas badań
- określenie pojemności pamięci, którą się dysponuje, tzn. ile wolnego miejsca jest w komputerze (serwer uczelni), w chmurze (dysk sieciowy) itd. (zapewnienie, że wszystkie dane i ich kopie się pomieszczą )
- opisanie procedur tworzenia kopii zapasowych (zasada 3-2-1: trzy kopie, na dwóch nośnikach (np. serwer uczelni, dysk sieciowy), przynajmniej jedna kopia w lokalizacji innej niż miejsce przetwarzania danych; sposób tworzenia kopii zapasowych – automatyczny czy manualny – jeśli manualny, trzeba dopisać, kto będzie odpowiedzialny za tworzenie kopii i odzyskiwanie danych; częstotliwość tworzenia kopii zapasowych – najlepiej nie rzadziej niż raz na tydzień)
- informacja, czy będą potrzebne specjalne metody przenoszenia danych z urządzeń mobilnych, stanowisk terenowych lub sprzętu domowego na główny serwer w miejscu pracy
3.2. Sposób zapewnienia bezpieczeństwa danych oraz ochrony danych wrażliwych podczas badań
- informacja, czy podczas realizacji projektu / działania będą przetwarzane dane wrażliwe (szczególny typ danych osobowych: dotyczące pochodzenia rasowego lub etnicznego danej osoby, ujawniające przekonania religijne lub światopoglądowe, uwidaczniające poglądy polityczne, obnażające przynależność do związków zawodowych, dane biometryczne, dane genetyczne (przede wszystkim o kodzie DNA i RNA) i te dotyczące zdrowia (stan zdrowia, przebyte choroby), dane dotyczące seksualności w tym orientacji seksualnej), dane wrażliwe politycznie lub dane podwójnego zastosowania
- informacja o polityce ochrony danych obowiązującej w instytucji (Zarządzenie Nr 27 Rektora Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie z dnia 5 kwietnia 2022 r. w sprawie ustanowienia Systemu Zarządzania Bezpieczeństwem Informacji oraz Polityki Bezpieczeństwa Informacji w SGGW w Warszawie) oraz krótkie wyjaśnienie, o czym jest dany dokument (podanie przykładów zabezpieczania danych zgodnych z tą polityką)
- informacja, kto będzie miał dostęp do danych w czasie trwania projektu i jak będzie przebiegać kontrola dostępu do danych (zwłaszcza w przypadku współpracy między kilkoma partnerami)
- informacja o sposobie odzyskania danych utraconych w wyniku incydentu, np. jedna z trzech kopii pozwoli odzyskać utracone dane bez straty ich jakości, pliki README zawierające informacje niezbędne do powtórzenia analizy pozwolą odtworzyć proces tworzenia danych
4. Wymogi prawne, kodeks postępowania
4.1. Sposób zapewnienia zgodności z przepisami dotyczącymi danych osobowych i bezpieczeństwa danych w przypadku przetwarzania danych osobowych
- informacja, czy w trakcie realizacji projektu / działania będzie miało miejsce przetwarzanie danych osobowych
- jeżeli będzie miało miejsce przetwarzanie danych osobowych (odpowiedź TAK na pytanie: „Czy planowane badania wiążą się z przetwarzaniem danych osobowych” w formularzu dotyczącym kwestii etycznych) – informacja o sposobach ochrony pozyskanych danych, np. posłużenie się anonimizacją lub pseudonimizacją:
– anonimizacja – zupełne wyeliminowanie informacji o charakterze osobowym – pseudonimizacja – przetworzenie danych osobowych w taki sposób, by nie można ich było już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji; równoległym warunkiem jest, by takie dodatkowe informacje były przechowywane osobno i zostały objęte środkami technicznymi i organizacyjnymi uniemożliwiającymi ich przypisanie zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej – wówczas trzeba mieć na uwadze, że księga kodów będzie musiała być przechowywana w innym miejscu, w innej lokalizacji niż same dane, tak, żeby nie było możliwości rozszyfrowania informacji, które są podane przy samych danych - informacja o oświadczeniu uczestnika badań potwierdzającym jego świadomą zgodę na udział
- powołanie się na odpowiednie regulacje: Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. (RODO) i Ustawa z dnia 10 maja 2018 r. o ochronie danych osobowych
- informacja o polityce ochrony danych osobowych w instytucji (Zarządzenie Nr 120 Rektora Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie z dnia 4 listopada 2021 r. w sprawie wprowadzenia Polityki ochrony danych osobowych w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie) oraz krótkie wyjaśnienie, o czym jest dany dokument (podanie przykładów ochrony danych osobowych zgodnych z tą polityką)
4.2. Sposób zarządzania innymi kwestiami prawnymi, np. prawami własności intelektualnej lub własnością. Obowiązujące przepisy
- informacja o polityce dotyczącej praw własności intelektualnej w instytucji (Uchwała nr 115 – 2018/2019 Senatu Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie z dnia 24 czerwca 2019 roku: w sprawie uchwalenia Regulaminu zarządzania prawami autorskimi, prawami pokrewnymi i własności przemysłowej oraz zasad komercjalizacji w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie) oraz krótkie wyjaśnienie, o czym jest dany dokument (podanie właściciela praw własności intelektualnej do danych w świetle tej polityki)
- informacja, czy w projekcie będą wykorzystywane jakieś dane już istniejące (własne lub będące w posiadaniu strony trzeciej) lub dane, których wytworzenie zostanie zlecone innej jednostce, i czy w związku z tym przed udostępnieniem danych (także dostępnych komercyjnie) wskazane będzie uzyskanie (jeśli to możliwe) odpowiedniego zezwolenia w zakresie praw autorskich ze względu na ewentualne ograniczenia ponownego ich wykorzystania
- informacja o licencji, którą oznaczone będą udostępniane dane (NCN zaleca licencję Creative Commons Przekazanie do Domeny Publicznej CC0)
5. Udostępnianie i długotrwałe przechowywanie danych
5.1. Sposób i termin udostępnienia danych. Ewentualne ograniczenia w udostępnianiu danych lub przyczyny embarga
- wskazanie planowanego terminu udostępnienia danych (najpóźniej w momencie ukazania się publikacji, bez embarga)
- wskazanie okresu przechowywania danych (co najmniej 10 lat zgodnie z wytycznymi NCN)
- informacja o licencji, którą oznaczone będą udostępniane dane (NCN zaleca licencję Creative Commons Przekazanie do Domeny Publicznej CC0)
- informacja o ograniczeniach i przeszkodach uniemożliwiających pełne lub częściowe udostępnienie danych
- informacja, czy udostępnienie danych wymaga zgody uczestników badania
- informacja, czy wydawcy czasopism będą wymagać składowania danych na poparcie ustaleń publikacji (np. w formie tabeli w treści artykułu, jako załącznik, suplement dołączony do artykułu, czy udostępniony link do danych, które znajdą się we wskazanych przez wydawnictwo repozytoriach)
5.2. Sposób wyboru danych przeznaczonych do przechowania oraz miejsce długotrwałego przechowywania danych (np. repozytorium lub archiwum danych)
- wskazanie procedury selekcji danych (informacja, które dane będą zachowane, a które zostaną zniszczone z przyczyn wynikających z umów, przepisów prawnych lub regulacji)
- wskazanie repozytoriów, w których zostaną umieszczone dane (repozytoria powinny umożliwiać udostępnianie danych zgodnie z zasadami FAIR; rejestr repozytoriów danych badawczych: Registry of Research Data Repositories, rejestr repozytoriów danych badawczych, które pozytywnie przeszły ocenę ich funkcjonalności i uzyskały certyfikat CoreTrustSeal)
- informacja o ewentualnych kosztach umieszczenia danych w repozytorium
5.3. Metody lub narzędzia programowe umożliwiające dostęp do danych i korzystanie z danych
- informacja, czy dane są zapisane w formacie otwartym lub co najmniej standardowym, czy należy je przekształcić do takich formatów, aby mogły być przechowywane przez dłuższy okres i zachowały długi okres ważności
- informacja, czy do skanowania lub konwersji niezbędny będzie dodatkowy sprzęt lub oprogramowanie
- wskazanie mechanizmu, jaki posłuży do udostępniania danych (np. repozytorium lub odpowiedzi na żądanie – z podaniem wyjaśnienia, dlaczego dane mogą być udostępnione tylko w tak ograniczonym zakresie)
5.4. Sposób zapewniający stosowanie unikalnego i trwałego identyfikatora (np. cyfrowego identyfikatora obiektu (DOI)) dla każdego zestawu danych
- informacja, czy zbiór danych uzyska trwale przypisany identyfikator (PID) i jeśli tak, jaki (np. cyfrowe identyfikatory dokumentu elektronicznego (np. DOI, URN, ARK, handle, Purl lub inne), numery dostępowe)?
6. Zadania związane z zarządzaniem danymi oraz zasoby
6.1. Osoba (np. funkcja, stanowisko i instytucja) odpowiedzialna za zarządzanie danymi (np. data steward)
- dokonanie podziału ról i obowiązków, czyli informacja, kto (stanowiskowo) odpowiada za weryfikację, korektę, kto wdraża plan; czy instytucja posiada personel odpowiedzialny za zarządzanie danymi w trakcie trwania projektu (właściciel danych – osoba, która formalnie ponosi odpowiedzialność za dane; opiekun (data steward) – osoba, która jest specjalistą ds. jakości danych i jest odpowiedzialna za ich ocenę (środki zaradcze), ale nie bezpośrednią korektę; należy podawać jedynie stanowisko w obrębie jednostki, bez nazwisk
6.2. Środki (np. finansowe i czasowe) przeznaczone do zarządzania danymi i zapewnienia możliwości odnalezienia, dostępu, interoperacyjności i ponownego wykorzystania danych
- informacja o zasobach, które zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR (dodatkowe zasoby do zarządzania danymi (osoby, czas, sprzęt lub oprogramowanie), koszty związane z zapewnieniem standardów FAIR w projekcie oraz sposób ich opłacenia)
Dodatkowe informacje:
Oddział Otwartych Zasobów Nauki Biblioteka Główna SGGW, pokój nr 134
dr Agnieszka Adamiec, mgr Dominika Semeniuk tel. 22 59 35 720; e-mail – otwartanauka@sggw.edu.pl
Prezentacja “Otwarty dostęp w projektach (przykład NCN)” PDF