Plany zarządzania danymi badawczymi w konkursach NCN
We wrześniu 2018 roku Narodowe Centrum Nauki (NCN) stało się jednym z sygnatariuszy porozumienia cOAlition S. Celem przyjętego przez koalicjantów Planu S jest wprowadzenie otwartego dostępu do publikacji i wyników badań naukowych finansowanych ze środków publicznych. Koalicja podjęła decyzję o kontynuacji działalności w roku 2025.
W 2019 r. NCN zobowiązało autorów wniosków o dofinansowanie projektów badawczych do dołączania do zgłoszeń planu zarządzania danymi badawczymi.
Więcej na temat wymagań NCN na stronie:
https://www.ncn.gov.pl/finansowanie-nauki/informacje-dla-wnioskodawcow
Wytyczne NCN dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym:
Pierwszą politykę otwartego dostępu NCN przyjęło w maju 2020 r. Z uwagi na na głosy środowiska naukowego oraz wyraz troski o efektywność systemu grantowego w czerwcu 2025 r. została ogłoszona nowa Polityka publikowania w otwartym dostępie wyników badań finansowanych przez NCN. Zgodnie z nowymi zasadami nie jest już obowiązkowe publikowanie artykułów w otwartym dostępie, jednak zasady udostępniania danych badawczych pozostają bez zmian:
- dane powinny być udostępnione w otwartym repozytorium, tam gdzie to możliwe, zgodnie z warunkami licencji Creative Commons Public Domain (CC0) lub Creative Commons Attribution
International (CC BY 4.0) lub innej, która zapewnia taki sam poziom otwartości i możliwości ponownego wykorzystania danych, - wszystkie publikowane dane muszą być opisane kompletnymi i zgodnymi z wymogami dziedzinowymi metadanym; minimalny zakres informacji obejmuje: tytuł zbioru danych, autora(ów) i ich afiliacje, datę powstania danych i/lub daty gromadzenia, opis metodologii badawczej i narzędzi użytych do pozyskania danych, format i struktura danych, warunki udostępniania i licencjonowania danych, adnotację o finansowaniu ze środków projektu i poprawny nr rejestracyjny projektu (Narodowe Centrum Nauki, numer projektu),
- standardy cytowania danych powinny być zgodne z wytycznymi Declaration of Data Citation Principles by FORCE 11 oraz TOP Guidelines (przykład: autor(zy), rok, tytuł danych, repozytorium, wersja, stały identyfikator).
Kwestionariusz planu zarządzania danymi badawczymi w konkursach NCN został oparty w niemal 95% na Practical guide to the international alignment of research data management – zbiorze wytycznych dotyczących planów zarządzania danymi badawczymi opracowanym przez Science Europe.
Plan zarządzani danymi badawczymi w konkursach NCN składa się z sześciu części, z których każda podzielona jest na dwie lub maksymalnie cztery podkategorie. W prawie każdym punkcie planu może być maksymalnie 1000 znaków ze spacjami. Wyjątkiem jest punkt 2.1, w którym można wpisać 2000 znaków ze spacjami.
1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
-
1.1. Sposób pozyskiwania i opracowywania nowych danych i/lub ponownego wykorzystania dostępnych danych
- informacje na temat standardów, metod i oprogramowania (nazwa oprogramowania), które posłużą do pozyskiwania lub wytwarzania nowych danych
- podanie rodzaju danych, np. teksty, obrazy, zdjęcia, pomiary, statystyki, próbki fizyczne, kody
- wymienienie procesów kontroli jakości i spójności, np. procesy kalibracji, powtórne pobieranie próbek lub ponowne wykonywanie pomiarów, wykorzystanie narzuconego słownictwa, walidacja wprowadzanych danych, specjalistyczne recenzje
- informacja, czy jakieś dane już istniejące (własne lub będące w posiadaniu strony trzeciej) zostaną ponownie wykorzystane, a jeżeli tak, zapewnienie, że przestrzegane będą wszelkie ograniczenia związane z ponownym wykorzystaniem danych
- informacja, czy konieczne będzie przekształcenie do postaci cyfrowej danych analogowych lub digitalizacja danych wydanych w formie papierowej (np. mapy, fotografie, teksty)
- opisanie sposobu organizacji plików i zarządzania ich różnymi wersjami – posługiwanie się odpowiednim nazewnictwem plików, tj. nadanie nazwy umożliwiającej szybką identyfikację typu danych, oznaczenie każdej wersji kolejnym numerem, podanie dokładnej daty
-
1.2. Pozyskiwane lub opracowywane dane (np. rodzaj, format, ilość)
- wymienienie formatów danych (najlepiej formaty otwarte lub przynajmniej szeroko stosowane wśród naukowców z danej dyscypliny): pliki tekstowe: .txt, .rtf, .odt, .pdf; ankiety online: html; zdjęcia, obrazy: .bmp, .gif, .jpg, .png; nagrania: .wav, .aif, .flac, .wv, .apl, .mp3; bazy danych: .xls, .spv, .dbs
- podanie szacunkowej objętości danych wytworzonych, pozyskanych, ponownie wykorzystanych (kB, MB, GB, TB)
2. Dokumentacja i jakość danych
-
2.1. Metadane i dokumenty (np. metodologia lub pozyskiwanie danych oraz sposób porządkowania danych) towarzyszące danym
- opisanie sposobu organizacji plików i zarządzania ich różnymi wersjami (np. struktura folderów, wersjonowanie danych)
- przedstawienie sposobu i miejsca utworzenia dokumentacji towarzyszącej danym badawczym, w tym informacji o metodologii i organizacji danych w trakcie projektu (np. baza danych z łączem prowadzącym do poszczególnych elementów, pliki README, książka kodowa itd.)
- podanie informacji o standardach metadanych, które będą opisywać dane badawcze, w tym dane zdeponowane w wybranym (zaufanym) repozytorium (międzynarodowe standardy lub schematy służące do organizacji metadanych, np. Dublin Core, DDI, DataCite – Digital Curation Centre (DCC) prowadzi listę szeroko stosowanych standardów metadanych)
-
2.2. Stosowane środki kontroli jakości danych
- opisanie procesów kontroli jakości i spójności, np. badania laboratoryjne – procesy kalibracji, powtórne pobieranie próbek lub ponowne wykonywanie pomiarów, walidacja wprowadzanych danych; badania ankietowe – nieterenowe metody kontroli (np. merytoryczna analiza wypełnionych kwestionariuszy), terenowe metody kontroli (np. powtórny wywiad kontrolny); różne – zastosowanie narzuconego słownictwa (ang. controlled vocabulary), specjalistyczne recenzje
- informacja o minimalizacji ryzyka dotyczącego poprawności danych (wskazanie przyjętych w instytucji mechanizmów mających na celu zabezpieczenie danych przed nieuprawnioną modyfikacją), np. pliki zabezpieczone silnym hasłem
3. Przechowywanie i tworzenie kopii zapasowych podczas badań
-
3.1. Przechowywanie i tworzenie kopii zapasowych danych i metadanych podczas badań
- określenie pojemności pamięci, którą się dysponuje, tzn. ile wolnego miejsca jest w komputerze (serwer uczelni), w chmurze (dysk sieciowy) itd. (zapewnienie, że wszystkie dane i ich kopie się pomieszczą )
- opisanie procedur tworzenia kopii zapasowych (zasada 3-2-1: trzy kopie, na dwóch nośnikach (np. serwer uczelni, dysk sieciowy), przynajmniej jedna kopia w lokalizacji innej niż miejsce przetwarzania danych; sposób tworzenia kopii zapasowych – automatyczny czy manualny – jeśli manualny, trzeba dopisać, kto będzie odpowiedzialny za tworzenie kopii i odzyskiwanie danych; częstotliwość tworzenia kopii zapasowych – najlepiej nie rzadziej niż raz na tydzień)
- informacja, czy będą potrzebne specjalne metody przenoszenia danych z urządzeń mobilnych, stanowisk terenowych lub sprzętu domowego na główny serwer w miejscu pracy
-
3.2. Sposób zapewnienia bezpieczeństwa danych oraz ochrony danych wrażliwych podczas badań
- informacja, czy podczas realizacji projektu / działania będą przetwarzane dane wrażliwe (szczególny typ danych osobowych: dotyczące pochodzenia rasowego lub etnicznego danej osoby, ujawniające przekonania religijne lub światopoglądowe, uwidaczniające poglądy polityczne, obnażające przynależność do związków zawodowych, dane biometryczne, dane genetyczne (przede wszystkim o kodzie DNA i RNA) i te dotyczące zdrowia (stan zdrowia, przebyte choroby), dane dotyczące seksualności w tym orientacji seksualnej), dane wrażliwe politycznie lub dane podwójnego zastosowania
- informacja o polityce ochrony danych obowiązującej w instytucji (Zarządzenie Nr 27 Rektora Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie z dnia 5 kwietnia 2022 r. w sprawie ustanowienia Systemu Zarządzania Bezpieczeństwem Informacji oraz Polityki Bezpieczeństwa Informacji w SGGW w Warszawie) oraz krótkie wyjaśnienie, o czym jest dany dokument (podanie przykładów zabezpieczania danych zgodnych z tą polityką)
- informacja, kto będzie miał dostęp do danych w czasie trwania projektu i jak będzie przebiegać kontrola dostępu do danych (zwłaszcza w przypadku współpracy między kilkoma partnerami)
- informacja o sposobie odzyskania danych utraconych w wyniku incydentu, np. jedna z trzech kopii pozwoli odzyskać utracone dane bez straty ich jakości, pliki README zawierające informacje niezbędne do powtórzenia analizy pozwolą odtworzyć proces tworzenia danych
4. Wymogi prawne, kodeks postępowania
-
4.1. Sposób zapewnienia zgodności z przepisami dotyczącymi danych osobowych i bezpieczeństwa danych w przypadku przetwarzania danych osobowych
- informacja, czy w trakcie realizacji projektu / działania będzie miało miejsce przetwarzanie danych osobowych
- jeżeli będzie miało miejsce przetwarzanie danych osobowych (odpowiedź TAK na pytanie: „Czy planowane badania wiążą się z przetwarzaniem danych osobowych” w formularzu dotyczącym kwestii etycznych) – informacja o sposobach ochrony pozyskanych danych, np. posłużenie się anonimizacją lub pseudonimizacją:
– anonimizacja – zupełne wyeliminowanie informacji o charakterze osobowym – pseudonimizacja – przetworzenie danych osobowych w taki sposób, by nie można ich było już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji; równoległym warunkiem jest, by takie dodatkowe informacje były przechowywane osobno i zostały objęte środkami technicznymi i organizacyjnymi uniemożliwiającymi ich przypisanie zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej – wówczas trzeba mieć na uwadze, że księga kodów będzie musiała być przechowywana w innym miejscu, w innej lokalizacji niż same dane, tak, żeby nie było możliwości rozszyfrowania informacji, które są podane przy samych danych - informacja o oświadczeniu uczestnika badań potwierdzającym jego świadomą zgodę na udział
- powołanie się na odpowiednie regulacje: Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. (RODO) i Ustawa z dnia 10 maja 2018 r. o ochronie danych osobowych
- informacja o polityce ochrony danych osobowych w instytucji (Zarządzenie Nr 120 Rektora Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie z dnia 4 listopada 2021 r. w sprawie wprowadzenia Polityki ochrony danych osobowych w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie) oraz krótkie wyjaśnienie, o czym jest dany dokument (podanie przykładów ochrony danych osobowych zgodnych z tą polityką)
-
4.2. Sposób zarządzania innymi kwestiami prawnymi, np. prawami własności intelektualnej lub własnością. Obowiązujące przepisy
- informacja o polityce dotyczącej praw własności intelektualnej w instytucji (Uchwała nr 115 – 2018/2019 Senatu Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie z dnia 24 czerwca 2019 roku: w sprawie uchwalenia Regulaminu zarządzania prawami autorskimi, prawami pokrewnymi i własności przemysłowej oraz zasad komercjalizacji w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie) oraz krótkie wyjaśnienie, o czym jest dany dokument (podanie właściciela praw własności intelektualnej do danych w świetle tej polityki)
- informacja, czy w projekcie będą wykorzystywane jakieś dane już istniejące (własne lub będące w posiadaniu strony trzeciej) lub dane, których wytworzenie zostanie zlecone innej jednostce, i czy w związku z tym przed udostępnieniem danych (także dostępnych komercyjnie) wskazane będzie uzyskanie (jeśli to możliwe) odpowiedniego zezwolenia w zakresie praw autorskich ze względu na ewentualne ograniczenia ponownego ich wykorzystania
- informacja o licencji, którą oznaczone będą udostępniane dane (NCN zaleca licencję Creative Commons Przekazanie do Domeny Publicznej CC0)
5. Udostępnianie i długotrwałe przechowywanie danych
-
5.1. Sposób i termin udostępnienia danych. Ewentualne ograniczenia w udostępnianiu danych lub przyczyny embarga
- wskazanie planowanego terminu udostępnienia danych (najpóźniej w momencie ukazania się publikacji, bez embarga)
- wskazanie okresu przechowywania danych (co najmniej 10 lat zgodnie z wytycznymi NCN)
- informacja o licencji, którą oznaczone będą udostępniane dane (NCN zaleca licencję Creative Commons Przekazanie do Domeny Publicznej CC0)
- informacja o ograniczeniach i przeszkodach uniemożliwiających pełne lub częściowe udostępnienie danych
- informacja, czy udostępnienie danych wymaga zgody uczestników badania
- informacja, czy wydawcy czasopism będą wymagać składowania danych na poparcie ustaleń publikacji (np. w formie tabeli w treści artykułu, jako załącznik, suplement dołączony do artykułu, czy udostępniony link do danych, które znajdą się we wskazanych przez wydawnictwo repozytoriach)
-
5.2. Sposób wyboru danych przeznaczonych do przechowania oraz miejsce długotrwałego przechowywania danych (np. repozytorium lub archiwum danych)
- wskazanie procedury selekcji danych (informacja, które dane będą zachowane, a które zostaną zniszczone z przyczyn wynikających z umów, przepisów prawnych lub regulacji)
- wskazanie repozytoriów, w których zostaną umieszczone dane (repozytoria powinny umożliwiać udostępnianie danych zgodnie z zasadami FAIR; rejestr repozytoriów danych badawczych: Registry of Research Data Repositories, rejestr repozytoriów danych badawczych, które pozytywnie przeszły ocenę ich funkcjonalności i uzyskały certyfikat CoreTrustSeal)
- informacja o ewentualnych kosztach umieszczenia danych w repozytorium
-
5.3. Metody lub narzędzia programowe umożliwiające dostęp do danych i korzystanie z danych
- informacja, czy dane są zapisane w formacie otwartym lub co najmniej standardowym, czy należy je przekształcić do takich formatów, aby mogły być przechowywane przez dłuższy okres i zachowały długi okres ważności
- informacja, czy do skanowania lub konwersji niezbędny będzie dodatkowy sprzęt lub oprogramowanie
- wskazanie mechanizmu, jaki posłuży do udostępniania danych (np. repozytorium lub odpowiedzi na żądanie – z podaniem wyjaśnienia, dlaczego dane mogą być udostępnione tylko w tak ograniczonym zakresie)
-
5.4. Sposób zapewniający stosowanie unikalnego i trwałego identyfikatora (np. cyfrowego identyfikatora obiektu (DOI)) dla każdego zestawu danych
- informacja, czy zbiór danych uzyska trwale przypisany identyfikator (PID) i jeśli tak, jaki (np. cyfrowe identyfikatory dokumentu elektronicznego (np. DOI, URN, ARK, handle, Purl lub inne), numery dostępowe)?
6. Zadania związane z zarządzaniem danymi oraz zasoby
-
6.1. Osoba (np. funkcja, stanowisko i instytucja) odpowiedzialna za zarządzanie danymi (np. data steward)
- dokonanie podziału ról i obowiązków, czyli informacja, kto (stanowiskowo) odpowiada za weryfikację, korektę, kto wdraża plan; czy instytucja posiada personel odpowiedzialny za zarządzanie danymi w trakcie trwania projektu (właściciel danych – osoba, która formalnie ponosi odpowiedzialność za dane; opiekun (data steward) – osoba, która jest specjalistą ds. jakości danych i jest odpowiedzialna za ich ocenę (środki zaradcze), ale nie bezpośrednią korektę; należy podawać jedynie stanowisko w obrębie jednostki, bez nazwisk
-
6.2. Środki (np. finansowe i czasowe) przeznaczone do zarządzania danymi i zapewnienia możliwości odnalezienia, dostępu, interoperacyjności i ponownego wykorzystania danych
- informacja o zasobach, które zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR (dodatkowe zasoby do zarządzania danymi (osoby, czas, sprzęt lub oprogramowanie), koszty związane z zapewnieniem standardów FAIR w projekcie oraz sposób ich opłacenia)
Dodatkowe informacje:
Oddział Otwartych Zasobów Nauki Biblioteka Główna SGGW, pokój nr 134
dr Agnieszka Adamiec, mgr Dominika Semeniuk tel. 22 59 35 720; e-mail – otwartanauka@sggw.edu.pl
Prezentacja „Otwarty dostęp w projektach (przykład NCN)” PDF
[real3dflipbook id=”39″]