For Citizens
In Finnish/ Suomeksi:
FinRegisty-projekti (FinRekisterit-projekti) hyödyntää suomalaista rekisteri dataa koneoppimismallien rakentamiseen, jotka auttavat ymmärtämään ja ennustamaan sairauksia paremmin.
Syyt sairauksien kehittymisten taustalla ovat moninaisia. Tästä syystä on tärkeää ymmärtää kuinka useat riskitekijät yhdessä vaikuttavat sairausriskiin ajan kuluessa. Toisinaan sairaudet voitaisiin ennaltaehkäistä tai niiden kehittymistä hidastaa elämäntavoilla tai ennaltaehkäisevällä hoidolla, mikäli riskit tunnistettaisiin hyvissä ajoin etukäteen.
Tässä projektissa tavoitteemme on ymmärtää monimutkaisia yhteyksiä ja vuorovaikutuksia merkittävien sairauksien kehittymisten taustalla. Hyödynnämme tutkimuksessa kattavasti terveysrekistereitä käyttämällä uusia koneoppimismenetelmiä. Projektin tulokset voivat toimia lähtölaukaisijana kohdennetuille tutkimuksille, joita tarvitaan ennaltaehkäisevän ja yksilöllistetyn terveydenhoidon kehittämiseen.
Tietosuoja ja tietoturva ovat erittäin tärkeässä roolissa tässä projektissa, ja henkilötietoja käsitellään tietosuojalain mukaisesti (GDPR). Tiedottaminen niille henkilöille, joiden tietoja käytetään tutkimuksessa, on toteutettu projektin kotisivuilla osoitteessa thl.fi/finrekisterit.
Sivuilta löytyy tietoa esimerkiksi tietoturvasta, joka sisältää muun muassa seuraavat asiat:
-
Data on pseudoymisoitu, mikä tarkoittaa sitä, että se ei sisällä mitään suoria tunnisteita, jotka yksinään olisivat riittäviä henkilön tunnistamiseen. Henkilötunnukset on korvattu yksilöllisillä tutkimus ID:llä, ja nimet on poistettu datasta. Tutkijat eivät tunnista yksilöitä henkilötiedoista.
-
Henkilötiedot säilytetään ja niitä käsitellään ainoastaan turvallisella palvelimella, joka on suunniteltu arkaluonteisten tietojen käsittelyyn ja ei ole yhteydessä internetiin.
-
Vain tämän projektin hyväksytyillä tutkijoilla on pääsy dataan.
-
Lisää tietoa siitä, kuinka suojelemme henkilötietojasi löytyy thl.fi/finrekisterit ja dokumentaatioistamme (englanniksi)
In English:
The reasons behind the development of diseases are complex. Therefore, it is important to understand how multiple risk factors influence, together, the risk of diseases over time. Sometimes diseases could be prevented, or their development slowed down by lifestyle choices or preventive care if the risks are acknowledged well beforehand.
In this project, we aim to understand these complex relationships behind the development of major diseases. We do that by extensively interrogating health registries using new machine learning tools. The findings of this project can provide a starting point for targeted studies that are needed for the development of preventive and personalized health care.
Data protection and data security are high priorities in this project, and personal data are processed under the data protection legislation (GDPR). Informing of the persons whose data are used in this study, is done on the main pages of this project thl.fi/finregistry.
The main pages include information about e.g. data security, that involves, but is not limited, to the following:
-
The data are pseudonymized, meaning that it does not include any direct identifiers, which would be enough on their own for the identification of an individual. Social security numbers are replaced by pseudo IDs (unique random ID), and names are removed from the data. Researchers do not identify individuals from personal data.
-
The personal data are stored and processed only in a secure server, which is developed for sensitive data and is not connected to the internet.
-
The data are accessible only for approved researchers of this project.
-
For more information on how we protect your data, please visit thl.fi/finregistry and see our documentation.