Siirry suoraan sisältöön

Hyvinvointi- ja terveysdataa hyödyntämällä on mahdollista löytää ratkaisuja moniin yksilötason, yhteiskunnallisiin ja jopa globaaleihin terveyshaasteisiin. Datan käyttämiseen liittyy kuitenkin paljon maakohtaisia, lakiteknisiä ja eettisiä kysymyksiä, minkä takia valtaosa kerätystä terveysdatasta jää tällä hetkellä hyödyntämättä. 

Yksi ratkaisu haasteeseen on synteettinen data, jonka hyödyntäminen ja soveltaminen tuotekehityksessä kasvaa koko ajan. Jyväskylän yliopiston ja Jyväskylän kaupungin ”Synteettisen hyvinvointidatan hautomo” -hankkeessa syntetisoidaan Huippu-urheiluinstituutti KIHU:n valmista mittausdataa. Lisäksi Jyväskylän yliopiston liikuntatieteellinen tiedekunta toteuttaa lähes vuoden ajan mittauksia kuntoilijoille ja mittauksista saatu data syntetisoidaan Jyväskylän yliopiston IT-tiedekunnan työnä.

Kuin orgaanista dataa, mutta turvallista

Synteettinen data on monestakin syystä yrityksille kiinnostava. Silloin kun käsillä olevaa orgaanisen datan määrä on vähäinen, synteettisellä datalla voidaan täydentää datavarantoja. Synteettisen datan luominen on vähintäänkin nopeampaa, mutta usein myös kustannustehokkaampaa kuin aidon datan kerääminen.

Synteettisen datan käyttäminen ratkaisee ennen kaikkea yksityisyydensuojaan liittyviä ongelmia: arkaluonteisten terveystietojen toisinnus irrottaa ne todellisista yksilöistä, jolloin riski ja mahdollisuus tunnistaa henkilö datan perusteella vähenee tai jopa poistuu. Tämä mahdollistaa myös erilaiset yhteistyöhankkeet, kun dataa voidaan jakaa ja käsitellä aikaisempaa avoimemmin.
– Synteettinen hyvinvointi- ja terveysdata on keinotekoista dataa, jolla on samat ominaisuudet kuin aidolla datalla. Se näyttää samalta ja tuo samat johtopäätökset kuin aito data, mutta siihen ei liity yksilönsuojan kaltaisia ongelmia, kuvailee Jyväskylän yliopiston väitöskirjatutkija Joonas Tuomikoski

Synteettistä dataa luodaan nykyään pitkälti koneoppimismenetelmillä. 
– Myös simuloinnilla voidaan tuottaa synteettistä dataa, mutta liikunnassa ja urheilussa puhutaan usein pitkäjänteisestä datankeruusta. Simulointi on vaikeampaa johtuen ihmisten monista yksilöllisistä piirteistä, jotka vaikuttavat harjoitteluun pitkällä aikajänteellä, Tuomikoski huomauttaa.

Ääriarvot haastavat ajattelua – entä jos ne menetetään?

Yksi terveysdatan syntetisointiin ja hyödyntämiseen perehtynyt yritys on Terveystalo. Analytiikasta, BI:stä ja tiedolla johtamisesta vastaava johtaja Oskar Niemenoja sanoo, että Terveystalo haluaa olla aktiivisesti mukana kehittämässä terveydenhuoltoon uusia työkaluja ja ratkaisuja. Hän uskoo, että terveysdatan nykyistä avoimemmalla jakamisella voitaisiin saavuttaa paljon yhteiskunnallisia hyötyjä.

– Mitä enemmän pystymme huuhtomaan dataa läpi yhteiskunnan, sitä paremmin se kehittää ajatuksia ja kaikkien osapuolten innovaatiotoimintaa, hän kuvailee.

Terveystalolla on huomattu, että hyvistä puolista huolimatta yksi synteettiseen dataan liittyvä haaste on konemallinnuksen erityispiirre: ääriarvojen poistuminen.

– Yleensä mielenkiintoisimpia ovat esimerkiksi harvinaisiin sairauksiin viittaavat ääriarvot, jotka eivät käyttäydy tilastoisissa “nätisti”. Aineistoja käsitellessä joutuisimme tekemään valinnan, ja perustamaan tutkimustyön turvalliseen ja nätisti käyttäytyvään aineistoon, jolloin menettäisimme ääriarvot ja niiden hyödyt tieteellisellä tasolla. Jos näitä arvoja sisällytettäisiin, olisivat ne teoriassa tunnistettavampia, jolloin menettäisimme hyödyn syntetisoinnin tuomasta anonymisoinnista, Niemenoja kuvailee.

– Kiinnostava kysymys on, olisiko mahdollista tehdä aineisto, joka on sekä hyödyllistä, varmasti anonyymiä että sisältää hyvinkin näitä epätyypillisiä datapisteitä, jotka haastavat ajattelua ja toimivat kimmokkeena tieteellisille oivalluksille, hän pohtii.
– Haluammekin olla mukana myös tukemassa aiheen perustutkimusta.

Synthetic data 2

Ratkaisuja yksilötason ja yhteiskunnallisiin kysymyksiin

Sprint AI:n johtava tekoälyarkkitehti ja Jyväskylän yliopiston asiantuntija Jukka Perkiö näkee synteettisen datan ja digitaalisten kaksosten hyödyntämisessä isoja mahdollisuuksia niin yksilötason huippu-urheilun kehittämisessä kuin yhteiskunnallisten haasteiden ratkaisemisessa.
– Esimerkiksi yksilötasolla voimme mallintaa digitaalisen kaksosen sekä urheilijasta että tavoitetilaa edustavista referenssiurheilijoista. Kuvaamalla näiden kaksosten erot voimme tieteellisin menetelmin arvioida, mitä asioita harjoittelussa pitää muuttaa, jotta urheilijan kehitys kulkee tavoitetilan suuntaan, Perkiö kuvailee ja muistuttaa, että käytännössä kokonaisuus on toki esimerkkiä monimutkaisempi.

Yhteiskunnallisella tasolla digitaalisella kaksosella voitaisiin etsiä ratkaisuja esimerkiksi liikkumattomuusepidemiaan.
– Meillä on yhteiskunnallisesti valtava haaste siinä, miten pystymme saavuttamaan ja motivoimaan eniten avun tarpeessa olevia ryhmiä, Perkiö sanoo. 
– Mallintamalla isosta populaatiosta alapopulaatioita voidaan tutkia, miten saadaan kansanterveydellisiä muutoksia näkymään koko populaation tasolla. ideana on, että ihmisten sosiaaliset suhteet, demografinen samankaltaisuus ja aineistosta luotu digitaalinen kaksonen auttavat meitä suunnittelemaan ja kohdentamaan oikeita toimenpiteitä oikeaan kohderyhmään, hän selittää.

 

Yritys: tule mukaan Wellbeing Data Labiin!

Ohjelmapäällikkö Nina Rautiainen Jyväskylän kaupungin elinkeinopalveluista muistuttaa, että yleisesti datataloudessa piilee valtava kansainvälinen liiketoimintapotentiaali – pelkästään Euroopassa arviolta 500 miljardia euroa. 
– Meillä on edellytykset rakentaa Suomesta globaali hyvinvointiosaamisen kiintopiste, hän uskoo.

Wellbeing Data Lab
Synteettisen datan hyödyntämistä vauhdittaa Jyväskylän yliopiston ja Jyväskylän kaupungin yhteinen Wellbeing Data Lab -yhteisö. Siinä kehitetään liikunta- ja hyvinvointidatasta synteettistä dataa, jolla tuetaan alan yritysten tuotekehitystä ja tulevaisuuden menestysinnovaatioiden syntymistä. Hankkeen työskentelyssä ovat mukana jo Terveystalo, Polar, Solita ja Firstbeat.
– Meillä on pelkästään Jyväskylässä valtava arsenaali hyvinvointialan asiantuntemusta, jota voidaan yhteistyössä jalostaa suosituksiksi, päätöksenteon tueksi ja uusiksi innovaatioiksi. Yksin tässä ei kuitenkaan kukaan pärjää, vaan tarvitaan sekä yrityksiä että tutkijoita luomaan muutos yhdessä, hän kertoo.

Rautiainen kannustaa yrityksiä lähtemään rohkeasti mukaan, jos vain kiinnostusta synteettisen datan hyödyntämiseen löytyy.
– Mukaan voivat tulla kaikki yritykset, joilla on itsellään käytössä orgaanista dataa, ja motivaatio lähteä mallintamaan siitä synteettistä dataa.

Kiinnostuitko? Ota yhteyttä projektiasiantuntija Taija Lappeteläiseen: taija.lappetelainen@jyvaskyla.fi

Seminaaritallenteen saat pyytämällä sen Taijalta.

Joonas Tuomikoski, Oskar Niemenoja, Jukka Perkiö ja Nina Rautiainen puhuivat 3.11.2023 järjestetyssä ”Synteettisen hyvinvointidatan mahdollisuudet yritysten ja muiden organisaatioiden tuotekehityksessä” -seminaarissa.

Wellbeing Data Lab – synteettisen hyvinvointidatan hautomo -hanke on Jyväskylän yliopiston (Liikuntatieteellinen tiedekunta ja Informaatioteknologian tiedekunta) ja Jyväskylän kaupungin yhteishanke, jossa kehitetään liikuntaan ja hyvinvointiin liittyvästä datasta synteettistä dataa tukemaan tulevaisuuden uusien innovaatioiden tuotekehitystä monipuolisesti alan yrityksissä. Hanke on Euroopan Unionin osarahoittama.