Synteettinen data on ratkaisu entistä personoidumpien hyvinvointi- ja terveyspalvelujen kehittämiselle. Julkisella sektorilla synteettinen data voi auttaa kehittämään kokonaisvaltaisempaa asiakasohjausta ja toimii palvelumuotoilun työkaluna. Tekoälyn tuottama data mahdollistaisi myös tuote- ja palveluinnovaatioiden aiempaa ketterämmät testaukset. Tähän tarvitaan monialaista yhteistyötä yritysten ja tutkimuslaitosten välillä.
Synteettinen data näyttää oikealta tiedolta ja käyttäytyy kuin oikea tieto, mutta ei paljasta yksittäisten henkilöiden tietoja.
Synteettinen data voidaan luoda oikean data-aineiston pohjalta erilaisilla matemaattisilla mallinnuksilla tai koneoppimismenetelmillä, joten se jäljittelee aitoa aineistoa. Synteettistä dataa voidaan käyttää yksittäisten henkilöiden tietojen suojaamiseen käyttämällä sitä "sijaisdatana" tai toisaalta augmentointiin eli lisäämällä datapisteitä aliedustettuihin ryhmiin. Tämän vuoksi tekoälyn tuottaman datan hyödyntäminen avaa ovia uudelle liiketoiminnalle.
Kuvassa vasemmalta: Taija Lappeteläinen, Joonas Tuomikoski, Timo Kuisma, Rami Luisto, Toni Ruohonen ja Kaisu Martinmäki
Wellbeing DataLab -hankkeen 3. lokakuuta järjestetty yritys- ja työpajapäivä osoitti, että tekoälyn keinotekoisesti tuottama data herättää mielenkiintoa digitaalisia palveluja tuottavissa ja dataliiketoimintakentän yrityksissä, jotka toimivat muun muassa liikunta- ja hyvinvointialan asiakkaiden parissa. Synteettistä dataa tarvitaan ratkomaan niitä ongelmia, joita liittyy aidon datan keräämiseen, jakamiseen ja yhdistämiseen.
Yrityspäivän paneelikeskustelussa lähdettiin liikkeelle aitoon dataan liittyvistä ajankohtaisista haasteista.
– Polarin sykemittarit ja sensorit keräävät valtavia määriä asiakasdataa. Tietosuojaan liittyvät lait ja säädökset ovat hyviä ja tuovat kansalaisille turvaa, ja ne näkyvät konkreettisesti toiminnassamme. Osa asiakkaista ei halua, että heidän tietojaan käytetään tuotekehitykseen, kertoi Polar Electron vanhempi tutkija Kaisu Martinmäki.
– Lisäksi säädösten mukaan käyttäjän täytyy saada kaikki datansa koneellisesti luettavassa muodossa. Meille se on ollut merkittävä lisätyö, koska tietoa kertyy vuosien ajan ja välillä jopa sekunnin välein.
Keski-Suomen hyvinvointialueen TKKI (tuotekehitys- ja innovaatiotoiminnan) -päällikkö Toni Ruohosen mukaan sote-alalla tarvittaisiin nopeasti käyttöön saatavaa, näyttöön pohjautuvaa tutkimusta ja kehittämistä liittyen muun muassa kokonaisvaltaisempaan asiakasketjujen hallintaan.
– Erilaisiin lupaprosesseihin ja datan keräämiseen menee helposti vuosikin ennen kuin dataa pääsee hyödyntämään.
Digital Workforce Services Oy:n terveysteknologiaan liittyvästä tekoälystä vastaava Rami Luisto puolestaan lisäsi, että datan yhdistely ei ole pelkästään teknisesti vaikeaa vaan ongelma kertautuu.
– Osadata saattaa tulla kolmesta eri järjestelmästä, joilla jokaisella on vähän eri ylläpitäjät ja säädökset.
Lopullisen datan kokoaminen vaatii aikaa vievää selvitystyötä ja työn alussa saatu idea voi olla viisi vuotta myöhässä ennen kuin data on kasassa ja sitä on päästy käsittelemään.
Espoolainen Coach4Pro Oy tekee etäohjausalustaa, jota asiakkaat käyttävät työhyvinvointipalveluihin, elintapaohjaukseen ja liikuntavalmennukseen. Julkisen sektorin asiakkuuksista vastaava Timo Kuisma kertoi, että heillä palveluntarjoajat käyttävät dataa asiakkaiden palveluiden välittömään parantamiseen. Operatiivisen datan otos ei ole välttämättä tilastollisesti edustava, mutta sen ei tarvitsekaan olla.
– Asioita korjataan välittömästi, kun ne havaitaan. Kehittämisen kohteita ovat mielestäni asiakastyytyväisyyden aito mittaaminen ja palvelujen räätälöinti asiakaspalautteen perusteella.
Kotimaiselle datan generoinnille ja validoinnille tilaus
Yrityspäivän paneelikeskustelussa korostettiin synteettisen datan nopeuttavan liiketoiminnan ja tutkimuksen prosesseja tai tuotekehitystä. Liiketoiminnan kasvattaminen ja uuden liiketoiminnan synnyttäminen vaativat yrityksiltä ja tutkimuslaitoksilta yhteistyötä.
Kaisu Martinmäen mukaan synteettisellä datalla voisi testata erilaisten dataputkien toimivuutta eli miten lähdedataa luetaan, muokataan ja analysoidaan sekä kuinka siitä jalostetaan datatuotteita.
Rami Luisto mainitsi, ettei synteettisen datan tarvitsisi olla aluksi täysin oikeanlaista vaan pilotointivaiheessa voisi riittää, että data olisi ”hieman sinne päin”.
–Pidetään mielessä, että datassa on vähän kohinaa, mutta päästäisiin kuitenkin nopeasti testaamaan asioita.
Toni Ruohonen totesi, että Keski-Suomen hyvinvointialueella halutaan viedä toimintakulttuuria siihen suuntaan, että saadaan nopeammin kokeiluja ja päästään asioissa eteenpäin.
–Hyvinvointialueella ei ole isoja resursseja tutkimustyöhön, siksi tarvitsemme yhteistyötä eri yritysten ja toimijoiden kanssa.
Hän peräänkuulutti, että Suomessa tarvitaan nimenomaan kotimaisia toimijoita tekemään datan generointia ja validointia turvallisessa ympäristössä.
Myös Luisto toivoi lisää suomalaisen NLP:n eli tietokonepohjaisen kielitekoälyn tekijöitä.
Akvaariokeskustelussa sparrattiin yrityksiä mahdollisuuksista synteettisen datan käytössä.
Matalalla kynnyksellä pilottien kimppuun
Wellbeing DataLab -hankkeen tavoitteena on tukea Jyväskylän ekosysteemin kehittymistä luomalla vetovoimaisia tuotekehitysympäristöjä. Yrityspäivässä esiteltiin Jyväskylän yliopiston liikuntatieteellisen tiedekunnan ja informaatiotiedekunnan datahautomoa, jossa on luotu uudenlainen liikunta- ja hyvinvointidatan prosessoinnin kokeiluympäristö.
Synteettisen datan luomiseksi hankkeessa on kerätty monipuolista esimerkkidataa kestävyysjuoksua harjoitelleilta ja kontrolliryhmäläisiltä vuoden seuranta-ajalla. Tutkittavien harjoittelua seurattiin muun muassa Polarin puettavalla teknologialla. Liikunta- ja hyvinvointiaineistoa on kerätty laboratorio-olosuhteissa liikuntatieteellisessä tiedekunnassa sekä tutkittavien päivittäisessä elämässä.
Joonas Tuomikoski, Maria Sukanen ja Vesa Laatikainen-Raussi Jyväskylän yliopistolta esittelevät hankkeen etenemistä
Lisäksi synteettisen datan generointityökalun kehittämisessä on käytetty Kilpa- ja huippu-urheilun tutkimuskeskuksen aiemmin keräämää pilottiaineistoa.
Wellbeing DataLab -hankkeen tavoitteena on, että synteettisen datan työkalu pääsisi alan yritysten hyötykäyttöön. Hankkeen kautta pyritään myös aktivoimaan synteettisen datan hyödyntämiseen liittyvää keskustelua ja tuomaan yhteen elinkeinotoiminnan ja tutkimuskentän toimijoita tulevaisuuden yhteistyön synnyttämiseksi.
Projektiasiantuntija Taija Lappeteläinen rohkaisi yrityspäivän osallistujia olemaan matalalla kynnyksellä yhteydessä hankkeen asiantuntijoihin tai suoraan yliopistoon, jos pilotin tai testauksen tekeminen datahautomon testialustalla kiinnostaa.
Synteettisen datan yrityspäivässä 3.10. puhuivat Kaisu Martinmäen, Rami Luiston, Timo Kuisman ja Toni Ruohosen lisäksi väitöskirjatutkija Joonas Tuomikoski, projektipäällikkö Maria Sukanen ja liikunta-alan asiantuntija Vesa Laatikainen-Raussi sekä Neuwon toimitusjohtaja Johannes Harju, joka kertoi, miten Nuorten urheilijoiden mielen hyvinvoinnin ja suorituskyvyn alusta Onion Sport on hyödyntänyt Neuwon teknologiaa.
Wellbeing data lab – synteettisen hyvinvointidatan hautomo -hanke on Jyväskylän yliopiston Liikuntatieteellisen tiedekunnan ja Informaatioteknologian tiedekunnan sekä Jyväskylän kaupungin yhteishanke. Hankkeen yhteistyökumppaneina toimivat Polar Electro Oy, Tampereen yliopisto sekä Coach4Pro Oy. Hankkeessa kehitetään synteettistä dataa liikuntaan ja hyvinvointiin liittyvästä tutkimusaineistosta ja sen tarkoituksena on tukea tulevaisuuden uusien innovaatioiden tuotekehitystä alan yrityksissä. Hanke on Euroopan unionin osarahoittama.