Siirry suoraan sisältöön

Synteettinen data voi auttaa yrityksiä kehittämään kuluttajien tarpeita vastaavia tuotteita sekä viemään vaativia tuotekehitysprosesseja nopeasti läpi. Synteettisen datan luomiseksi tarvitaan kuitenkin rutkasti esimerkkidataa. Wellbeing Data Lab -hankkeessa dataa kerätään esimerkiksi Finlandia Marathonille osallistuvilta koeryhmäläisiltä.

Wellbeing Data Lab -hanke on edennyt kohti viimeistä vaihetta ja aineiston keräämisen loppua. Hankkeessa kehitetään synteettistä dataa liikuntaan ja hyvinvointiin liittyvästä aineistosta, ja se toteutuu Jyväskylän yliopiston liikuntatieteellisen ja informaatioteknologian tiedekuntien tiiviinä yhteistyönä Jyväskylän kaupungin elinkeinopalveluiden kanssa. Yritysten käyttöön tarjottava synteettinen datavaranto voi luoda mahdollisuuden esimerkiksi vaativien tuotekehitysprosessien nopeaan läpivientiin sekä kuluttajien tarpeita vastaavien tuotteiden kehittämiseen. 

 

Synteettisen datan luomiseksi tarvitaan tiettyyn kontekstiin ja ilmiöön liittyvää esimerkkidataa. Wellbeing Data Lab -hankkeessa aineistoa on kerätty elokuusta 2023 saakka liikuntatieteellisen tiedekunnan toteuttamilla juoksemiseen liittyvän suorituskyvyn mittauksilla. Tutkimukseen osallistuu yhteensä 36 kestävyysjuoksua harjoitellutta koeryhmäläistä ja 35 kontrolliryhmäläistä. Osallistujilta kerätään vuoden seuranta-ajalla laaja-alaista tietoa sekä psyykkisen että fyysisen suorituskyvyn vaihtelusta suhteessa yleiseen terveydentilaan ja harjoitteluun. Koeryhmäläisiä testataan neljänä eri ajankohtana liikuntatieteellisen tiedekunnan laboratoriossa sekä lisäksi Finlandia Marathonilla Jyväskylässä syksyllä 2023 ja 2024.

 

DSC_5321-1

Kontrolliryhmään osallistuvat kutsutaan laboratoriomittauksiin vuoden aikana kaksi kertaa. Molemmat ryhmät täyttävät säännöllisesti terveydentilaan, infektioihin ja mahdollisiin vammoihin liittyviä kyselyitä sekä oirepäiväkirjoja ja lisäksi aineistoa kerätään Polar Electro Oy:n puettavaa teknologiaa hyödyntäen. Hankkeen viimeiset mittaukset toteutetaan syksyn Finlandia Marathonilla 14.9. Liikuntatieteellisen tiedekunnan aineistonkeruun käytännön toteutuksesta on vastuussa väitöskirjatutkija ja liikuntafysiologi Vesa Laatikainen-Raussi, jonka tutkimusaiheena on hengitystieinfektioiden vaikutus juoksijoiden suorituskykyyn. 

 

Liikuntatieteellisessä tiedekunnassa datan syntetisointiin kerättyä aineistoa pyritään lisäksi hyödyntämään tutkimustyössä ja opiskelijoiden opinnäytetöissä, jotta kerätty aineisto tuottaisi mahdollisimman paljon lisäarvoa alalla toimiville. Hankkeen aineistosta odotetaan valmistuvan yli 10 opinnäytetyötä, joissa opiskelijat ovat päässeet tutustumaan puettavaan teknologiaan ja sen sovelluksiin. Ensimmäiset valmistuvat opinnäytetyöt ovat juoksun taloudellisuuteen, hengitysteiden infektioihin ja maratonsuoritukseen liittyvien tulehdusvasteiden aihealueilta. 

 

Synteettisen datan generointi

 

Jotta synteettisen datan generointityökalun kehittäminen pääsi etenemään nopealla aikataululla, ensimmäinen IT-tiedekunnan vastaanottama pilottiaineisto koostui jo aiemmin Kilpa- ja huippu-urheilun tutkimuskeskuksen keräämästä kuntoilijoiden harjoitteluaineistosta. Liikuntatieteiden asiantuntija on suorittanut pilottidatalla synteettisen ja alkuperäisen datan vertailua synteettisen datan generoinnin kehittämiseksi. Vertailua on tehty sekä subjektiivisesti että tilastollisia menetelmiä hyödyntäen. Synteettisen datan validoinnissa kiinnitetään huomiota sen tilastollisiin ja laskennallisiin ominaisuuksiin. On myös tärkeää tarkastella, ettei syntetisoidun datan tietoja ole mahdollista yhdistää alkuperäisen aineiston tutkittaviin.

 

Liikuntatieteellisen tiedekunnan mittauksiin osallistuneilta tutkittavilta on tähän mennessä koottu useita esimerkkiaineistoja datan syntetisointiin IT-tiedekunnan käyttöön. Kesän 2024 aikana on myös päästy aloittamaan työstö Polarin puettavan teknologian avulla kerätystä kuluttaja-aineistosta. Näiden aineistojen avulla informaatioteknologian tiedekunnan väitöskirjatutkija Joonas Tuomikoski on päässyt työstämään synteettisen datan generointimalleja niiden kehittämiseksi. Laadukas datan prosessointi synteettisen datan opetusaineistoksi vaatii satojen tuntien työskentelyä aineiston järjestämiseksi ja käsittelemiseksi.  

 

Hankkeen puitteissa käydään myös aktiivista keskustelua synteettisen liikunta- ja hyvinvointidatan luomiseen ja jakamiseen liittyvistä mahdollisuuksista ja rajoitteista. Mahdollisiin haasteisiin pyritään selvittämään ratkaisumahdollisuuksia sekä löytämään vaihtoehtoja tulevaisuuden synteettisen datan ja datan generaattoreiden jakamiseen. Generoidut mallit ovat aina tehtäväkohtaisia, eli yksittäinen malli pystyy luomaan spesifisti ainoastaan sellaista dataa, mihin se on opetettu. Hankkeessa syntyvät pilottiluontoiset generaattorimallit ja synteettinen data on tarkoitus jakaa avoimeen käyttöön lainsäädännön asettamien rajoitusten mukaisesti. 

 

DSC_6947

IT-tiedekunnan seuraavana askeleena hankkeessa on synteettisen datan piloteissa syntyneiden tuotosten julkaiseminen avoimen lähdekoodin alustalla yritysten ja kehittäjien käyttöön.

 

- Kokoamme yhteen piloteissa testattuja vapaasti käytettävissä olevia työkaluja helpoin suomenkielisin ohjein minkä toivotaan laskevan menetelmien kokeilemisen ja käyttöönoton kynnystä, Tuomikoski kertoo.

 

Lisäksi hankkeen viimeisellä jaksolla IT-tiedekunnassa päästään käsittelemään Polarin puettavalla teknologialla kerättyä hyvinvointidataa, jota on kerätty vuoden mittaisella seurantajaksolla.  

 

Jyväskylän kaupungin elinkeinopalvelut aktiivisena linkkinä yritysmaailmaan  

Jyväskylän kaupunki on toiminut hankkeessa aktiivisena linkkinä yritysten ja loppukäyttäjien osallistamisessa ja yhteistyössä. Jyväskylän yliopistolla järjestettiin marraskuussa 2023 seminaari, jossa käsiteltiin synteettisen hyvinvointidatan mahdollisuuksia yritysten ja muiden organisaatioiden tuotekehityksessä. Seminaarin puhujina olivat muun muassa hallintoneuvos Joni Komulainen Sosiaali- ja terveysministeriöstä, joka avasi lainsäädännöllisiä näkökulmia terveys- ja hyvinvointidatan käsittelyyn sekä Terveystalon datajohtaja (”Head of Data”) Oskar Niemenoja, joka kertoi terveydenhuollon näkemyksiä dataan ja synteettiseen dataan. Seminaarin keskusteluissa nousi esiin synteettisen datan kontekstin perusteellisempi sanoittaminen yrityksille ja organisaatioille, sillä sen tuomat mahdollisuudet herättävät laajasti kiinnostusta.

 

Tulevassa synteettisen datan yrityspäivässä ja työpajassa 3.10. avataan synteettisen datan käytännön esimerkkejä yritysten näkökulmasta. Lisäksi osallistujille esitellään hankkeen konkreettisia tuloksia sekä innovoidaan yhteisissä työpajoissa. 

 

- Olemme haastatelleet keskeisiä yritys- ja julkisia toimijoita hankkeen aikana. Synteettinen data nähdään mahdollisuutena ja yritykset odottavat kiinnostuneina Wellbeing Data Lab -hankkeen konkreettisia tuloksia. Siksi onkin erityisen kiinnostavaa päästä esittelemään testialustaa ja sen mahdollisuuksia yrityksille tulevassa yrityspäivässä, kertoo ohjelmapäällikkö Nina Rautiainen Jyväskylän kaupungin elinkeinopalveluista.

 

Wellbeing Data Lab -hanke tukee Jyväskylän innovaatioekosysteemin keskeisiä tavoitteita, erityisesti tavoitetta vahvistaa digitaalisia palveluja ja dataliiketoimintaa luomalla vetovoimaisia tuotekehitysympäristöjä.  

 

Wellbeing data lab – synteettisen hyvinvointidatan hautomo -hanke on Jyväskylän yliopiston Liikuntatieteellisen tiedekunnan ja Informaatioteknologian tiedekunnan sekä Jyväskylän kaupungin yhteishanke. Hankkeen yhteistyökumppaneina toimivat Polar Electro Oy, Tampereen yliopisto sekä Coach4Pro Oy. Hankkeessa kehitetään synteettistä dataa liikuntaan ja hyvinvointiin liittyvästä tutkimusaineistosta ja sen tarkoituksena on tukea tulevaisuuden uusien innovaatioiden tuotekehitystä alan yrityksissä. Hanke on Euroopan unionin osarahoittama. 

 

Kuvat: Harri Kapustamäki / KIHU