Miten minusta tuli data-analyytikko?

0

Data ja analytiikka – yksi tämän päivän kuumista termipareista. Englanniksi myös data science eli datatieteet. Mutta mitä itse asiassa on data ja mitä sen analytiikka? Ja miten minä päädyin data-analytiikan alalle?

Latinankielinen sana data on monikkomuoto sanasta datum, joka tarkoittaa “annettua”. Analyysi on kielitoimiston sanakirjan mukaan jonkin koostumuksen tai laadun selvittämistä, erittelyä ja jäsentelyä tai sen tuloksena syntynyt eritelmä. Matematiikan alana analyysi on jonkin matemaattisen kohteen ominaisuuksien tutkimista määritellyssä viitekehyksessä. Esimerkiksi yhtälön analyyttinen ratkaisu muodostetaan sovittuja sääntöjä noudattaen. Vertailuksi: muita menetelmiä ovat esimerkiksi erilaiset todennäköisyysteorian lähestymistavat, joissa tavoite ei ole yksinkertaisen säännön muodostaminen ratkaisulle, vaan ratkaisuista todennäköisimmän valitseminen tai sen jakauman määrittäminen.

Itse olen opiskellut juurikin matemaattista analyysia Helsingin yliopistossa soveltavan matematiikan linjalla, mistä valmistuin vuonna 2012. Parin teollisuudessa vietetyn vuoden jälkeen palasin akatemiaan ja aloitin jatko-opinnot lääketieteen tekniikan alalla Tampereen teknillisessä yliopistossa. Graduni ja väitöskirjani tutkimuskohteet liittyvät tomografiseen kuvantamiseen ja sen matemaattiseen mallintamiseen, pääasiassa analyysin keinoin. Jatko-opintojeni alkuvaiheessa ymmärsin, että maisteriopintoni olivat itse asiassa sisältäneet soveltavan matematiikan teoriaa, sillä kollegani teknillisessä yliopistossa olivat minua paljon rutinoituneempia käyttämään monenlaisia laskennallisia menetelmiä. Toisaalta itselläni oli vahvemmat työkalut tulosten syy-seuraussuhteiden ymmärtämiseen.

Data-analyytikon tehtäväkenttää: Ilmiötä voi ymmärtää datan avulla tai päinvastoin. Ymmärrys syntyy analyysin kautta ja visuaaliset työkalut auttavat monitieteisessä viestinnässä, kun analyysista tehdään tulkintaa ja uusia päätöksiä. Kuvitus on Bioeconomy 4.0 -projektin maitoketjututkimuksestamme (Koskelka ym. 2020)
Data-analyytikon tehtäväkenttää: Ilmiötä voi ymmärtää datan avulla tai päinvastoin. Ymmärrys syntyy analyysin kautta ja visuaaliset työkalut auttavat monitieteisessä viestinnässä, kun analyysista tehdään tulkintaa ja uusia päätöksiä. Kuvitus on Bioeconomy 4.0 -projektin maitoketjututkimuksestamme (Koskela ym. 2020)

Ensikosketukseni datan analytiikkaan sain harrastusten kautta nuorisotoiminnan kehitystehtävissä piiritasolla. Parin ensimmäisen harjoituksen jälkeen tein suurella luottamuksella taitoihini datapohjaisen havainnon junioritoiminnan myyntitilastoista: lapset ottivat tuotteita myyntiin ja myivät niistä lähes aina 100%. Kääntäen, myyntiin otettuja tuotteita ei palautettu. Niinpä suosittelin, että lisämyyntiä tavoitellakseen pitäisi lapset (eli lasten vanhemmat) saada ottamaan enemmän tuotteita mukaansa, kun myyntiin lähdettiin. Puoli vuotta myöhemmin kuulin, että järjestelmään pääsääntöisesti kirjataan vain myydyt tuotteet, koska se on toimintaa tekeville vapaaehtoisille helpompaa. Se siitä havainnosta: tilastoissani oli rakenteellinen virhe, josta en ollut tietoinen ja jota en ollut havainnut.

Data-analyytikon tärkeimpiä työkaluja ovat silti arkijärki ja sinnikkyys.

Kokemuksestani opin paljon, vaikkei oivallukseni datasta ollutkaan erityisen menestyksekäs. Vaikka datatieteitä voidaan jossain mielessä opiskella omana kokonaisuutenaan, ei mielestäni mielekäs data-analyysi ole mahdollista ilman koko mittausasetelman tuntemista substanssista johtopäätöksen analysointiin. Data-analyytikon tehtäviin ei sinänsä välttämättä kuulu laajempi aiheosaaminen, mutta riittävä keskusteluyhteys on pystyttävä muodostamaan prosessiputken molempien päiden kanssa. Hyvä analyytikko ei toimi irrallisena työkaluna vaan kykenee arvioimaan tuottamiensa tulosten ja hypoteesien mielekkyyttä suhteessa reaalimaailmaan.

Tittelin data-analyytikko sijaan miellän itseni mieluummin laskennallisten ongelmien määrittelyn osaajaksi. Opintojeni seurauksena olen monessa mielessä mallintaja eli rakennan uutta tietoa yhdistelemällä datasta löytyviä yksityiskohtia isommiksi kokonaisuuksiksi erilaisia laskennallisia työkaluja hyödyntämällä. Datatieteilijän opintoihin kuuluvat työkalut, kuten tiedonlouhinta, koneoppimisen strategiat ja tekoälyn soveltaminen, ovat myös tehokkaita menetelmiä, ja niillä tulen urallani täydentämään omaa työkalupakkiani. Silti, tärkein työkalu data-analyytikolle – mittauspisteiden kokoelman laadun ja rakenteen selvittäjälle –  on mielestäni arkijärki ja sinnikäs pyrkimys tuottaa merkityksellistä tulkintaa haastavista kokonaisuuksista.

 

Olli Koskela

Olli Koskela työskentelee HAMK Smart -tutkimusyksikössä data-analyytikkona. Lisäksi hän viimeistelee väitöskirjaansa lääketieteellisen tekniikan alalta Tampereen yliopistossa ja tutkii mm. ”donitsitomografiaa” eli viipalekuvausta toruksen pinnalla.

Olli on HAMKissa mukana seuraavissa projekteissa:

  • Mustialan maidontuotannon ja lehmien hyvinvoinnin analysointi suhteessa olosuhteisiin navetassa
  • Drone- ja satelliittikuva-analyysia metsistä ja pellosta
  • Biojalostamon alueellisten vaikutusten analysointi simuloinnin avulla
  • Kotisirkkojen kehityksen seuraaminen kuvantunnistusmenetelmin
  • Heinäauman 3D-lämpötilajakauman monitorointi reaaliajassa
  • Liikenne 4.0 ja Terveellinen digitalo -hankkeet

Ollin motto on ”matikkaa, musaa ja muskeleita”.

Lue lisää Navetta 4.0 -projektista:

Koskela, O., Virtanen, K., Kukkamäki, J., Aronen, I., & Kunttu, I. (2020). Navetta 4.0—navetan olosuhteiden jatkuva mittaaminen. Suomen Maataloustieteellisen Seuran Tiedote, (38), 1-7. DOI: https://doi.org/10.33354/smst.89300

Katso myös alueellisen biojalostamomallin esittelyvideo tästä!

Leave A Reply