Koneoppimisen rajat ja mahdollisuudet

Uskomattoman lyhyessä ajassa tekoäly ja koneoppiminen ovat löytäneet tiensä ihmisten arkeen. Taskuissamme kantamamme taikalaatikot navigoivat meidät perille, soittavat musiikkia käskystä ja tunnistavat kasvomme. Ne myös vakoilevat, kauppaavat ja manipuloivat meitä ennennäkemättömällä tehokkuudella. Ei ole liioiteltua väittää, että koneoppimisen perusteiden ymmärtäminen on seuraavan vuosikymmenen kansalaistaito.

Koneoppiminen on tekoälyn sovellus, jonka avulla järjestelmät voivat oppia ja kehittyä kokemuksistaan ilman, että niitä erikseen ohjelmoidaan haluttuun tehtävään. Samoin kuin koira oppii temppuja toistojen ja palautteen avulla, voi kone johtaa tarvitsemansa säännöt suoraan aiempia esimerkkejä matkimalla. Käytännössä koneelle annetaan data eli joukko syöte-vaste-pareja (input-output), jotka vastaavat tilanteessa vallitsevia olosuhteita ja niissä toivottua päätöstä. Kone pyrkii oppimaan minkälaisissa syötteissä toivotaan minkäkinlaista vastetta ja parantaa toimintaansa saamansa palautteen avulla. Kyse on siis hyvin yleisestä lähestymistavasta, joka on sovellettavissa laajasti erilaisiin tehtäviin. Syöte voi esimerkiksi olla kännykkäkameralla otettu kuva liikennemerkistä ja vaste liikennemerkin nimi.

Syöte-vaste-pareista oppimista kutsutaan ohjatuksi tai valvotuksi oppimiseksi (supervised learning), millä pyritään erottamaan se muita lähestymistapoja hyödyntävistä menetelmistä. Tämän kirjoituksen puitteissa käytämme kuitenkin lyhyesti koneoppimis-termiä kuvaamaan nimenomaan ohjattua oppimista.

Suotuisia ongelmia

Mihin koneoppiminen sitten nykyään pystyy ja mihin sen uskotaan pystyvän tulevaisuudessa? Juuri tätä kysymystä professorit Erik Brynjolfsson ja Tom Mitchell käsittelevät Science-lehdessä 2017 julkaistussa artikkelissaan. He esittävät kahdeksan kriteeriä, joiden täyttyessä tehtävä on suotuisa koneoppimiselle:

  1. Tavoitteena on yhdistää selkeästi määritellyt syötteet selkeästi määriteltyyn vasteeseen. Tämä tarkoittaa yksinkertaisesti sitä, että koneelle annettu data ja siltä toivottu vastaus ovat määrämuotoisia. Malliesimerkki: annetaan koneelle potilaalta mitattu 20 sekunnin mittainen värähtelysignaali ja kone kertoo kuinka monta sydämenlyöntiä aikajaksoon mahtui. Huono esimerkki: annetaan koneelle vaihtelevasti erimittaisia tietoja ja toivotaan koneelta arviota potilaan yleisestä terveydentilasta.
  2. Syöte-vaste-pareista on olemassa tai kerättävissä paljon esimerkkejä. Koneoppiminen perustuu suureen määrään dataa, jota pitää olla sekä syötteistä että niihin liittyvistä vasteista.
  3. Tehtävässä onnistuminen kriteerit ovat selvät. Tekoälyä on vaikea hyödyntää tilanteissa, joissa tuloksia ei voida asettaa paremmuusjärjestykseen. Oppimista varten koneen tulee saada selkeää palaute sen suoritustasosta. Usein palaute on suoraan järjestelmän luokittelu- tai ennustetarkkuus, mutta se voi olla myös esimerkiksi resurssien säästö tuotantoprosessissa taikka lyhin reitti karttapalvelussa.
  4. Tehtävä ei vaadi pitkää päättelyketjua, taustatietoja tai ns. tervettä järkeä. Kone on hyvä oppimaan esimerkkien kautta, mutta se ei tiedä ulkomaailmasta muuta kuin mitä se syötteiden kautta näkee. Me ihmiset emme synny tyhjinä tauluina vaan perimme miljoonien vuosien evoluution tuloksena valtavan määrän alitajuisia prosesseja, joita voidaan kutsua vaikka vaistoiksi, peukalosäännöiksi tai maalaisjärjeksi. Lisäksi hahmotamme jo pienessä iässä ilmeitä, lukumääriä, kokoa, aikaa, paikkaa jne. Toistaiseksi tämäntapaisia taitoja ei tule valmiin koneoppimismenetelmän mukana vaan uusi tehtävä opitaan puhtaalta pöydältä.
  5. Tehtävä ei edellytä ratkaisun selittämistä. Koneoppimismallin toimintaa on usein hankala ymmärtää. Puhutaan mustasta laatikosta, johon syötteet kaadetaan sisään ja ulos pomppaa mallin vaste. Monissa ongelmissa tämä riittää eikä meitä kiinnosta esimerkiksi mitä pikseleiden monimutkaista yhdistelmää kone tällä kertaa käytti lukiessaan valokuvassa esiintyvän tekstin. Tilanne on eri, jos kyseessä on luottokorttipetoksen tunnistus taikka leukemiapotilaan lääkityksen muuttaminen. Juristi ja lääkäri tarvitsevat perustelut päätökselleen.
  6. Ratkaisussa sallitaan virhettä. Koneoppiminen perustuu tilastollisiin havaintoihin ja todennäköisyyksien käsittelyyn. Täydellinen tarkkuus on tästä syystä harvoin saavutettavissa joitain selkeimpiä tapauksia lukuun ottamatta. Koneoppimisen kannattaa soveltaa vain ihmisen tukena, jos tehtävässä epäonnistumisesta aiheutuu suuria taloudellisia, juridisia tai turvallisuutta uhkaavia riskejä.
  7. Tehtävä ei saa muuttua liian nopeasti. Kone oppii juuri sen mitä, siltä pyydetään eikä se pysty mukautumaan uusiin tehtäviin ilman uusia esimerkkejä. Monet ongelmat ovat kuitenkin luonteeltaan dynaamisia, jolloin opittua mallia joudutaan päivittämään jatkuvasti uudella datalla.
  8. Ei vaadi fyysistä näppäryyttä, liikkuvuutta tai mukautuvuutta. Tekoälyn ohjaamat robotit eivät vielä osaa vaikuttaa ympäröivään maailmaansa kovin tehokkaasti. Robotit voidaan ohjelmoida tekemään toistuvia askareita tekoälyä hyödyntäen, mutta niitä on vaikea siirtää uudelle työpisteelle tai opettaa käyttämään uusia työkaluja ilman mittavaa harjoitusta.

Mitä nämä ehdot käytännössä tarkoittavat ja mitä ne kertovat tulevaisuuden uhista ja mahdollisuuksista? Ensinnäkin on tärkeää huomata, että koneoppimiselle sopivan tehtävän ehdot poikkeavat ihmiselle helpon tehtävän ehdoista. Kone on siis luontaisesti parempi tietyissä ongelmissa kuin me, mutta myös me olemme (ainakin toistaiseksi) monessa konetta parempia. Tämä tarkoittaa myös sitä, että ihmisten kokema vaikeustaso ei välttämättä kerro koneen kohtaamasta vaikeudesta. Shakin peluu on tästä täydellinen esimerkki.

On vaikeaa olla todella hyvä shakissa. Se vaatii vuosien harjoittelua ja lahjakkuutta, ja lisäksi itse pelisuoritus on sekä henkisesti että fyysisesti raskas. Shakki kuitenkin täyttää kaikki koneoppimiselle suotuisan ongelman kriteerit: 1) Pelissä on selkeät säännöt, aina sama lähtötilanne, rajattu pelilauta ja tietyt sallitut liikkeet. 2) Pelejä on arkistoitu valtavia määriä ja niitä simuloida loputtomasti lisää. 3) Voittaminen, tasapeli ja häviö ovat selkeästi määritellyt. 4) Kaikki mitä pelitilanteesta tarvitsee tietää, ilmenee nappuloiden sijainneista laudalla. 5) Siirtoja ei tarvitse selittää pelin voittamista varten. 6) Hävitä saa välillä kunhan voittaa suurimman osan ajasta. Lisäksi myös epätäydellisellä pelillä voi olla maailman paras. 7) Shakin säännöt eivät muutu. 8) Peli on täysin abstrakti.

Sokeita pisteitä

Kriteerien valossa ei siis ole ihme, että koneoppiminen on ollut niin menestyksekäs shakissa (ja muissa peleissä) ja jatkaa voittokulkuaan alati uusia ennätyksiä rikkoen. Kriteerejä ymmärtämätön kuitenkin tulkitsee asian väärin: “jos kone on noin hyvä jossain, mikä on minulle niin vaikeaa, on se varmasti hyvä kaikessa muussakin, joka on minulle niin vaikeaa”. Asia ei kuitenkaan ole näin. Erityisesti kohdat 4, 7 ja 8 ovat usein ne kynnykset, joissa koneoppiminen kompuroi, mutta joita ihminen ei edes huomaa.

Päätöksen edessä hyödynnämme (ideaalitilanteessa) kaikkea sitä synnynnäistä ja opittua tietoa, jota meille on kertynyt ympäröivästä maailmasta. Miten kone käsittäisi esimerkiksi uutisotsikon: “Huawein syvenevät vaikeudet satavat Nokian laariin”. Me ymmärrämme välittömästi, että kyseessä on talousuutinen, jossa kuvataan kahden kilpailevan yrityksen voimasuhteita. Käytimme hyväksemme paitsi kielitaitoamme myös käsitevarastoamme ja yhdistimme sitä kautta lauseen talouselämään. Seuraavaksi siirrymme sulavasti lukemaan juttua Kaisa Mäkäräisen kisamenestyksestä ja uuden ruokavillityksen vaaroista. Koneoppimista hyödynnetään toki monenlaiseen tekstin käsittelyyn, mutta mitä monimuotoisempaa tulkittava sisältö on ja mitä pidempiä päättelyketjuja sen ymmärtäminen vaatii, sitä hankalammaksi ongelma käy koneelle.

Renki vai isäntä?

Koneoppimisen rajoitteiden ymmärtäminen auttaa meitä paremmin ennakoimaan myös mitä työelämän muutoksia tulevaisuus tuo tullessaan. Vuoden 2018 jatkotutkimuksessaan Brynjolfsson, Mitchell ja Rock käsittelevät erityisesti koneoppimisen potentiaalia korvata ihmistyötä. Tutkimuksen päälöydökset voivat olla monelle yllättäviä, ainakin jos niitä vertaa keskustelua hallitsevaan yleiseen pessimismiin, mutta ne ovat luonnollinen seuraus siitä, mistä juuri luimme.

Koneoppimisella voidaan korvata vain harvoja työpaikkoja kokonaan. Ennemmin pitäisi puhua yksittäisten työtehtävien automatisoinnista. Meillä monella on siis edessämme töiden uudelleenjärjestely ja uusi digitaalinen työkaveri, mutta ei välttämättä kilometritehdas. Toki muutoksen voimakkuus riippuu työtehtävistä. Eniten uhattuina ovat tutkimuksen mukaan erilaisina välikäsinä toimivat henkilöt kuten luottokelpoisuuden tarkistajat, osakkeiden välittäjät ja vastaanottovirkailijat. Vähiten vaikutusta on hierojille, arkeologeille, eläintieteilijöille, muurareille ja kuuluttajille.

Mielenkiintoista on myös se, että työpaikan palkkataso ei näytä olevan yhteydessä sen korvattavuuteen koneoppimisella. Aiemmista teollisista vallankumouksista poiketen muutos ei ravisutakaan epäsuhtaisesti ns. työväenluokkaa vaan kohdistuu tasapuolisesti kaikkiin palkkapyramidin kerroksiin. Huoli yhteiskunnan jakautumisesta lähitulevaisuudessa robotit omistavaan yläluokkaan ja laajaan työttömien alaluokkaan on siis tuskin vielä perusteltua.

Tulevaisuuden ennustaminen muuttuu päivä päivältä haastavammaksi alati kiihtyvän kehityksen maailmassa. Ymmärrys koneoppimisen rajoitteista ja mahdollisuuksista auttaa meitä kuitenkin ennakoimaan kaikkein uskottavimmat kehityskulut ja välttämään äärimmäiset pelot ja toiveet. Koneoppimisen rajat eivät ole kiveen hakatut, mutta niiden murtaminen vaatii kokonaan uudenlaista lähestymistapaa kenties ns. yleistä tekoälyä (Artificial general intelligence). Tutkimus sellaisen kehittämiseksi on käynnissä, mutta projektin onnistumisesta saati sen aikataulusta ei kukaan osaa sanoa mitään kovin järkevää. Toistaiseksi joudumme elämään ihan tavallisen tekoälyn maailmassa.

Ilmari Ahonen
My interest is in all things related to data analysis, machine learning and mathematics. I hold a PhD in statistics.

Liity keskusteluun