Koneoppiminen selitettynä
Vaikka moni on kuullut puhuttavan koneoppimisesta, ei välttämättä ole selvää, mitä on koneoppiminen käytännössä.
Koneoppimisen määritelmä
Koneoppimisen määritelmä lyhyessä muodossaan voisi olla “koneiden kyky imitoida ihmisen älykästä käyttäytymistä”. Tekoälyyn pohjautuvia järjestelmiä käytetään suorittamaan monimutkaisia tehtäviä pitkälti samaan tapaan kuin miten ihmiset ratkaisevat ongelmia.
Koneoppiminen on läsnä arjessamme yhä useammalla eri tavalla. Yhtenä hyvänä esimerkkinä voidaan nostaa esille kohdistettu mainonta, jossa koneoppimista hyödynnetään laajalti. Ei ole lainkaan sattumaa, että esimerkiksi lapsiperheen vanhemmille näytetään verkossa jatkuvasti mainoksia lastenvaatteista ja perhelomista. Kaikesta tekemisestämme verkossa kerätään jatkuvasti tietoa muun muassa IP-osoitteen perusteella. Koneoppimisen avulla voidaan analysoida häkellyttävän tarkasti ihmisten kulutustottumuksia ja käyttäytymistä ja kohdistaa heihin sellaisia mainoksia, joita he klikkaavat muita todennäköisemmin.
Miten koneoppiminen toimii?
Koneoppimisessa tietokoneita opetetaan läpikäymään ja tulkitsemaan itsenäisesti keräämäänsä dataa. Toisin kuin usein luullaan, kyse ei ole suoranaisesti ohjelmoinnista, vaan algoritmeja ohjataan etsimään malleja ja vastaavuuksia laajasta tietomäärästä. Koneoppimisessa hyödynnetään erilaisia algoritmeja historiallisen data tulkitsemiseen, jonka pohjalta voidaan rakentaa matemaattisia malleja ja ennusteita. Yksinkertaisesti ilmaistuna koneella on kyky oppia, jos se voi parantaa suorituskykyään keräämällä lisää tietoa päätöksentekoa ja ennusteiden laatimista varten.
Eri koneoppimisen tyyppejä
Koneoppiminen pitää sisällään erilaisia algoritmisia tekniikoita hyödyntäviä koneoppimisen tyyppejä. Kaikkiaan koneoppimismalleja on neljä erilaista: valvottu, valvomaton, puolivalvottu ja vahvistus. Näistä voidaan valita käyttöön sopivin tavoiteltavasta lopputuloksesta sekä analysoitavien tietojen luonteen mukaan.
Valvottu oppiminen
Valvottu tai ohjattu oppiminen on eniten rinnastettavissa tapaan, jolla me ihmiset opimme asioita. Tässä oppimismallissa tekoälyjärjestelmää koulutetaan määrätyillä säännöillä ja datakokonaisuuksilla, ja algoritmeille opetetaan esimerkin avulla, mitä tietoja niiden tulee etsiä. Valvotut oppimismallit sisältävät syöttötiedoista ja tulostiedoista muodostuvia pareja, joista jälkimmäiseen merkitään haluttu arvo.
Jos tarkoituksena on esimerkiksi opettaa kone erottamaan kantarelli ja suppilovahvero toisistaan, sisällytetään tietopariin kuvat molemmista sienistä. Koneoppimisen ansiosta tietokoneen algoritmi tunnistaa kahdesta vaihtoehdosta kantarellin, joka on ennalta määritelty oikeaksi tulokseksi. Ajan myötä järjestelmä pystyy hyödyntämään kaikkea keräämäänsä harjoitustietoa ja kykenee ennen pitkää ennakoimaan itse vastaukset sille esitettyihin kysymyksiin sienien tunnistamista koskien.
Valvomaton oppiminen
Kuten nimestä voi jo jotain päätellä, annetaan valvomattomassa oppimismallissa tekoälyjärjestelmälle vapaat kädet itsenäiseen oppimiseen. Tässä mallissa havainnointi on tärkeässä roolissa, jonka vuoksi se muistuttaakin monelta osin ihmisten tapaa havainnoida ympäröivää maailmaa.
Valvomattomassa oppimisessa vastausavaimia ei ole olemassa. Sen sijaan kone tutkii relevantteja syöttötietoja ja alkaa niiden pohjalta vähitellen tunnistamaan kuvioita ja korrelaatioita. Mitä enemmän esimerkkejä algoritmit saavat, sitä tarkemmaksi kehittyy sen kyky luokitella ja tunnistaa asioita.
Puolivalvottu oppiminen
Puolivalvottu oppiminen on eräänlainen hybridimuoto, joka pitää sisällään elementtejä sekä valvotusta että valvomattomasta oppimisesta. Puolivalvottu oppimismalli on hyvä vaihtoehto silloin, kun käytettävissä on valtava määrä jäsentämätöntä ja merkitsemätöntä dataa. Tässä mallissa pieniä merkittyjä tietoja syötetään merkitsemättömään datajoukkoon, jonka myötä kone pystyy joiltain osin soveltamaan niitä tunnistamattomiin tietoihin.
Puolivalvottu oppiminen on erinomainen keino parantaa oppimisnopeutta ja -tarkkuutta. Kyseessä ei kuitenkaan ole täysin riskitön oppimismalli, ja puolivalvottua oppimista hyödynnettäessä onkin tärkeää varmistaa, että käytössä ovat parhaat mahdolliset protokollat.
Vahvistava oppiminen
Vahvistavassa oppimismallissa oppiminen tapahtuu vuorovaikutteisessa järjestelmässä kokemuksen ja erheen kautta. Toisin kuin valvottu oppiminen, jossa hyödynnetään vastausavainta, vahvistavassa oppimismallissa määritellään sallitut säännöt ja mahdolliset lopputulokset. Järjestelmää opetetaan kokemusten kautta ja se saa palautetta toiminnastaan palkintojen ja rangaistusten kautta. Tilanne muistuttaa joiltain osin peliä, jossa noudatetaan määrättyjä sääntöjä, mutta jossa järjestelmän tulee itse löytää peliin ratkaisu.
Koneoppiminen vs. syväoppiminen vs. tekoäly
On hyvin yleistä, että koneoppiminen sekoitetaan muihin samankaltaisiin käsitteisiin. Harvalle on täysin selvää, mitä eroa on esimerkiksi tekoälyllä, koneoppimisella ja syväoppimisella.
Tekoälyn, koneoppimisen ja syväoppimisen välisen eron ymmärtää parhaiten kuvittelemalla kolme eri kerrosta, johon nämä käsitteet sijoittuvat. Ulommaiseen kerrokseen sijoitetaan tekoäly, sen alle koneoppiminen ja sisimpään kerrokseen syväoppiminen.
Lyhyesti kiteytettynä tekoäly on yleistermi teknologialle, joka pyrkii mukailemaan ihmismäistä ajattelua ja käyttäytymistä. Koneoppiminen puolestaan on yksi tekoälyn lukuisista alahaaroista, jossa keskitytään opettamaan konetta tulkitsemaan toistuvia kuvioita sekä ratkaisemaan pulmia. Syväoppiminen taas lasketaan koneoppimisen alahaaraksi, jossa käytetään vieläkin edistyksellisempiä keinoja tietojen analysointiin. Syväoppiminen on nimensä mukaisesti syvällisempää koneoppimista, joka käsittää lukuisia tietoverkon kerroksia ja huiman määrän hajanaista ja monimutkaista tietoa.
Koneoppimiseen liittyvät eettiset haasteet
Koneoppiminen voidaan valjastaa lukemattomiin hyödyllisiin käyttötarkoituksiin. Siihen liittyy kuitenkin myös tiettyjä eettisiä ongelmia, joita tarkastellaan seuraavaksi.
Läpinäkyvyyden puute
Koska koneoppiminen ja tekoäly ylipäätään ovat vasta hiljattain yleistyneet eri käyttötarkoituksissa, niihin liittyvä lainsäädäntö ei ole vielä täysin kohdillaan. Kyberturvallisuus herättää nykyään runsaasti keskustelua. Vaikka tekoälyn hyödyntämistä koskevia lakeja kehitetään jatkuvasti, löytyy kansainvälisestä lainsäädännöstä vielä porsaanreikiä, joiden myötä ihmisten henkilökohtaiset tiedot aina verkkopankin käyttöä myöten ovat alttiina väärinkäytöksille.
Valvonta
Koneoppimisen mukanaan tuomat hyödyt ovat kiistattomia. Kolikolla on kuitenkin myös kääntöpuolensa, sillä koneoppimisen laajaan käyttöönottoon liittyy myös haasteita. Yksi suurimmista eettisistä ongelmista on koneoppimisen valjastaminen kiistanalaisiin tarkoituksiin, kuten valvontaan.
Yhä useammassa maailman kaupungissa hyödynnetään kasvojentunnistusteknologiaa julkisten tilojen valvonnassa sekä rikollisten tunnistamisessa. Vaikka tarkoitus on sinänsä hyvä, kyseenalaistavat monet koneoppimisteknologian luotettavuuden sekä sen, missä määrin ihmisten vakoilu on eettisesti hyväksyttävää toimintaa.