Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin? Osa 2.

Julkaisemme viikottain uuden osan sarjasta Suomi elää älystä -blogissa.

Osa 1:

  • Tekoäly, data ja koneoppiminen
  • Kehittäjät, tutkijat ja datatiede (data science)

Osa 2:

  • Tekoälyn datatiede sekä syväoppivat neuroverkot
  • Missä tekoälyn kehitys tapahtuu?

Osa 3:

  • Miksi tekoäly ei tule jo?

Osa 4:

  • Kuka voisi edesauttaa tekoälyllisyyttä?
  • Yhteenveto: Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin?

Tekoälyn datatiede sekä syväoppivat neuroverkot

Datatieteen keinoin saadaan tekoälykenttään aikaan erityisesti räätälöidyt erikoisratkaisut sekä monien eri kehitysprojekteissa kierrätettävien ohjelmisto-osien ja pilvipalvelujen sisältämät tekoälyominaisuudet (esim. valmisratkaisut kohteiden tunnistuksiin kuvista ja kielen käsittelyyn). Yksittäisiä tutkimus- ja demokokeiluja lukuunottamatta tämä ei kuitenkaan tapahdu umpiossa vaan tekoälyn kehittämisen kannalta datatieteilijän työ on osa isompaa kehystä ja osallistujajoukkoa.

Ennen kaikkea tieto täytyy pystyä tuomaan datatieteilijän saataville soveltuvassa muodossa, mikä voi olla erittäin haastavaa ja osa hänen työtään – olipa kyse sitten tietokannoista, muista tietolähteistä tai kokonaan uuden tiedonkeräyksen järjestämisestä osaksi jotain järjestelmää tai joidenkin toisten työprosesseja. Senkin jälkeen tietoa voi joutua todennäköisesti käsittelemään edelleen sopivampiin muotoihin. Datatieteilijän luotua sopiva tilastomatemaattinen malli tekoälykkyyden pohjaksi, kyseinen malli pitää opettaa koneoppimisen menetelmin saataville saadulla ja muokatulla tiedolla, mutta opettamisen jälkeen on vielä useita vaiheita.

Tieto ja äly käytäntöön

’Älyä’ sisältävän, opetetun mallin suoriutumiskyky pitää arvioida, minkä jälkeen se pitää viedä laajemman ohjelmistokehityksen käytettäväksi. Sitä kautta tekoälyominaisuudet saadaan osaksi loppukäyttäjien eli meidän kaikkien käyttämiä kokonaisuuksia kuten esim. kännykkäappseja tai taustajärjestelmiä, joita käytämme Internetin kautta tai työpaikkojen sisäisissä asioissa. Lopulta tietoon pohjautuen koneoppimisella kehitetyn tekoälyn suoriutumiskykyä pitää valvoa sen todellisessa käyttöympäristössä, koska se tulee tekemään ainakin jotain virheitä – mikä ei kuitenkaan ole mikään syy jättää kehittämättä tai käyttämättä sitä, vaan tarjoaa mahdollisuuden ja myös pakottaa tekoälyn jatkuvaan parantamiseen käytöstä saatavalla lisätiedolla.

Datatieteilijän varsinainen työ koneoppimisen parissa ei ole kuitenkaan eristyksissä sekään. Kun hän lähtee liikkeelle tekoälyn kehitystarpeesta käytettävissä olevan tietovarantonsa kanssa, hänen työssään on lisäksi paljon riippuvuuksia muihinkin asioihin. Toisaalta tiettyjen sovellusalueiden kanssa voi joutua tukeutumaan sen aiheen asiantuntijoihin, toisaalta koneoppimisen toteuttamisen ja tilastomaattisen mallin rakentamisen kanssa voi olla tarpeen ammentaa lisätietoa tutkimusten tuottamista tieteellisistä julkaisuista. Lisäksi siis sekä malli että sen opettaminen pitää toteuttaa soveltuvalla ohjelmointikielellä hyödyntäen ohjelmistokirjastoja ja monesti käyttäen pohjana myös valmiita ohjelmakoodiesimerkkejä tai jopa valmiiksi jollakin toisella tiedolla koneopetettuja valmismalleja. Tämä kaikki täytyy toteuttaa sopivassa ohjelmistokehitysympäristössä ja käyttäen tietokonelaskentaresursseja, jotka voivat vaatia rahallisia panostuksia.

Vasta tämän kokonaisuuden seurauksena syntyy se koneoppimisella ja saatavilla olleella tiedolla opetettu tilastomatemaattinen malli, joka sisältää ’älyn’ ja jota voidaan käyttää tekoälynä tai tekoälyratkaisun osana. Tämä kehitystyö myös monesti vaatii useita yrityksiä ennen onnistumista.

Missä tekoälyn kehitys tapahtuu?

On hyvä myös huomata, minkälaisia panostuksia tekoälyn kehitykseen tapahtuu ja missä, sekä mikä niiden merkitys on kehityksen apureina ja vetureina. Jos mietitään vaikkapa maailman tilannetta, niin toisilla alueilla on enemmän edellytyksiä viedä tekoälyn kehitys pidemmälle ja nopeammin kuin toisilla. Tällä tulee melko varmasti olemaan vaikutusta siihen minkälaisia, missä ja miten kehitettyjä tekoälyominaisuuksia näemme yksityis- ja työarjessamme jatkossa.

Esimerkiksi Kiina investoi suuresti tekoälyn kehitykseen. Sikäläisellä hallinnolla on hyvin mahdollisuuksia ajaa tahtoaan tekoälykehityksestä, ja Kiinan alueella on myös saman yhteiskuntajärjestelmän puitteissa valtavat tietovarannot, joita se voi hyödyntää koneoppimisen ja yleisemmin tekoälykehityksen puitteina. Euroopassa asiaan ollaan heräämässä mm. valtiollisia ja EU-tason aloitteita tekemällä – joitakin taloudellisesti merkittäviäkin – mutta esimerkiksi suomalaisen tekoälykehityksen kannalta välttämättömäksi viiteryhmäksi jäänee eurooppalaisessa kehitysyhteisössä toimiminen. Muuten ei tunnu uskottavalta, että pystyttäisiin pärjäämään kovinkaan hyvin tekoälyn maailmanlaajuisessa kehitys- ja osaamiskilpailussa ottaen huomioon edellä mainitut erot panostuksissa.

Toinen merkittävä asia tiedostaa alueellisten erojen lisäksi on yritysten asema tekoälykehityksessä. Toisaalta varsinkin suuryritykset koetaan aina ajoittain niiden markkina-asemien vuoksi ongelmallisina sekä julkisen sektorin että pienten yritysten kannalta, mutta toisaalta suuressa liiketoiminnassa tehdään tällä hetkellä suuria panostuksia erityisesti tekoälyn kehittämiseen. Valtioneuvoston ”Tekoälyn kokonaiskuva ja osaamiskartoitus” -selvityksen mukaan yritykset ovat n. 10 viimeisen vuoden aikana tuottaneet valtavan määrän tieteellisiä julkaisuja tekoälyyn liittyen verrattuna eniten julkaisseihin akateemisiin tutkimuslaitoksiin, ja monella suuryrityksellä julkaiseminen on myös valtavassa kasvussa.

Sen lisäksi, että tämä tukee osaltaan sekä tekoälyn tutkimuksen jatkoa että edellä mainittua datatieteilijöiden suorittamaa tekoälyn kehitystyötä, yrityspuolelta on syntynyt isojen panostusten vuoksi myös merkittäviä avoimen lähdekoodin puitteita tekoälykehitykseen. Hyvänä esimerkkinä tästä toimii muun muassa alunperin Googlen kehittämä ja sittemmin kaikille julkaisema Tensorflow, joka lienee tällä hetkellä yleisin syväoppimispohjaisessa tekoälykehityksessä käytettävä ohjelmistokirjastokokonaisuus.

Tekoälyn kehityksessä osaamisresurssit tuntuvat myös ryhmittyvän osaajajoukoiksi, jotka löytyvät myös pienten yritysten sisältä sen sijaan, että olisivat välttämättä keskittyneet akateemiseen maailmaan. Esimerkiksi syväoppiminen on siis paljolti nykyisen tekoälykehityksen ytimessä, mutta omien kohtaamisteni perusteella esim. Suomessa syväoppimisen tekemistä ja osaamista on aika hajanaisesti korkeakouluissa ja tutkimuslaitoksissa, ja ne liittyvät keskenään aika erilaisiin sovellusalueisiin. Sen sijaan Suomen isoimmat ja osaavimmat syväoppimiseen keskittyvät osaajajoukot löytyvät osittain start-up -yrityksistä sekä isoimmillaan muutamista yrityksistä – kuten Curious AI, Silo.AI ja syväoppimisen laskentapuitteita kehittävä NVIDIA – joista kahden ensimmäisen osaajat järjestävät myös kahta Suomen keskeisistä syväoppimisen säännöllisistä kehittäjätapaamisista eli AI Helsinki- ja Turku AI-tapahtumia.

Tämän artikkelin alkuperäinen versio on julkaistu Tiedepolitiikka 4-2018 lehdessä.

Sarjan seuraavassa osassa tarkastellaan syitä siihen, miksi tekoälyn kehitys etenee tietyissä asetelmissa ja sovellusalueissa nopeammin kuin toisissa, sekä sitä, mitkä yleiset asiat rajoittavat ja ohjaavat tekoälyn kehitystyötä.

Avainsanat: AI, avoin lähdekoodi, cloud services, Data science, deep learning, development platforms, GPU computing, GPU laskenta, kehitysalustat, koneoppiminen, machine learning, muttamistätekoälytulee, open source, pilvipalvelut, syväoppiminen, tekoäly

Kommentit