Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin? Osa 4.

Osa 1:

  • Tekoäly, data ja koneoppiminen
  • Kehittäjät, tutkijat ja datatiede (data science)

Osa 2:

  • Tekoälyn datatiede sekä syväoppivat neuroverkot
  • Missä tekoälyn kehitys tapahtuu?

Osa 3:

  • Miksi tekoäly ei tule jo?

Osa 4:

  • Kuka voisi edesauttaa tekoälyllisyyttä?
  • Yhteenveto: Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin?

Kuka voisi edesauttaa tekoälyllisyyttä?

Nähdäkseni ainoita riittävissä määrin vaikuttavia tapoja helpottaa tekoälyn kehitystyön edellytyksiä on koko edellä mainitun monenkirjavan osaajajoukon (datatieteilijät, muut ohjelmointiosaajat, aihealueiden asiantuntijat) hyödyntäminen usein erilaisin tavoin tehokkaasti. Varsinkin Suomen kokoisessa maassa osaajia tietyillä aihealueilla on aika rajallinen määrä – olipa kyse sitten datatieteestä tai vaikkapa fyysikoista tai erikoislääkäreistä. On helpompi mahdollistaa suuremman joukon osallistuminen tekoälykehitykseen, kukin omilla ehdoillaan, kuin yrittää muuttua resursseiksi, joita ei väestöstä enempää löydy.

Suuri hyöty saadaan tekoälykehityksen vähittäisellä ”demokratisoinnilla”: tietyillä kohdennetuilla aihealueilla – esimerkiksi kuviin ja videoihin liittyen – aiheasiantuntijoille voidaan jo nyt tarjota työkaluja, joilla he voivat tehdä tekoälysovelluksia olennaisten asioiden tunnistamiseen kuvista ilman enempää käsitystä siihen liittyvästä datatieteestä, tilastomatemaattisista malleista, koneoppimisesta tai ohjelmoinnista. Tällaiset ympäristöt (IBM-esimerkkinä PowerAI Vision -ympäristö) tarjoavat työkalut opetustietojen (esim. kuvat, videot) tuomiseen käyttöliittymään, jossa aiheasiantuntija (esim. tutkija/lääkäri/hoitaja) voi merkitä kuviin tunnistettavat kohteet (esim. poikkeavat löydökset röntgenkuvissa tai syövän solunäytteissä), minkä jälkeen työkaluympäristö automaattisesti kehittää tekoälyn kyseiseen tunnistustarkoitukseen. Lopuksi he voivat julkaista kehitetyn tunnistustekoälyn käyttöön/jatkohyödynnykseen samasta ympäristöstä. Näin aiheasiantuntijoista tulee siis käytännössä soveltavia tekoälykehittäjiä.

Samanhenkistä tekoälykehityksen avustamista ja nopeuttamista ovat myös ympäristöt, jotka pelkistävät tilastomatemaattisen mallin rakentamisen ja koneoppimisen hyödyntämisen datatieteilijöille ja myös muille ohjelmoijille. Sekä pilviohjelmisto- (esim. IBM Watson Studio) että muut ympäristöt tarjoavat nykyään mahdollisuuksia määritellä syväoppimisen neuroverkkoja graafisissa käyttöliittymissä, ja opettaa ne sitten tietovarannoilla automaattisesti ohjelmoimaan suurehkoja määriä yksityiskohtiailman tarvetta käyttää aikaa. Tämä tarjoaa osaan tekoälykenttää nopeutusta kehitykseen: sama kehittäjäkunta ehtii tehdä enemmän kehitystyötä rajallisessa ajassa.

Datatieteilijöitä reilusti suurempaa ohjelmointitaitoisten osaajien joukkoa voi myös jatkokouluttaa datatieteilijöiksi. Tästä onkin Suomessa virallisten koulutustahojen (mm. korkeakoulut) rinnalla mielenkiintoisilta vaikuttavia kokeilualkuja, kun Solita ilmoitti vuosi sitten käynnistävänsä tekoälyosaamisen koulutusohjelman ohjelmistokehittäjille. Tällainen työssäkoulutus voisi olla hyvä tapa paikata datatieteilijävajetta.

Tekoälykehitystä tekevän datatieteilijän työtä puolestaan helpottaisi nopeampien kehitys- ja kokeiluympäristöjen lisäksi sekin, jos ja kun päästään tilanteeseen, jossa koneoppimisella valmiiksi luodut tekoälyratkaisut kehittyvät nykyistä pidemmälle kierrätettäviksi tekoälyosiksi – samanhenkisesti kuin miten ohjelmistokirjastot tarjoavat valmiita osaratkaisuja ohjelmistokehityksessä. Tällöin datatieteilijän työ voi tulla vielä nykyistä tuottavammaksi ja myös kattavammat tekoälytoiminnot voivat tulla mahdollisemmaksi. Kuten aiemmin mainittiin, nykyäänkin on siis jo jaossa valmisopetettuja malleja datatieteilijän työn pohjaksi (IBM:llä esim. kaikille avoin Model Asset Exchange, MAX). Lisäksi on erilaisia ohjelmointirajapintojen taakse paketoituja osaratkaisuja tekoälykokonaisuuksia varten. Kuitenkin koneoppimisen, ehkä erityisesti syväoppimisen, näkökulmasta tulevaisuudessa kyse voi olla myös uudenlaisesta tavasta rakentaa tekoälypalasia ja tekoäly palasista.

Koska ohjelmointirajapintojen takana on siis valmispalasia tekoälyn pohjaksi (ohjelmistokirjastoissa tai esim. pilvipalveluissa ja mm. tekstin käsittelyyn, puheen hyödyntämiseen ja kuvien tunnistamiseen liittyen), niin aina tekoälyn kehittämisessä ei tarvitse siksikään lähteä liikkeelle raskaimman kautta. Tällaisia valmispalasia yhdistelemällä voi koota älykästä toiminnallisuutta vaikkapa esim. kehittääkseen keskustelevan käyttöliittymän, jollaisia nähdään nykyään mm. monenlaisten verkkosivujen ensimmäisenä asiakaspalveluna (chat-ikkunat). Lisäksi tällaisia valmispalasia pystyy osiltaan mukauttamaan omaan käyttöön sopivammaksi opettamalla niitä omilla tietovarannoilla.

Kokonaan oman lukunsa tekoälyn kehityksen vauhdituksessa tulee vielä muodostamaan automaattisen koneoppimisen (AutoML) tutkimus ja kehitys. Edellä mainitut tekoälykehityksen demokratisoinnin työkalut sisältävät jo tietyissä määrin automaattista koneoppimista, mutta sitä paljon laajemmin on myös alustavia tuloksia esim. Googlen toimesta siitä, miten koneoppimisen keinoin tekoäly voi oppia rakentamaan sellaisia tekoälyratkaisuja, joita ihminen ei tulisi kehittäneeksi ja jotka voivat olla soveltuvampia tarkoitukseensa kuin tutkijoiden tai datatieteilijöiden itsensä kehittämät vastaavat.

Yhteenveto: Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin?

Tekoälyominaisuuksien kehitys arkeemme vaatii siis monia erilaisia osaajia, resursseja ja tekemisiä. Tämä yhteisponnistus riippuu tutkijoiden, ohjelmistokehittäjien, aiheasiantuntijoiden ja datatieteilijöiden tekemisestä. Myös kouluttajia tarvitaan lisäämään osaajaresursseja erityisesti datatieteeseen liittyen.

Koneoppiminen ja siten myös tekoälyn kehitys on pitkälti riippuvainen laadukkaista tietovarannoista, joiden tarvitsee olla saatavilla, mutta riippuvuuksia on myös paljon enemmän. Kehityksen puitteet (tutkimuskirjallisuus, avoimet lähdekoodit, valmiit mallit, valmiit ratkaisut, automatiikka) ovat käytännössä ratkaisevassa asemassa ajatellen mahdollisuuksia ja tekoälyn etenemistä eri tasoisesti hankalilla aloilla ja sovellusalueilla, sillä kehitystyötä tehdään rajallisin resurssein erityisesti rajallisella ajalla.

Akateemisen maailman annin lisäksi tekoälyn kehitys tukeutuu vahvasti myös yritysten tekoälypanostuksista kaikkien hyödyksi tulevaan tietoon sekä avoimeen lähdekoodiin ja suljettuihin valmisratkaisuihin. Lisäksi tekoälypolitiikka on heräämässä, mutta eri puolilla maailmaa eri tahtiin: toisissa paikoissa ehditään pitkälle tietyissä tekoälysovelluksissa. Toisissa paikoissa todennäköisesti päädytään jossain määrin hyödyntämään muualla ja toisten ehdoilla kehitettyjä tekoälyratkaisuja, mutta senkin kanssa pärjäämiseen on jo olemassa sekä tulossa teknologisia välineitä.

Hypestä konkretiaan

Tekoälyn ympärillä oleva hype varmasti sekä ihastuttaa että ärsyttää. Hypessä on kyse innostuksesta, ja siinä mielessä se on positiivinen voima silloin, kun on edellytyksiä saavutuksille. Tekoälyn kehityksen suhteen se aika vaikuttaa viimein tulleen, sillä nyt palaset (tietovarannot, laskentateho, alan räjähtävä kasvu ja kehitys) ovat viimein kasassa, ja tuloksia on mahdollista saada.

Rakentamalla tekoälytoiminnallisuutta valmisratkaisujen avulla on helppo tehdä ensimmäisiä omia kokeita tekoälyn hyödyntämisestä. Ohjelmointitaitoisille löytyy hyvin paljon aloituspuitteita, mutta myös pelkkien hyödyntäjienkin kokemuksia tarvitaan olennaisesti – tekoälyratkaisujen soveltuvuus ja käytännön kyvykkyys ovat tärkeitä asioita, varsinkin koska tietovarannoilla koulutettujen tekoälyjen toimivuutta pitää kehittää jatkuvaluonteisesti. Vähintä mitä kunkin kannattaa tehdä – sekä tekoälyn kehittämisessä mukana olemisen että pelkän hyödyntämisen kannalta – on ymmärtää perusteet, esimerkiksi ilmaisen verkkokurssin kautta.

Suomessa puhutaan nyt paljon alustataloudesta. Ehkä jossain määrin sivutaan myös kokeilukulttuuria, ja se olisi olennainen ajattelumalli myös tekoälyn hyödyntämiseen ja kehittämiseen lähtemisen suhteen: tärkeintä on tekemisen aloittaminen – vaikka pienestä. Kokemuksesta oppii näkemään suunnan, mihin seuraavaksi haluaa suunnata.

Kehittäminen on jatkuvaa, kerralla ei kannata yrittää liikaa. Tekoälyn kehityksessä kannattaa pyytää apua ja auttaa toisia. Hedelmät ovat meitä kaikkia varten, mutta puutarha iso.

Muutamia kansallisia lisätietolähteitä:

https://www.tekoalyaika.fi/

http://www.ai-monday.fi/  (videoarkisto)

Tekoälyn kokonaiskuva ja osaamiskartoitus: http://julkaisut.valtioneuvosto.fi/handle/10024/160925

Tämän artikkelin alkuperäinen versio on julkaistu Tiedepolitiikka 4-2018 lehdessä.

Avainsanat: AI, avoin lähdekoodi, cloud services, Data science, deep learning, development platforms, GPU computing, GPU laskenta, kehitysalustat, koneoppiminen, machine learning, muttamistätekoälytulee, open source, pilvipalvelut, syväoppiminen, tekoäly

Kommentit