Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin? Osa 3.

Julkaisemme viikottain uuden osan sarjasta Suomi elää älystä -blogissa.

Osa 1:

  • Tekoäly, data ja koneoppiminen
  • Kehittäjät, tutkijat ja datatiede (data science)

Osa 2:

  • Tekoälyn datatiede sekä syväoppivat neuroverkot
  • Missä tekoälyn kehitys tapahtuu?

Osa 3:

  • Miksi tekoäly ei tule jo?

Osa 4:

  • Kuka voisi edesauttaa tekoälyllisyyttä?
  • Yhteenveto: Mutta mistä tekoäly tulee – kuka sen kehittäisi ja millä voimin?

Miksi tekoäly ei tule jo?

Tekoäly on kaikkien huulilla ja mahdollisuudet ovat suuret, mutta odotukset ovat taivaissa. Edellisissä kappaleissa on jo käsitelty tekoälyn kehityksen tarvitsemia puitteita, panostuksia ja joitakin muita riippuvuuksia. Silti on myös muita asioita, joiden vuoksi tekoälyn kehityksen ja siten sen arkeemme tulemisen tahti on vääjäämättä jonkin verran verkkainen.

Sekä yleisesti analytiikkaan että myös koneoppimiskäyttöön saatavilla olevaa tietoa maailmassa on kertynyt monenlaista ja kertyy yhä lisää ja useamman tyyppistä. Suhteessa pieni osa kaikesta tiedosta on laajasti saatavilla maailmanlaajuiselle yhteisölle datatieteilijöitä, tekoälytutkijoita ja tekoälykehityksen työkalukehittäjiä. Esimerkiksi erilaisten tavallisten kuvien isojen aineistojen jakamisen kautta on päästy kehittämään syväoppimisen keinoin konenäkökykyjä, joiden avulla voidaan mm. tunnistaa esineitä, eläviä kohteita ja muita asioita kuvista. Sitä vastoin monet erityislaatuisemmat tai tietosuojan alaiset tietovarannot eivät ole laajemman tekoälyn kehittäjä- ja tutkijakunnan käytettävissä samassa suhteessa. Näitä ovat esimerkiksi lääketieteelliset kuvat terveydenhuollossa ja organisaatioiden sisäiset liiketoiminnan tietovarannot ja tekstidatat, tehdasympäristöjen moninaiset mittaukset sekä puhelinpalvelujen nauhoitteet.

Kun tekoälykehittämisen tutkimus ja datatiede perustuvat aiemmin mainituille kierrätettäville puitteille aina tieteellisistä julkaisuista ohjelmistokirjastoihin ja opetettuihin valmismalleihin, (jotka edelleen kehittyvät samoisten tutkimuksen ja datatieteen myötä), niin on ymmärrettävää, että käytettävissä olevan tiedon luonne ohjaa puitteiden kehitystä tiettyihin suuntiin. Tämän vuoksi on enemmän datatieteen puitteita tehdä tekoälykehityksen kokeiluja nopeastikin, esimerkiksi videovalvontaan, itseajavien autojen konenäköön tai mediateollisuuden sisältöön liittyen verrattuna siihen, miten haastavaa voi olla kehittää tekoälyä liittyen moniin erilaisiin erityistyyppisiin potilaiden elintoimintojen mittauksiin tai vaikkapa vikatilanteiden ennustamiseen teollisuuden erikoismittalaitteiden tuottamista tiedoista. Tekoälyn kehitys ja datatiede ovat paljolti varsin opportunistisia käytettävissä olevan tiedon suhteen. Ihan luonnollisestikin tehdään paljolti sitä, mihin liittyen on sopivia tietovarantoja helposti saatavilla ja missä siltä osin on helppo edetä.

Ylikärjistetysti voisi luonnehtia, että kehittämällä paljon tekoälyä kissakuvien ympärillä tullaan hyviksi kehittämään kissojen tunnistusta kuvista, mutta se ei ratkaise monia muita ongelmia. Tosin tosiasiassa pitää kuitenkin huomata, että suositut tekoälykehityksen alueet kuvien ja mm. tekstinkäsittelyn parissa kyllä tarjoavat sekä laajan joukon tekoälysovelluksia useille aloille että puitteita tekoälykehitykselle laajemmin. Esimerkiksi lääketieteellisiin kuviin liittyvä tekoälykehitys hyötyy laajasti tavallisiin kuviin liittyvästä tekoälykehityksestä aina julkaisuista ja malleista ohjelmistokirjastopuitteisiin. Merkittävää lisävaivaa ja lisähaasteita erityisalueiden tekoälykehitykseen kuitenkin liittyy, eivätkä edellä mainitut edes kata kaikkia syitä siihen. Tämän(kin) vuoksi tekoäly kehitetään toisilla sovellusalueilla paljon nopeammin tai hitaammin kuin toisilla.

Tekoälykehityksen haasteet ja rajoitteet

Tekoälykehitykseen tarvittavien tietovarantojen hyödyntämiseen liittyy nykyään monesti – erityisen korostuneesti Suomessa ja Euroopassa – myös lainsäädännöllisiä rajoitteita (esim. EU:n tietosuoja-asetus GDPR), eettistä pohdintaa sekä huolia tekoälyn päätöksenteon aiheuttamista mahdollisista epätasapuolisuuksista. Kysymyksiä on mm. siitä, mitä ja miten henkilöistä kerättyjä tietoja saa käyttää tekoälyn kehityksessä tai tekoälyn avulla, ja onko esim. vakuutuspäätöstä nopeuttanut tekoäly oppinut opetustietojensa vuoksi joitakin hakijoita syrjiväksi.

Rajoitteet ja eettinen pohdinta ovat tärkeitä ja toisaalta ehkä muokkaavat omaan arkeemme ajan kanssa tulevaa tekoälyllistä tietotekniikkaa arvojemme mukaiseksi, mutta kaikella on myös luonnollisesti kääntöpuolensa. Pitää ymmärtää, että koska kaikkialla ei tarkastella näitä asioita samanlaisella tarkkuudella, niin toisaalla tekoälyn kehitys etenee nopeammin ja hyvin todennäköisesti muissa maissa ja muilla alueilla omiamme aiemmin kehitetyt tekoälyratkaisut voivat tihkua myös meidän elämäämme eri kanavia pitkin.

Suunta, johon teknologisesti näytetään olevan menossa, tarjoaa kuitenkin keinoja hallita tekoälyn kehitystä ja käyttöönottoa, tapahtuipa se sitten omasta takaa tai jonkun muun toimesta. Esimerkiksi IBM:n syksyllä 2018 julkaisema AI OpenScale on kokonaisuus, joka tarjoaa välineistöä mm. tekoälyn päätösvinoumien (bias) huomaamiseen ja korjaamiseen sekä tekoälyn päätöksenteon läpinäkyväksi tekemiseen, mikä parantaa myös mahdollisuuksia luottaa tekoälyominaisuuksien toimintaan, ja ottaa niitä käyttöön arjen tietotekniikassa.

Yksi asia joka myös luontaisesti hidastaa tekoälyn, kuten kaiken muunkin teknologian käyttööntulemista, ovat jakelukanavat. On oma asiansa tuoda tekoäly käyttöön valmiissa (ehkä oman organisaation) liike- tai muussa toiminnassa kuin kehittää sitä erillisenä asiana ja yrittää viedä markkinoille.

Kuitenkin yksi asia omasta mielestäni erottautuu erityisen selvänä pullonkaulana tekoälykehityksen kannalta: asiantuntevien henkilöresurssien tilanne. Datatieteilijöitä on kasvava mutta edelleen suhteessa pieni ja kilpailtu ammattikunta, joista vain osa varsinaisesti suuntautuu tekoälykehitykseen. Suhteessa näihin osaajaresursseihin on olemassa suuri tekoälyn mahdollisuus- ja kysyntäkenttä, joka kilpailee heistä.

Tietotekniikan parissa on datatieteilijöiden sijaan suuri määrä ohjelmointikykyistä ammattikuntaa. Lisäksi yleisesti eri aloilla on vielä suurempi joukko tietotekniikkaa soveltavia erilaisten sovellus- ja aihealueiden asiantuntijoita eri alojen tutkijoista ja esim. lääkäreistä ja hoitajista lakimiehiin, viranomaisiin, taloushallinnon ammattilaisiin (jne.), joilla voisi olla annettavaa tekoälyn kehittämiseen, mutta joista useimmilla ei ole siihen sopivaa teknistä taustaa.

Tämän artikkelin alkuperäinen versio on julkaistu Tiedepolitiikka 4-2018 lehdessä.

Sarjan seuraavassa osassa pohditaan ratkaisuja yllä mainittuihin tekoälyn kehitystä hidastaviin seikkoihin.

Avainsanat: AI, avoin lähdekoodi, cloud services, Data science, deep learning, development platforms, GPU computing, GPU laskenta, kehitysalustat, koneoppiminen, machine learning, muttamistätekoälytulee, open source, pilvipalvelut, syväoppiminen, tekoäly

Kommentit