Tekoäly (AI)
Sisältö
Käsitteet
Tekoäly (AI) on wikipedian määritelmän mukaan on tietokone tai tietokoneohjelma, joka kykenee tekemään älykkäinä pidettäviä toimintoja. Tekoälyn tarkempi määrittely on avoin, koska älykkyyttä itsessään on vaikea määritellä.
Kapea tekoäly (ANI) on tekoälyn tyyppi, joka on suunniteltu suorittamaan tietyn tehtävän tai tehtäväjoukon. Se tunnetaan myös nimellä heikko tekoäly tai soveltuva tekoäly. Kaikki nykyisin käytössä olevat tekoälyjärjestelmät, kuten ääniassistentit Alexa ja Siri, Teslan ajoavustin tai ChatGPT, ovat niin sanottuja kapeita tekoälysovelluksia.
Yleistekoäly (AGI) on tekoälyn tyyppi, joka pystyy oppimaan minkä tahansa henkilön suorittaman älyllisen tehtävän. Se on hypoteettinen käsite, jota ei ole vielä saavutettu käytännössä, mutta sitä käytetään usein vertailukohtana nykyisten tekoälyjärjestelmien kykyjä arvioitaessa. Oppii ajamaan autoa, kokkaamaan, analysoimaan suuren määrän dataa, minkä tahansa työtehtävän itsenäisesti on kaiken kehityksen tavoitteena.
Generatiivinen tekoäly on osa koneoppimista, joka käyttää algoritmeja ja dataa luodakseen jotain uutta. Ajatellaanpa esimerkiksi maalausta. Sinulla on joukko maalauksia – impressionismia, kubismia, realismia, jne. – ja haluat tekoälyn luovan oman taideteoksen. Generatiivinen tekoäly, joka on opiskellut näitä tyylejä, kykenee luomaan oman taideteoksen, joka on uusi ja uniikki, mutta joka ottaa vaikutteita opiskelluista tyyleistä.
Generatiivinen tekoäly toimii kahden pääkomponentin avulla: generaattorin ja diskriminaattorin. Generaattori luo uusia, aitoja tuntuisia tuloksia, kuten maalauksia esimerkissämme. Diskriminaattori sen sijaan arvioi näitä luomuksia ja vertaa niitä alkuperäisiin opittuihin malleihin – se yrittää erotella oikeat, aitojen taiteilijoiden maalaamat taideteokset tekoälyn luomista kuvista. Generaattori yrittää sitten parantaa luomuksiaan diskriminaattorin palautteen perusteella, kunnes se saa aikaan jotain, jonka diskriminaattori luulee oikeaksi teokseksi.
Tämä prosessi on kuin kehittyvä peli, jossa generaattori ja diskriminaattori kilpailevat keskenään. Tämä “peli” auttaa tekoälyä oppimaan ja kehittämään uusia, luovia ideoita, jotka voivat jäljitellä tai jopa ylittää alkuperäiset mallit. Ja tämä on generatiivisen tekoälyn ydin: se ei vain opi ymmärtämään dataa, vaan myös luo uusia, innovatiivisia ideoita sen perusteella, mitä se on oppinut.
Tekoäly = Tukiäly
Tekoälystä pitäisi ennemmin puhua tukiälynä. Se toimii loistavasti apulaisena, ideoijana, sparraajana, mentorina, tehostajana yms. Se ei kuitenkaan poista aiheen substanssiosaamista käyttäjältä vaan päinvastoin korostaa sitä, jotta voimme tarkistaa tekoälyn tuottaman tiedon oikeellisuuden. Se tukee myös siis itsenäistä ajattelua.
Kielimallit
Kielimallit (LLM) ovat generatiivisten tekoälyjen “moottoreita”, jotka voivat mm. lukea, tiivistää ja kääntää tekstejä (Katso video kielimallien takana toimivasta teknologiasta (YouTube, avautuu uuteen ikkunaan)) eli osaavat käsitellä ihmisen luomaa tekstiä. Ne ennustavat tulevia merkkejä merkkisarjassa koneoppimisen avulla muodostettujen todennäköisyyksien mukaan, jolloin ne voivat luoda samanlaisia lauseita kuin ihmiset puhuvat ja kirjoittavat. Kielimallin tehtävä on siis generoida ihmismäistä sujuvaa tekstiä sille annetun syötteen (prompt) perusteella. Yleisin syötteen antotapa tekoälysovellukselle on tekstikenttään kirjoitettu teksti.
Kieliopillisesti oikea ja järkevän kuuloinen teksti luo harhakuvan vastauksen oikeellisuudesta vaikka voi olla täysin vääristynyt. Joten aiheen substanssiosaamista tarvitaan edelleen. Usein tekoälyn kirjoittaman tekstin paikkansa pitävyyden tarkistaminen ja lähteiden merkitseminen on työläämpää kuin itse tuottaa tuottaa tekstiä lähteiden perusteella.
Artikkeli: Näin ChatGPT syntyi – kukaan ei täysin ymmärrä, miten kielimallit toimivat (Tivi 7.9.2023) – avautuu HAMK:n tunnuksilla
Kielimalli ei ole älykäs
Kielimalli on vain ohjelma, joka osaa muodostaa lähdemateriaaliin perustuvien todennäköisyyksien perusteella tekstiä vastauksena syötteeseen, joka sille on annettu. Sillä ei ole mitään osaamista tai ymmärrystä sisällöstä vaikka sujuva ja kieliopillisesti oikea vastaus saattaa antaa hämäävän kuvan. Vastuu kirjoituksen tietojen oikeellisuudesta on tekoälyn käyttäjällä.
Kielimallit pystyvät käsittelemään syötteen sisällön yleensä kymmenillä kielillä, mukaan lukien myös ohjelmointikieliä, mutta tämä vaihtelee sovelluksittain.
Kielimallit toimivat pohjana generatiivisille tekoälysovelluksille. Eli ne pystyvät luomaan vastauksia toiveiden mukaan, jotka on annettu syötteillä. Esimerkiksi ChatGPT tuottaa tekstiä, jota ei parhaimmillaan voi erottaa ihmisen kirjoittamasta tekstistä. Lisäksi kuvageneraattorit, kuten DALL-E 3, pystyvät luomaan ja muokkaamaan kuvia niille annettujen tekstisyötteiden perusteella. Kukin sovellus voidaan opettaa omaan erityiseen tehtäväänsä koneoppimisen avulla. Koneoppiminen on tekoälyn osa-alue, jonka tarkoituksena on saada sovellus toimimaan entistä paremmin pohjatiedon ja mahdollisen käyttäjän toiminnan perusteella. Näennäinen älykkyys johtuu suuresta resurssista laskea ja vertailla kielimallissaan olemassa olevaan yleistykseen asioista, jonka se on muodostanut jättimäisestä määrästä tekstimateriaalia. Se ei pysty luomaan satunnaisesti mitään uutta, mutta se yhdistelee olemassa dataa aivan uusilla tavoilla ja nopeudella, johon ei ihminen kykene.
Generatiivisen tekoälyn rajoitukset
Tekoäly heijastelee sille syötettyä lähdemateriaalia. Rajoitteena käytölle pitää muistaa mahdollinen tiedon paikkansa pitämättömyys eli hallusinointi vastauksessa. Lisäksi se saattaa tarjota puolueellista tai vahingoittavaa tietoa, joka johtuu kielimallin opetuksessa käytössä olleesta lähdemateriaalista. Tämä johtuu, että valtaosa kielimallin opettamiseen käytetystä lähdemateriaalista tulee länsimaista. Se, että lähdemateriaalina ei ole käytetty esimerkiksi Kiinasta tai Afrikasta materiaaleja, heikentää sovelluksen laatua ja kykyä tuottaa puolueetonta ja tasa-arvoista tietoa eri kulttuurit huomioon ottaen. Vastuu kirjoitetun tiedon oikeellisuudesta on tekoälyn käyttäjällä. Tekoäly itsessään ei välitä siitä, onko jokin asia totta, minkä se generoi käyttäjälle, koska sen tehtävä on vain generoida tekstiä esimerkiksi.