Tekoäly (AI)
Sisältö
Käsitteet
Tekoäly (AI) on wikipedian määritelmän mukaan on tietokone tai tietokoneohjelma, joka kykenee tekemään älykkäinä pidettäviä toimintoja. Tekoälyn tarkempi määrittely on avoin, koska älykkyyttä itsessään on vaikea määritellä.
Kapea tekoäly (ANI) on tekoälyn tyyppi, joka on suunniteltu suorittamaan tietyn tehtävän tai tehtäväjoukon. Se tunnetaan myös nimellä heikko tekoäly tai soveltuva tekoäly. Kaikki nykyisin käytössä olevat tekoälyjärjestelmät, kuten ääniassistentit Alexa ja Siri, Teslan ajoavustin tai ChatGPT, ovat niin sanottuja kapeita tekoälysovelluksia.
Yleistekoäly (AGI) on tekoälyn tyyppi, joka pystyy oppimaan minkä tahansa henkilön suorittaman älyllisen tehtävän. Se on hypoteettinen käsite, jota ei ole vielä saavutettu käytännössä, mutta sitä käytetään usein vertailukohtana nykyisten tekoälyjärjestelmien kykyjä arvioitaessa. Oppii ajamaan autoa, kokkaamaan, analysoimaan suuren määrän dataa, minkä tahansa työtehtävän itsenäisesti on kaiken kehityksen tavoitteena.
Generatiivinen tekoäly on osa koneoppimista, joka käyttää algoritmeja ja dataa luodakseen jotain uutta. Ajatellaanpa esimerkiksi maalausta. Sinulla on joukko maalauksia – impressionismia, kubismia, realismia, jne. – ja haluat tekoälyn luovan oman taideteoksen. Generatiivinen tekoäly, joka on opiskellut näitä tyylejä, kykenee luomaan oman taideteoksen, joka on uusi ja uniikki, mutta joka ottaa vaikutteita opiskelluista tyyleistä.
Generatiivinen tekoäly toimii kahden pääkomponentin avulla: generaattorin ja diskriminaattorin. Generaattori luo uusia, aitoja tuntuisia tuloksia, kuten maalauksia esimerkissämme. Diskriminaattori sen sijaan arvioi näitä luomuksia ja vertaa niitä alkuperäisiin opittuihin malleihin – se yrittää erotella oikeat, aitojen taiteilijoiden maalaamat taideteokset tekoälyn luomista kuvista. Generaattori yrittää sitten parantaa luomuksiaan diskriminaattorin palautteen perusteella, kunnes se saa aikaan jotain, jonka diskriminaattori luulee oikeaksi teokseksi.
Tämä prosessi on kuin kehittyvä peli, jossa generaattori ja diskriminaattori kilpailevat keskenään. Tämä “peli” auttaa tekoälyä oppimaan ja kehittämään uusia, luovia ideoita, jotka voivat jäljitellä tai jopa ylittää alkuperäiset mallit. Ja tämä on generatiivisen tekoälyn ydin: se ei vain opi ymmärtämään dataa, vaan myös luo uusia, innovatiivisia ideoita sen perusteella, mitä se on oppinut.
Tekoäly = Tukiäly
Tekoälystä pitäisi ennemmin puhua tukiälynä. Se toimii loistavasti apulaisena, ideoijana, sparraajana, mentorina, tehostajana yms. Se ei kuitenkaan poista aiheen substanssiosaamista käyttäjältä vaan päinvastoin korostaa sitä, jotta voimme tarkistaa tekoälyn tuottaman tiedon oikeellisuuden. Se tukee myös siis itsenäistä ajattelua.
Kielimallit
Kielimallit (LLM) ovat generatiivisten tekoälyjen “moottoreita”, jotka voivat mm. lukea, tiivistää ja kääntää tekstejä (Katso video kielimallien takana toimivasta teknologiasta (YouTube, avautuu uuteen ikkunaan)) eli osaavat käsitellä ihmisen luomaa tekstiä. Ne ennustavat tulevia merkkejä merkkisarjassa koneoppimisen avulla muodostettujen todennäköisyyksien mukaan, jolloin ne voivat luoda samanlaisia lauseita kuin ihmiset puhuvat ja kirjoittavat. Kielimallin tehtävä on siis generoida ihmismäistä sujuvaa tekstiä sille annetun syötteen (prompt) perusteella. Yleisin syötteen antotapa tekoälysovellukselle on tekstikenttään kirjoitettu teksti.
Kieliopillisesti oikea ja järkevän kuuloinen teksti luo harhakuvan vastauksen oikeellisuudesta vaikka voi olla täysin vääristynyt. Joten aiheen substanssiosaamista tarvitaan edelleen. Usein tekoälyn kirjoittaman tekstin paikkansa pitävyyden tarkistaminen ja lähteiden merkitseminen on työläämpää kuin itse tuottaa tuottaa tekstiä lähteiden perusteella.
Artikkeli: Näin ChatGPT syntyi – kukaan ei täysin ymmärrä, miten kielimallit toimivat (Tivi 7.9.2023) – avautuu HAMK:n tunnuksilla
Kielimalli ei ole älykäs
Kielimalli on vain ohjelma, joka osaa muodostaa lähdemateriaaliin perustuvien todennäköisyyksien perusteella tekstiä vastauksena syötteeseen, joka sille on annettu. Sillä ei ole mitään osaamista tai ymmärrystä sisällöstä vaikka sujuva ja kieliopillisesti oikea vastaus saattaa antaa hämäävän kuvan. Vastuu kirjoituksen tietojen oikeellisuudesta on tekoälyn käyttäjällä.
Kielimallit pystyvät käsittelemään syötteen sisällön yleensä kymmenillä kielillä, mukaan lukien myös ohjelmointikieliä, mutta tämä vaihtelee sovelluksittain.
Kielimallit toimivat pohjana generatiivisille tekoälysovelluksille. Eli ne pystyvät luomaan vastauksia toiveiden mukaan, jotka on annettu syötteillä. Esimerkiksi ChatGPT tuottaa tekstiä, jota ei parhaimmillaan voi erottaa ihmisen kirjoittamasta tekstistä. Lisäksi kuvageneraattorit, kuten DALL-E 3, pystyvät luomaan ja muokkaamaan kuvia niille annettujen tekstisyötteiden perusteella. Kukin sovellus voidaan opettaa omaan erityiseen tehtäväänsä koneoppimisen avulla. Koneoppiminen on tekoälyn osa-alue, jonka tarkoituksena on saada sovellus toimimaan entistä paremmin pohjatiedon ja mahdollisen käyttäjän toiminnan perusteella. Näennäinen älykkyys johtuu suuresta resurssista laskea ja vertailla kielimallissaan olemassa olevaan yleistykseen asioista, jonka se on muodostanut jättimäisestä määrästä tekstimateriaalia. Se ei pysty luomaan satunnaisesti mitään uutta, mutta se yhdistelee olemassa dataa aivan uusilla tavoilla ja nopeudella, johon ei ihminen kykene.
Generatiivisen tekoälyn rajoitukset
Tekoäly heijastelee sille syötettyä lähdemateriaalia. Rajoitteena käytölle pitää muistaa mahdollinen tiedon paikkansa pitämättömyys eli hallusinointi vastauksessa. Lisäksi se saattaa tarjota puolueellista tai vahingoittavaa tietoa, joka johtuu kielimallin opetuksessa käytössä olleesta lähdemateriaalista. Tämä johtuu, että valtaosa kielimallin opettamiseen käytetystä lähdemateriaalista tulee länsimaista. Se, että lähdemateriaalina ei ole käytetty esimerkiksi Kiinasta tai Afrikasta materiaaleja, heikentää sovelluksen laatua ja kykyä tuottaa puolueetonta ja tasa-arvoista tietoa eri kulttuurit huomioon ottaen. Vastuu kirjoitetun tiedon oikeellisuudesta on tekoälyn käyttäjällä. Tekoäly itsessään ei välitä siitä, onko jokin asia totta, minkä se generoi käyttäjälle, koska sen tehtävä on vain generoida tekstiä esimerkiksi.
GPT-3
GPT-3 (Generative Pre-training Transformer 3) on kolmas OpenAI:n kehittämän kielimallin versio, joka on julkaistu keväällä 2020. Se on koulutettu suurella tekstimäärällä ennustamaan seuraava sana sanasarjassa sen perusteella, mitä sanoja on ennen sitä (”jos-niin”-sääntöparametreja) . Esimerkiksi, jos mallille annetaan sanat “Kissa istui maton”, se ennustaa seuraavan sanan olevan “päällä”. Näitä parametreja on tässä kielimallissa 175 miljardia. Oppimisprosessi on periaatteessa samanlainen kuin pululla.
Rajoitteena on tiedon paikkansa pitämättömyys eli hallusinointi. Lisäksi saattaa tarjota puolueellista tai vahingoittavaa tietoa, joka johtuu kielimallin opetuksessa käytössä olleesta lähdemateriaalista. Lisäksi datasetin tietoja ei ole päivitetty joulukuun 2021 jälkeen.
Tämän kielimallin versio 3.5 oli sovelluksen ChatGPT:n moottorina, joka julkaistiin marraskuu 2022 lopulla.
GPT-4 (katso video, YouTube)
Tämä uusin versio kielimallista julkaistiin 14.3.2023. Kielimallin käyttämien parametrien määrää tai tietomallin kokoa ei ole kerrottu, mutta sen sanotaan olevan luovempi, ymmärtävän entistä monimutkaisempia ohjeita ja pystyvän ratkaisemaan entistä monimutkaisempia ongelmia, kuin aikaisemmat kielimallit. Lähdemateriaalina on kielimallin koulutukseen on käytetty julkista dataa (internet) sekä lisensoituja kolmannen osapuolen kirjastoja.
Se hallitsee ja auttaa entistä vaativimmissa ja monimutkaisemmissa luovuutta vaativissa ja teknisissä kirjoitustehtävissä, kuten kappaleiden säveltämisessä, käsikirjoitusten kirjoittamisessa tai käyttäjän kirjoitustyylin oppimisessa. Lisäksi GPT-4 hyväksyy kuvia syötteinä ja voi luoda kuvaus tekstejä kuvien sisällöstä, luokituksia ja analyyseja. Myös kyky käsitellä suurempia määriä tekstiä syötteenä on parantunut. GPT-4 pystyy käsittelemään yli 25 000 sanaa tekstiä, mikä mahdollistaa käyttötapaukset, kuten pitkän muodon sisällön luomisen, laajennetut keskustelut sekä asiakirjahaun ja -analyysin.
Tehokkuuden lisäksi, GPT-4 on tarkempi tiedon paikkansa pitävyyden suhteen. Tarkkuus on saatu nostettua aiheesta riippuen 70-80% tasolle. GPT-3.5 sai keskimäärin faktoista oikein 50-60%. Mutta voi edelleen tarjota väärää tai puolueellista tietoa, kuten edeltäjänsä. Sen datasetti kattaa joulukuuhun 2022 asti.
Tämä uusi kielimalli on tällä hetkellä käytössä ChatGPT:n maksullisessa versiossa, ChatGPT Plussassa. katso video (youtube).
GPT-4o (omni), ChatGPT:n kielimalli (avautuu uudessa selain ikkunassa)
GPT-4o (“o” tarkoittaa “omni”) julkaistiin 13.5.2024 ja se edustaa edistysaskelta luonnollisessa ihmisen ja tietokoneen välisessä vuorovaikutuksessa. Malli tarjoaa reaaliaikaista päättelykykyä tekstin, äänen ja kuvan avulla annetuilla syötteillä, mikä mahdollistaa luonnolliset ja monipuoliset vuorovaikutuksen keinot sovelluksen kanssa. GPT-4o kommunikoi käyttäjien kanssa teksti- sekä ääni- ja kuvasyötteiden (promptien) avulla, luoden dialogeja ja antamalla vastauksia uusiin kysymyksiin sekä tarvittaessa kysymällä käyttäjältä tarkennuksia.
Äänisyötteissä nopeilla vasteajoilla GPT-4o pyrkii jäljittelemään inhimillistä keskustelua, tarjoten sujuvan käyttäjäkokemuksen vuoropuhelusta. Malli osoittaa parannettua suorituskykyä kuvan ja äänen ymmärtämisessä verrattuna aiempiin versioihin, koska se yhdistämällä tekstin, äänen ja kuvan käsittelyn yhdeksi syötteeksi, GPT-4o virtaviivaistaa tulo-lähtöprosessiaan ja parantaen näin sen tehokkuutta. Se vastaa GPT-4 Turbon suorituskykyä tekstin ja koodin osalta englanniksi, mutta tarjoaa merkittäviä parannuksia muiden kielten käsittelyyn, ollen samalla paljon nopeampi ja 50% edullisempi API:n kautta käytettävänä kuin GPT-4 Turbo.
OpenAI on suorittanut laajoja arviointeja GPT-4o:n kyvyistä, mukaan lukien tekstin, äänen ja kuvan ymmärtäminen, ja osoittanut sen suorituskyvyn. GPT-4o on nyt saatavilla ilmaiseksi kaikille käyttäjille, ja premium-vaihtoehdot tarjoavat suurempia kapasiteettirajoja. Kehittäjät voivat käyttää GPT-4o:ta API:ssa tekstin ja kuvien käsittelyyn, ja tulevaisuudessa suunnitellaan ääni- ja videokykyjen lisäämistä.
GPT-o1, päättelykykyä (avautuu uuteen selain ikkunaan)
OpenAI on 12.9.2024 esitellyt o1-nimisen, suuren kielimallin, joka on koulutettu suorittamaan monimutkaista päättelyä vahvistusoppimisen avulla. o1 on suunniteltu ajattelemaan vaihe vaiheelta ennen vastaamista, käyttäen “ajatusten ketju” -prosessia.
OpenAI o1-previewin keskeiset ominaisuudet:
- Parannettu päättely: o1 osoittaa parempia päättelykykyjä verrattuna edeltäjäänsä, GPT-4o, eri vertailuarvioissa ja kokeissa.
- Ajatusten ketju -päättely: Malli käyttää ajatusten ketju -prosessia, jäljitellen inhimillistä päättelyä pilkkomalla ongelmat pienempiin askeliin, tunnistamalla virheitä ja tutkimalla vaihtoehtoisia lähestymistapoja.
- Ihmistasoinen suorituskyky: o1 saavuttaa vaikuttavia tuloksia standardoiduissa testeissä ja vertailuarvioissa, jopa ylittäen ihmisten asiantuntijoiden suoritukset tietyillä alueilla, kuten GPQA-diamond-arvioissa, jotka mittaavat tieteellistä asiantuntemusta.
- Parannetut koodauskyvyt: o1 osoittaa vahvoja koodauskykyjä, sijoittuen 89. prosenttipisteeseen Codeforces-ohjelmointihaasteissa ja suoriutuen paremmin kuin GPT-4o koodaustehtävissä.
Ajatusten ketju -päättelyn hyödyt:
- Läpinäkyvyys: Ajatusten ketju tarjoaa selkeän esityksen mallin päättelyprosessista, mikä mahdollistaa kehittäjien tarkastella ja ymmärtää sen päätöksentekoa.
- Turvallisuus ja yhdenmukaisuus: Turvallisuuskäytäntöjen integrointi ajatusten ketjuun on osoittanut lupaavia tuloksia mallin turvallisuuden ja ihmisten arvojen kanssa yhdenmukaisuuden parantamisessa.
Rajoitukset ja huomioon otettavat asiat:
- Ei ihanteellinen kaikille tehtäville: Vaikka o1-preview menestyy hyvin päättelyintensiivisillä aloilla, se ei välttämättä sovi kaikkiin luonnollisen kielen käsittelytehtäviin, kuten ihmisten mieltymyksiä arvioivissa testeissä on havaittu.
- Ajatusten ketjun näkyvyys: Tällä hetkellä raakaa ajatusten ketjua ei näytetä suoraan käyttäjille, vaan sen sijaan käytetään mallin tuottamaa yhteenvetoa. Tämä päätös pyrkii tasapainottamaan läpinäkyvyyden, käyttökokemuksen ja mahdollisen väärinkäytön välillä.
Kaiken kaikkiaan OpenAI o1-preview edustaa merkittävää edistysaskelta tekoälyn päättelyssä, laajentaen mallin kykyjen rajoja ja avaten uusia mahdollisuuksia tekoälysovelluksille eri aloilla.
Linkkejä (avautuvat uudessa selain ikkunassa)
- OpenAI
- GPT-4o
- GPT-o1
- ChatGPT
- Google Gemini
- Kuvageneraattoreita:
- Arenen suositukset ammattikorkeakouluille tekoälyn hyödyntämisestä
- Tekoälyn pikaopas – Näin käytät tekoälyä tietotyössä (pdf), Lauri Järvilehto
- ChatGPT-opas ensiaskeleen ottavalle opettajalle, Otavia opisto
- Suomalainen tutkimushanke Generation AI
- Tekoälyn vastuullinen hyödyntäminen
- Kursseja aiheesta