Nyt kaikki vaan kailottavat tekoälystä
Tekoälystä puhuvat nyt kaikki. Kun ChatGPT (OpenAI) putkahti alkuvuodesta 2023 markkinoille niin sanotusti ”urku auki”, herätti se suurta huomiota ja palvelu tukkeutui lukemattomien käyttäjien kirjautuessa sen sivustolle samanaikaisesti. ChatGPT:n kehitys on ollut huikeaa kuluvan kevään aikana. Luonnollisesti tämä alusta kehittyy päivä päivältä sinne tehtyjen hakujen myötä.
Mitä tekoäly on?
Mitä tekoäly oikeastaan on? Miten tekoäly toimii? Nämä kaksi kysymystä todennäköisesti askarruttavat meitä asiasta vähän vähemmän tietäviä. Asiasta enemmän ymmärtävät puhuvat kielimalleista tai kielimallista, kun he tarkoittavat tekoälyä. Mielenkiintoinen Juha Yli-Hemmingin pitämä luento, Seinäjoen ammattikorkeakoululla 16.5.2023, avasi asiaa. Yli-Hemmingin (2023, i.a.) puheessa toistui sanojen ChatGPT ja kielimalli lisäksi myös sana neuroverkko. Hän avasi tätä käsitettä tarkemmin luennollaan.
Yli-Hemminki (2023, i.a) huomautti heti luennon alussa, että tekoäly terminä tarkoittaa laajasti eri asioita eikä sitä siksi ole kovin helppoa määritellä. Kautto & Mannila (2023, i.a.) ovat tiivistäneet, eri lähteiden avulla, tekoälyn olevan koneen kykyä käyttää päättelyä, oppimista, suunnittelua ja luomista. Nämä taidot ovat aiemmin liitetty yksinomaan ihmisen älyyn.
Tässä kirjoituksessa lähdetään tarkastelemaan ChatGPT:ä ja muita kirjoituksessa käsiteltyjä tekoälyjä siitä näkökulmasta, että se on kielimalli/ne ovat kielimalleja, joka järjestelee/jotka järjestelevät sanoja annettujen käskyjen mukaiseen järjestykseen. Taustalla on siis algoritmi, joka on ohjelmoitu tiedon jäsentämiseen.
Neuroverkko, laaja kielimalli
Neuroverkon lisäksi Yli-Hemmingin puheessa vilahtivat myös sanat laaja kielimalli (Large Language Model) tekstuaaliseen opetusaineistoon perustuva neuroverkko, jossa maailma hahmottuu tekstin tulkinnan kautta. Neuroverkossa jokaisella verkon neuronilla on kynnysarvo (BIAS), jolla säädetään neuronin toimintaa. Suuria kielimalleja ovat mainittu ChatGPT, Lamda ja BARD. (Katso myös Heikinniemi, 2023, i.a.)
Käytännössä tekoäly on hiipinyt arkeemme vähitellen jo pitkän aika. Esimerkiksi meille, joilla on käytössämme älypuhelin ja siinä ennustava tekstinsyöttö, on käytössä kielimalli ja siispä tekoäly. Ennustavassa tekstinsyötössä käytetään tilastollisia kielimalleja (Laurila 2011). Olemme myös käyttäneet todennäköisesti erilaisia käännösohjelmia ja puhumattakaan hakukoneita, joita ilman emme oikeastaan enää edes osaa kuvitella maailmaa. (Katso Moore & Lewis, 2010, s. 220.)
Koneoppimista on kahta lajia
Yli-Hemminki (2023, i.a.) tuo esiin, että koneoppimista on kahta lajia valvottua ja valvomatonta. Kun algoritmin opettamiseen käytetty tieto on valmiiksi luetteloitua, on kyseessä valvottu koneoppiminen. Algoritmillä on tällöin tiedossa lähdemateriaalin lisäksi toivottavat tulokset oppimisvaiheessa (tähän liittyvät käsitteet regressio/lineaarinen). Valvomattomasta koneoppimisesta on kyse, kun ei ole ennalta tietoa lopputuloksista eikä käytettyä tietoa ole ennalta luetteloitu. Oppimisen syötteenä on järjestämätöntä tietoa ja tarkoitus on löytää käsitellystä datasta säännönmukaisuudet (tähän liittyy puolestaan käsite klusterointi).
Neuroverkkotekniikat keskiössä
Neuroverkkotekniikat ovat inspiroituneet ihmisen aivojen hermosolujen eli neuronien verkottuneesta rakenteesta. Neuroverkkotekniikat ovat vallanneet alaa joustavuutensa ja monipuolisuutensa avulla. Voinee sanoa, että ne ovat tekoälyn kehittämisessä avainasemassa. Ensiksi ne ovat olleet puheentunnistuksessa ja sittemmin äänihavainnoinnissa. Erilaisia neuroneja ja tapoja yhdistellä niitä on paljon ja siksi ne ovatkin niin monipuolisia käyttöalaltaan. (Virkkunen, Moisio, Grósz, & Kurimo, 2022, 58.) Myös Seppo Enäjärven (2018, s. 59–88) väitöskirjassa tarkastellaan neuroverkkomalleja luvussa neljä. Luku on otsikoitu 4. ”Neural Network Language Models.”
Tekoälyyn ja sen taustalla oleviin hermoverkkoihin liittyen, Cornellin yliopistossa kokoonpanolla Vaswani, Shazeer, Parmar, Uszkoreit, Jonens, Gomez, Kaiser, & Polosukhin (2017), kirjoitettu artikkeli: ”Attention is all you need.” lienee hyödyllinen tutustumisen kohde. Siinä on kerrottu perusteet tästä aihepiiristä.
Kuten esimerkiksi Kasneci ym. (2023, s. 1) toteavat, tärkeä kehitysaskel nykymuotoisten kielimallien kehityksessä on esikoulutuksen käyttö. Esikoulutuksesa kielimallia opetetaan ensiksi suurelle tietojoukolle ja vasta sen jälkeen sitä ryhdytään hienosäätämään tiettyihin tehtäviin. Tämä on käytännössä osoittautunut tehokkaaksi tekniikaksi, jonka avulla voidaan parantaa suorituskykyä useissa kielitehtävissä.
ChatCPT poikkeaakin aiemmin kehitetyistä kielimalleista siinä, että sen kouluttamiseen käytettiin huomattavan paljon laajempaa tietomäärää kuin mitä sitä aiemmin kehitettyihin vastaaviin sovelluksiin on käytetty.
Potentiaali, joka suurissa kielimalleissa on, on tunnistettu koulutuksessa. Malleja hyödyntämällä on mahdollista parantaa oppimis- ja opetuskokemuksia kaikilla koulutustasoilla. Jokaisella on mahdollisuus kehittää tehokkaasti omaa osaamistaan ja oppimiskokemuksia. (Kasneci ym., 2023, s. 2.) Ihannetapauksessahan mallia käytetään oman osaamisen lisäämisen ja opetetun sisällön parempaan ymmärtämiseen.
Laaja käyttöala
Tekstin tuottamisen ja erilaisiin kysymyksiin vastaamisen lisäksi, lisäksi tekoälyä on käytetty muun muassa puheen tunnistamisessa. Tästä on esimerkkinä Moisio, A., Porjazovski, D., Rouhe, A. ym. (2022) tekemä tutkimus, jossa suomenkielistä puhetta nauhoitettiin tiedostoiksi, jotta sitä voitaisiin hyödyntää tekoälyn tutkimuksessa ja kehityksessä sekä kielentutkimuksessa. Hanketta markkinoitiin laajasti TV-mainoksilla Ylen kanavilla (Lahjoita puhetta. Katso myös Mooren & Lewisin (2010) artikkeli.)
Tekoäly taipuu myös kuvantunnistukseen. Kuvantunnistuksen avulla voi hakea ja tunnistaa esimerkiksi sieniä metsässä ja vastaavasti lääketieteessä voidaan kuvahakua hyödyntää yksittäisten sairauksien tunnistamisessa, kuten esimerkiksi ihottumien tunnistamisessa.
Voinee myös pohtia sitä, millaisia vaikutuksia tekoälyllä on tutkimuksen analyysiin, esimerkiksi diskurssianalyysin analyysiin. Diskurssianalyysi on työskentelyä kielellä ja kielessä tekstiä tuottaessa (Pietilä i.a., s. 48).
Tekoäly ei aina vie oikeille jäljille
Tekoälyn, kuten kaikkien muidenkin apuvälineiden kanssa, taitaa olla niin, että vain oikein käytettynä siitä on mahdollisuus saada itselleen paras mahdollinen hyöty. Tausta ja teoria on hyvä tai voisi sanoa välttämätön tuntea, ettei joudu ikävään valoon ammattipiireissä. Tekoälyllä on nimittäin joskus taipumus hankkia lähteitä myös sellaisista ”tutkimuksista” joita ei ole koskaan tehty.
Mielenkiintoinen seikka on, että toimeksiannon sävy vaikuttaa lopputulokseen. Näyttää nimittäin siltä, että toimittaessa tekoälyn kanssa ilmaisuilla, miten asioita tekoälyltä kysyy, on väliä. Esimerkiksi Mäntylän (2023) haastattelema Risto Linturi huomauttaa, että kohtelias saa Chat GPT:ltä parempia vastauksia, sillä tekoälyä on koulutettu kohteliaiden ilmaisujen mukaan.
Kaiken kaikkiaan lienee hyvä muistaa, että tekoäly on nimenomaan tehtyä älyä. Sen taustalla on koodi, jonka on joku yksittäinen ihminen tai jotkut ihmiset koodanneet. Ymmärrykseni mukaan, sen taso on ainoastaan ja vain niin hyvää kuin sinne syötetty koodi ja data, jolla se on opetettu, on. Sen hyvyyteen vaikuttaa luonnollisesti myös ideologia, joka sen koodaajilla on. Ovatko siis tieteiselokuvien kauhuskenaariot jo ihan oven takana?
Margit Mannila
lehtori, KTT
SeAMK
Margit Mannila on lehtori ja KTT SeAMKissa, joka innostuu erityisesti yrittäjyydestä ja ympäristöoikeudesta. Mannilan intohimona on uusien asioiden oppiminen ja hän jäsentää asioita mielellään kirjoittamalla.
Lähteet
Enärvi, S. (2018). Modeling Conversational Finnish for Automatic Speech Recognition. Väitöskirja, kieliteknologia, Sähkötekniikan korkeakoulu, Aalto-yliopisto. Viitattu 19.5.2023. http://urn.fi/URN:ISBN:978-952-60-7908-0.
Heikinniemi, J. (2023). Kielimalleihin pohjautuva tekoäly avaa tuottavuusjuoksun. Devosoppma.. Viitattu 19.5.2023. https://www.devisioona.fi/2023/03/kielimalleihin-pohjautuva-tekoaly-avaa-tuottavuusjuoksun/
Kasneci, E., Sessler, K., Küchemann, S. Bannert, M., Dementieva, D., Fischer, F., Gasser, U., Groh, S., Günnemann, S., Hüllermeier, E., Krusche, S., Kutyniok, G., Tilman, M., Nerdel, C., Pfeffer, J., Poquet, O., Sailer, M., Schmidt, A., Seidel, T., Stadler, M., Weller, J., Kuhn, J. & Kasneci., G. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences 103, 102274. Viitattu 19.5.2023. https://doi.org/10.1016/j.lindif.2023.102274
Kautto, S., & Mannila, M. (6.2.2023). Tekoäly tulee mukaan
oppimisympäristöön. @SeAMK. Viitattu https://lehti.seamk.fi/yrittajyys-ja-
kasvu/tekoaly-tulee-mukaan-oppimisymparistoon/
Lahjoita puhetta. Yle.fi. Viitattu 22.5.2023. https://yle.fi/aihe/lahjoita-puhetta
Laurila, J. (2011). Tilastolliset kielimallit ennustavassa tekstinsyötössä. Opinnäytetyö. Informaatiotekniikka. Teknillisen fysiikan ja matematiikan tutkinto-ohjelma (TFM). Aalto-yliopisto. Helsinki. Viitattu 19.5.2023. http://urn.fi/URN:NBN:fi:aalto-201305162280
Moisio, A., Porjazovski, D., Rouhe, A., Getman, Y., Virkkunen, A., AlGhezi, R., Lennes, M., Grósz, T., Lindén, K. & Kurimo, M. (2022). Lahjoita puhetta: a large-scale corpus of spoken Finnish with some benchmarks. Language Resources and Evaluation. Viitattu 22.5.2023. https://link.springer.com/article/10.1007/s10579-022-09606-3
Moore, R.C. & Lewis, W. (2010). Intelligent Selection of Language Model Training Data. Proceedings of the ACL 2010 Conference Short Papers, pages 220–224, Uppsala, Sweden, 11-16 July 2010. c©2010 Association for Computational Linguistics. Viitattu 1.6.2023. https://aclanthology.org/P10-2041.pdf
Mäntylä, J-M. (2023). Tylytätkö tekoälyä – vai oletko sille kiltti? Risto Linturin mukaan kohtelias saa Chat GPT:stä parempia tuloksia. Yle.fi>Internet. Viitattu 23.5.2023. https://yle.fi/a/74-20029111
Open AI. Introducing ChatGPT. Viitattu 19.5.2023. https://openai.com/blog/chatgpt
Pietilä, V. (1986.). Diskurssianalyysistä. Katsauksia. Media & Viestintä 9(1), 48–57. Viitattu 23.5.2023. https://journal.fi/mediaviestinta/article/view/73716/35556
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jonens, L., Gomez, A.N., Kaiser, L. & Polosukhin, I. (2017). Attention is all you need. Computer Science> Computation and Language. Arxiv:1706.0762. Cornell University. Viitattu 19.5.2023. https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf
Virkkunen, A., Moisio, A., Grósz, T. & Kurimo, M. (2022). Mitä kone kuulee? Puheen ja äänten tunnistus vanhoista kotimaisista elokuvista. Lähikuva 4, 57–69
Yli-Hemminki, J. (2023). Tekoäly. Sisäinen koulutusluento. Seinäjoen ammattikorkeakoulu. Kuunneltu 16.5.2023 Tallenne saatavissa SeAMK:n sisäisessä verkossa https://epedufi-my.sharepoint.com/:v:/g/personal/juha_yli-hemminki_seamk_fi/EXvsFaUiBnJKg8gBf6tpZ4UBR2gPUhxxhC3t9IpGw4jyug