Eksaktit testit ratkaisuna pienten otosten tilastoanalyysiin opinnäytteissä

Kyselytutkimuksen tekijän haasteena on usein saada riittävä määrä vastauksia, ja otoskoot jäävät usein harmillisen pieniksi. Pieni otoskoko vaikeuttaa tulosten tilastollista analyysiä, kun esimerkiksi kahden kategorisen muuttujan keskinäisen riippumattomuuden tutkimisessa usein käytettävän Pearsonin χ2-testin (khiin neliö -testin) käyttöedellytykset eivät täyty. Tätä testiä voi käyttää vain, jos 2 x 2 -taulukossa (nelikenttä) ei ole yhtäkään alle viiden (5) suuruista odotettua frekvenssiä. Suuremmissa taulukoissa niitä saa olla enintään viidesosassa soluista (20 %), mutta alle yhden (1) suuruisia odotettuja frekvenssiä ei saa olla lainkaan. On osoittautunut, että näitä ehtoja ei aina ole noudatettu opinnäytteissä, jolloin saadut tulokset eivät ole valideja.
Vaihtoehtona silloin, kun χ2-testin käyttöedellytykset eivät täyty, on harkita eksaktin testin käyttöä. Eksakti testi on käyttökelpoinen hyvin pienelläkin tapausmäärällä, kuten seuraavan taulukon 1 (kuvitteellinen) esimerkki (Kempas & Tuuri, 2018, s. 330) osoittaa.
Taulukko 1. Esimerkki eksaktien testien käyttökelpoisuudesta pienelläkin aineistolla (Kempas & Tuuri, 2018, s. 330).
Pidätkö enemmän oluesta vai siideristä?
Fisherin eksaktin testin tulos on p=,0152, mikä tarkoittaa tilastollisesti merkitsevää eroa sukupuolten välillä, jos merkitsevyysrajana on usein käytetty p <,05. Taulukko tuo samalla esiin testin soveltumisen myös hyvin pieneen aineiston analyysiin (N=11), ja kuten havaitaan, solun havaittu frekvenssi saa olla myös 0. Viimeksi mainittu on tosin sallittua myös χ2-testissä mutta 0-arvo etenkin useammassa kuin yhdessä solussa johtaa helposti liian alhaisiin odotettuihin frekvensseihin, jotka puolestaan estävät testin käytön.
Fisherin eksakti (eli tarkka) testi on tunnetuin 2 x 2 -taulukolle tarkoitetuista eksakteista testeistä. Se löytyy myös SPSS-ohjelmasta, jolloin ohjelma laskee esim. χ2-testiä tehtäessä samalla myös Fisherin eksaktin testin p-arvon. Lisäksi internetistä löytyy helppokäyttöisiä ohjelmia, jotka tekevät analyysin kenttään syötetyille arvoille. Tällainen ohjelma löytyy mm. sivustolta Social Science Statistics (i.a.).
Fisherin testin ohella saatavilla on muitakin eksakteja testejä, kuten esim. Barnardin, Boschloon ja Yulen (Q) testit. Eksaktit eli tarkat testit eroavat nimensä mukaisesti approksimaatioista kuten χ2-testistä siinä, että ne laskevat p-arvon havaittujen arvojen hypergeometrisesta jakaumasta, mistä syystä suuremmalle otoskoolle ei ole tarvetta (Fisher’s Exact Test, i.a.). Lähtökohtana on nollahypoteesi, eli että havaittu ero johtuu satunnaisvaihtelusta, eli mitä pienempi p:n arvo on, sitä suurempi todennäköisyys, että havaittu ero selittyy muilla syillä kuin sattumalla. Se että taulukoissa olevat lukuarvot ovat pieniä, voi olla hämäävää: eksaktien testien suorittaminen vaatii tosiasiassa suurta laskentatehoa, mistä syystä eksaktit testit ovat perinteisesti rajoittuneet 2 x 2 -taulukkoihin ja pieniin lukuarvoihin. Eksaktia testiä ei voi suorittaa itse laskemalla, vaan se vaatii aina tietokoneen, päinvastoin kuin χ2-testi, jota entisaikoina tehtiin taskulaskimen avulla kaavaa soveltaen ja satunnaislukutaulukkoa apuna käyttäen.
Käytännön esimerkki SPSS-ohjelman tuottamasta tulosteesta
Seuraavassa havainnollistetaan kuvitteellisella aineistolla, miten SPSS-tilasto-ohjelman käyttäjä saa χ2-testin valitessaan tulosteessa samalla myös Fisherin eksaktin testin tuloksen. Taulukossa 2 on ristiintaulukoitu ”aineiston” jakauma. Jo etukäteen voi aavistaa, että χ2-testin käyttöehdot eivät mitä todennäköisimmin täyty.
Taulukko 2. Kuvitteellisen aineiston ristiintaulukointi.
Pidätkö enemmän Tuplasta vai Geishasta?
Seuraavasta kuvasta ilmenee tuloste, jonka SPSS tuotti aineistolle tehdystä χ2-testistä.
Kuva 1. SPSS-tuloste.
Ensimmäiseksi alaviitteen a tekstistä havaitaan, että taulukon 2 kahdessa solussa (50 %) odotetut frekvenssit jäävät alle viiden (5). Kuten yllä todettiin, 2 x 2 -taulukossa ei tällaisia saa olla lainkaan. Tämä tarkoittaa, ettei χ2-testin tulosta (p=,146) tule ottaa huomioon eikä raportoida, koska se perustuu testin virheelliseen käyttöön.
Sen sijaan Fisherin eksaktin testin tulos (p=,262) täysin on validi. Lähtökohtaisesti tarkastellaan vain kaksisuuntaista (2-sided) arvoa. Käytettäessä merkitsevyysrajaa p <,05 saatu tulos tarkoittaa, että miesten ja naisten välillä ei ole tilastollisesti merkitsevää eroa siinä, pitääkö vastaaja enemmän Tuplasta vai Geishasta (vrt. taulukko 1, jossa kuvitteellisessa aineistossa havaitaan merkitsevä ero).
Lopuksi
Edellä esitetty voi tarjota opinnäytteen tekijöille vinkkejä, miten eksakti testi toimii pienelläkin aineistolla. Tilastoanalyysi tarjoaa tutkimustulosten käsittelyyn mielenkiintoisen lisän, täydentämään perinteisesti raportoitavia seikkoja kuten prosentuaalisia arvoja ja keskilukuja. Tätä kirjoitettaessa eksaktit testit soveltuvat lähtökohtaisesti 2 x 2 -taulukkoon, mutta tietokoneiden laskutehon jatkuvasti kasvaessa voi odottaa testin käytön laajenevan tulevaisuudessa tätä suurempiinkin taulukkoihin.
Ilpo Kempas
FT, dosentti, lehtori
SEAMK
Ilpo Kempas on filosofian tohtori ja dosentti, joka työskentelee romaanisten kielten ja englannin lehtorina Seinäjoen ammattikorkeakoulussa, opettaen myös tutkimuskirjoittamista. Kempas on kielentutkija, jonka tutkimusaloja ovat romaaniset kielet ja tieteellinen kirjoittaminen.
Lähteet
Fisher s Exact Test: Fisher s Exact Test and Yule s Q: The Precision Pair. (i.a.). FasterCapital. https://www.fastercapital.com/content/Fisher-s-Exact-Test–Fisher-s-Exact-Test-and-Yule-s-Q–The-Precision-Pair.html
Kempas, I. T., & Tuuri, H. (2018). Eksaktit testit testissä: Fisher, Barnard ja Boschloo. teoksessa S. Päällysaho, J. Latvanen, S. Saarikoski, & S. Uusimäki (Toim.), Seinäjoen ammattikorkeakoulu monipuolisena vaikuttajana (s. 326–334). (Seinäjoen ammattikorkeakoulun julkaisusarja. A. Tutkimuksia.; Nro 30). Seinäjoen ammattikorkeakoulu. http://urn.fi/URN:ISBN:978-952-7109-93-9
Social Science Statistics. (i.a.). Easy Fisher Exact Test Calculator. https://www.socscistatistics.com/tests/fisher/default2.aspx#google_vignette