Oppikirjakappale

Otanta, luotettavuus ja tilastollinen päättely

Tilastoihin luotetaan vain, jos ymmärretään miten ne on tuotettu. Otanta, perusjoukko, edustavuus ja epävarmuus ovat keskeisiä käsitteitä sekä pääsykokeessa että arjen uutisissa. Tässä luvussa opit lukemaan tilastotietoa kriittisesti.

Käsitteet

Tavoitteet

Mitä tämän luvun jälkeen pitää osata?

Ymmärrät eron perusjoukon ja otoksen välillä.

Tunnistat, mistä otannan luotettavuus muodostuu.

Osaat arvioida, milloin tuloksista voi tehdä yleistyksiä.

Pystyt lukemaan tilastollisia väitteitä kriittisesti ja perustellusti.

Ydinsanat

Käsitesanasto ja koevocabulary

perusjoukkootosedustavuusvalikoitumisharhaluotettavuus

Harjoittele käsitteitä piilotuksella. Valitse ensin kumpaa haluat arvata: selitystä vai käsitteen nimeä.

Kortti 1

Käsite

Perusjoukko

Kortti 2

Käsite

Otos

Kortti 3

Käsite

Edustavuus

Kortti 4

Käsite

Valikoitumisharha

Teoria

1. Otantatutkimus kuvaa osaa, mutta pyrkii kertomaan kokonaisuudesta

Perusjoukko on se kokonaisuus, josta ollaan kiinnostuneita. Otos on tästä joukosta valittu osa, jonka perusteella tehdään päätelmiä. Koska koko perusjoukkoa ei yleensä voida tutkia, otos on käytännöllinen ratkaisu. Sen laatu ratkaisee kuitenkin, kuinka uskottavia päätelmät ovat.

Pääsykokeessa kannattaa painaa mieleen, että otoksen tehtävä on edustaa perusjoukkoa, ei olla vain suuri määrä havaintoja. Suurikin otos voi olla huono, jos se on vinoutunut.

Ydinmuistiinpano

Otoksen arvo ei riipu vain koosta vaan ennen kaikkea edustavuudesta.

Muista nämä

  • Perusjoukko on kokonaisuus, otos on sen osa.
  • Yleistys toimii vain, jos otos edustaa perusjoukkoa.
  • Suuri mutta vino otos voi olla huono.

Harjoittele juuri tätä alaotsikkoa

Fokus: Tunnusluvut, jakaumat ja otanta

KeskiarvoFrekvenssijakaumatAineiston tulkinta

Teoria

2. Luotettavuus rakentuu otantatavasta, koosta ja mittauksen laadusta

Jos otos on satunnainen ja riittävän suuri, tulokset ovat yleensä luotettavampia kuin pienessä tai valikoituneessa otoksessa. Luotettavuuteen vaikuttaa silti myös mittaustapa. Huonosti aseteltu kysymys tai epätarkka mittaus voi vääristää tulosta, vaikka otanta olisi hyvä.

Siksi tilastollinen luotettavuus ei ole vain matematiikkaa. Se liittyy myös tutkimusasetelmaan. Valintakokeessa vahva tulkinta huomioi sekä otannan että mittauksen.

Ydinmuistiinpano

Luotettavuus on otannan, koon ja mittauksen yhteisvaikutus.

Muista nämä

  • Satunnaisuus parantaa edustavuutta.
  • Suurempi otos vähentää satunnaisvaihtelun vaikutusta.
  • Huono kysymys voi pilata hyvänkin otoksen.

Harjoittele juuri tätä alaotsikkoa

Fokus: Luotettavuus, epävarmuus ja tulkinta

Aineiston tulkintaFrekvenssijakaumatKeskiarvo

Teoria

3. Kaikista havainnoista ei voi tehdä vahvoja yleistyksiä

Tilastollinen päättely tarkoittaa sitä, että otoksesta päätellään jotakin perusjoukosta. Tämä on järkevää vain silloin, kun otos on muodostettu asianmukaisesti ja epävarmuus tunnistetaan. Jos aineisto on kerätty esimerkiksi vapaaehtoisten verkkokyselynä, tulos voi kertoa enemmän vastaajista kuin koko väestöstä.

Pääsykoetehtävissä sinun ei yleensä tarvitse laskea monimutkaisia testejä, vaan arvioida väitteen uskottavuutta. Onko otos riittävä, onko valikoitumisharha mahdollinen, voiko tulos yleistyä? Nämä kysymykset ratkaisevat.

Ydinmuistiinpano

Yleistys vaatii perusteen: otoksen pitää oikeasti edustaa kokonaisuutta.

Muista nämä

  • Valikoitumisharha heikentää yleistettävyyttä.
  • Pieni otos voi johtaa sattumanvaraiseen tulokseen.
  • Hyvä tulkinta tunnistaa epävarmuuden, ei peitä sitä.

Harjoittele juuri tätä alaotsikkoa

Fokus: Yleistettävyys, harha ja epävarmuus

Aineiston tulkintaFrekvenssijakaumatKeskiarvo

Pikatesti

Tarkista ymmärrys ennen pidempiä tehtäviä

Valitse vastaus, tarkista heti palaute ja varmista, että luvun peruskäsitteet ovat oikeasti hallussa.

Tarkistetut0 / 2Oikein0

Kysymys 1

Mikä on suurin ongelma vapaaehtoiseen verkkokyselyyn perustuvassa tutkimuksessa?

Kysymys 2

Mikä tekee otoksesta hyödyllisen tilastolliseen päättelyyn?

Esimerkit

Katso ensin ratkaistut esimerkit

Esimerkki 1: Vapaaehtoinen kysely

Sivustolla toteutetaan vapaaehtoinen kysely opiskelijoiden stressistä. Voidaanko tulos yleistää kaikkiin hakijoihin?

  1. Vapaaehtoinen kysely voi houkutella tietynlaisia vastaajia, esimerkiksi niitä joilla aihe on erityisen ajankohtainen.
  2. Tällöin otos ei välttämättä ole edustava kaikista hakijoista.
  3. Yleistys kaikkiin hakijoihin on siis epävarma.

Vastaus: Tulosta ei voi suoraan yleistää kaikkiin hakijoihin, koska vapaaehtoinen otos voi olla valikoitunut.

Esimerkki 2: Suuri mutta vino otos

Kyselyyn vastaa 5 000 ihmistä, mutta kaikki vastaajat tulevat samasta kaupungista. Mitä ongelmaa tämä havainnollistaa?

  1. Vastaajia on paljon, joten määrä yksin näyttää vakuuttavalta.
  2. Koska kaikki vastaajat tulevat yhdestä ympäristöstä, aineisto ei välttämättä edusta laajempaa perusjoukkoa.
  3. Ongelma on edustavuus, ei vain otoksen koko.

Vastaus: Esimerkki näyttää, että suuri otos ei auta, jos se ei edusta koko perusjoukkoa.

Koevinkit

  • Kun näet tilastoväitteen, kysy heti: kuka on tutkittu ja miten heidät valittiin?
  • Älä anna suuren otoskoon hämätä, jos edustavuus on heikko.
  • Muista, että mittausvirhe voi olla yhtä vakava ongelma kuin huono otanta.

Yleiset virheet

  • Oletus, että suuri otos on aina luotettava.
  • Perusjoukon ja otoksen sekoittaminen.
  • Yleistys ilman, että valikoitumisriskiä huomioidaan.

Harjoitukset

Ratkaise ensin itse, avaa vasta sitten ratkaisu

Tehtävä 1

Harjoitus 1: Perusjoukko ja otos

Tunnista lyhyesti, mikä ero on perusjoukolla ja otoksella.

Tehtävä 2

Harjoitus 2: Edustavuus

Miksi satunnaisuus on tärkeää otantaa rakennettaessa?

Tehtävä 3

Harjoitus 3: Mittausvirhe

Miten huonosti muotoiltu kysymys voi heikentää tutkimuksen luotettavuutta?

Tehtävä 4

Harjoitus 4: Yleistys

Miksi pienestä ja valikoituneesta otoksesta tehty voimakas johtopäätös on ongelmallinen?