Oppikirjakappale

Jakaumat ja normaalijakauman tulkinta

Jakauman muoto kertoo, miten havainnot asettuvat, ja vaikuttaa suoraan siihen, mitä tunnuslukuja kannattaa käyttää. Normaalijakauma on tärkeä malli, mutta sitä ei saa käyttää automaattisesti. Tässä luvussa opit sekä jakauman muodon lukemisen että normaalijakauman järkevän tulkinnan.

Käsitteet

Tavoitteet

Mitä tämän luvun jälkeen pitää osata?

Osaat tunnistaa symmetrisen ja vinon jakauman peruspiirteet.

Ymmärrät, milloin keskiarvo ja mediaani käyttäytyvät eri tavoin.

Osaat tulkita normaalijakauman roolia aineistossa.

Tunnistat, milloin normaalijakauman käyttö on perusteltua ja milloin ei.

Ydinsanat

Käsitesanasto ja koevocabulary

jakaumavinousnormaalijakaumamediaanipoikkeuksellinen havainto

Harjoittele käsitteitä piilotuksella. Valitse ensin kumpaa haluat arvata: selitystä vai käsitteen nimeä.

Kortti 1

Käsite

Jakauma

Kortti 2

Käsite

Vinous

Kortti 3

Käsite

Normaalijakauma

Kortti 4

Käsite

Mediaani

Teoria

1. Jakauman muoto ohjaa tulkintaa

Symmetrisessä jakaumassa havainnot jakautuvat suunnilleen yhtä paljon keskitason molemmille puolille. Tällöin keskiarvo, mediaani ja usein myös moodi ovat lähellä toisiaan. Vinossa jakaumassa sen sijaan pitkä häntä vetää osaa tunnusluvuista puoleensa ja tulkinta muuttuu.

Tämä on tärkeää erityisesti silloin, kun verrataan tuloja, hintoja tai muita ilmiöitä, joissa ääriarvot ovat tavallisia. Jos jakauma on selvästi vino, mediaani voi kuvata tyypillistä havaintoa paremmin kuin keskiarvo.

Ydinmuistiinpano

Jakauman muoto vaikuttaa siihen, mitä tunnuslukua kannattaa painottaa.

Muista nämä

  • Symmetrinen jakauma tukee keskiarvon käyttöä.
  • Vino jakauma voi tehdä mediaanista informatiivisemman.
  • Muoto pitää arvioida ennen tunnusluvun valintaa.

Harjoittele juuri tätä alaotsikkoa

Fokus: Jakauman muoto, mediaani ja keskiarvo

FrekvenssijakaumatKeskiarvo

Teoria

2. Normaalijakauma on hyödyllinen malli, ei automaattinen oletus

Normaalijakaumassa suurin osa havainnoista on lähellä keskiarvoa ja ääripäät ovat harvinaisia. Monia luonnollisia mittaustuloksia tai suurista joukkoista muodostuvia ilmiöitä voidaan kuvata suunnilleen normaalijakaumalla. Siksi se on tärkeä tilastollinen malli.

Valintakokeessa virhe syntyy usein silloin, kun normaalijakaumaa käytetään ilman perustetta. Jos aineisto on selvästi vino, sisältää rajoja tai muodostuu useasta eri ryhmästä, normaalioletus voi olla huono. Hyvä tulkinta arvioi ensin, sopiiko malli tilanteeseen.

Ydinmuistiinpano

Normaalijakauma on käyttökelpoinen vain silloin, kun aineiston rakenne tukee sitä.

Muista nämä

  • Keskiarvo ja keskihajonta kuvaavat normaalijakaumaa hyvin.
  • Normaalioletus vaatii ainakin likimääräisen symmetrisyyden.
  • Mallia ei saa käyttää mekaanisesti.

Harjoittele juuri tätä alaotsikkoa

Fokus: Normaalijakauma ja mallin sopivuus

FrekvenssijakaumatAineiston tulkinta

Teoria

3. Poikkeavat havainnot saavat merkityksensä suhteessa hajontaan

Normaalijakaumaan liittyvä ajattelu auttaa ymmärtämään, milloin havainto on poikkeuksellinen. Jos arvo on hyvin kaukana keskiarvosta suhteessa keskihajontaan, se voi olla harvinainen tai kiinnostava. Tämä ei kuitenkaan vielä todista virhettä tai ongelmaa, vaan osoittaa että havainto poikkeaa tavallisesta tasosta.

Pääsykoetehtävissä poikkeavaa havaintoa voidaan pyytää tulkitsemaan esimerkiksi riskin, laadunvalvonnan tai poikkeuksellisen menestyksen näkökulmasta. Olennaista on perustella, miksi havainto on epätavallinen.

Ydinmuistiinpano

Poikkeavuus arvioidaan suhteessa jakauman keskukseen ja hajontaan.

Muista nämä

  • Suuri poikkeama ei automaattisesti tarkoita virhettä.
  • Harvinaisuus pitää perustella aineiston rakenteella.
  • Normaalijakauma auttaa arvioimaan tyypillisyyttä.

Harjoittele juuri tätä alaotsikkoa

Fokus: Poikkeavat havainnot ja hajonnan tulkinta

FrekvenssijakaumatAineiston tulkintaKeskiarvo

Pikatesti

Tarkista ymmärrys ennen pidempiä tehtäviä

Valitse vastaus, tarkista heti palaute ja varmista, että luvun peruskäsitteet ovat oikeasti hallussa.

Tarkistetut0 / 2Oikein0

Kysymys 1

Miksi mediaani voi olla keskiarvoa parempi tunnusluku vinoissa jakaumissa?

Kysymys 2

Milloin normaalijakauman käyttö on perustellumpaa?

Esimerkit

Katso ensin ratkaistut esimerkit

Esimerkki 1: Keskiarvo vai mediaani?

Asuntojen hinnat alueella ovat vahvasti oikealle vinoja. Kumpi kuvaa tyypillistä hintaa paremmin: keskiarvo vai mediaani?

  1. Oikealle vino jakauma tarkoittaa, että muutama korkea arvo nostaa keskiarvoa.
  2. Mediaani ei reagoi yhtä voimakkaasti näihin ääriarvoihin.
  3. Siksi mediaani kuvaa usein tyypillistä hintatasoa paremmin.

Vastaus: Mediaani on yleensä parempi, koska muutamat erittäin kalliit asunnot voivat nostaa keskiarvoa liikaa.

Esimerkki 2: Normaalioletuksen arviointi

Kuvaajassa havaitaan yksi selkeä huippu keskellä ja melko symmetrinen muoto molemmin puolin. Mitä tämä kertoo?

  1. Aineisto näyttää likimäärin symmetriseltä ja huippu on keskellä.
  2. Tällainen rakenne sopii usein normaalijakauman perusajatukseen.
  3. Silti kyse on arviosta, ei automaattisesta varmuudesta.

Vastaus: Aineisto voi olla suunnilleen normaalijakautunut, mutta oletus pitää tehdä havaintojen perusteella eikä mekaanisesti.

Koevinkit

  • Tarkista jakauman muoto ennen kuin päätät mitä tunnuslukua käytät.
  • Normaalijakauma on malli, ei oletus ilman näyttöä.
  • Kun puhut poikkeavasta havainnosta, suhteuta se aina aineiston hajontaan.

Yleiset virheet

  • Kaikkien jakaumien kohteleminen normaalijakaumina.
  • Keskiarvon käyttäminen automaattisesti vinoissa aineistoissa.
  • Poikkeavan havainnon nimeäminen virheeksi ilman perustelua.

Harjoitukset

Ratkaise ensin itse, avaa vasta sitten ratkaisu

Tehtävä 1

Harjoitus 1: Vinous

Miten vino jakauma voi vaikuttaa keskiarvoon ja mediaaniin?

Tehtävä 2

Harjoitus 2: Normaalioletus

Miksi normaalijakaumaa ei pidä käyttää automaattisesti kaikissa aineistoissa?

Tehtävä 3

Harjoitus 3: Poikkeava havainto

Mitä tarkoittaa, että havainto on poikkeuksellinen suhteessa keskihajontaan?

Tehtävä 4

Harjoitus 4: Tunnusluvun valinta

Milloin mediaani voi olla informatiivisempi kuin keskiarvo?