Oppikirjakappale

Regressio, korrelaatio ja koestrategia

Regressioluku ei ole vain suoran piirtämistä. Se on aineiston tulkintaa: kuinka vahva yhteys näkyy, mitä kulmakerroin tarkoittaa käytännössä ja milloin ennusteeseen ei pidä luottaa. Tämä on juuri sitä matemaattista lukutaitoa, jota Valintakoe F mittaa.

Käsitteet

Tavoitteet

Mitä tämän luvun jälkeen pitää osata?

Osaat lukea hajontakuviosta yhteyden suunnan ja voimakkuuden.

Ymmärrät regressiosuoran kulmakertoimen ja vakiotermin käytännön tulkinnan.

Pystyt tekemään yksinkertaisen ennusteen mallin avulla ja arvioimaan, onko se uskottava.

Tunnistat korrelaation ja kausaliteetin eron.

Osaat sanoa, milloin ekstrapolaatio on riskialtis.

Ydinsanat

Käsitesanasto ja koevocabulary

hajontakuvioregressiosuorakulmakerroinvakiotermiselittävä muuttujaselitettävä muuttujakorrelaatioekstrapolaatio

Harjoittele käsitteitä piilotuksella. Valitse ensin kumpaa haluat arvata: selitystä vai käsitteen nimeä.

Kortti 1

Käsite

Selittävä muuttuja

Kortti 2

Käsite

Selitettävä muuttuja

Kortti 3

Käsite

Ekstrapolaatio

Teoria

1. Hajontakuvio kertoo ensin suunnan, sitten vasta tarkkuuden

Hajontakuviossa jokainen piste on yksi havainto. Ensimmäinen kysymys on, nousevatko pisteet, laskevatko ne vai muodostavatko ne hajanaisen pilven. Tämä kertoo yhteyden suunnan. Vasta tämän jälkeen arvioidaan, kuinka tiiviisti pisteet asettuvat jonkin suoran ympärille.

Jos pisteet asettuvat melko lähelle nousevaa suoraa, yhteys on positiivinen ja kohtalaisen vahva. Jos pisteet ovat hajallaan, yhteys voi olla heikko tai sitä ei käytännössä ole. Koetehtävässä tämä sanallinen lukutaito on yhtä tärkeä kuin mahdollinen laskeminen.

Hyvä tulkinta kuvaa aina sekä suunnan että hajonnan: yhteys on positiivinen mutta hajonta on melko suurta.

Ydinmuistiinpano

Katso hajontakuviosta ensin suunta ja vasta sitten voimakkuus.

Muista nämä

  • Nouseva pistepilvi → positiivinen yhteys.
  • Laskeva pistepilvi → negatiivinen yhteys.
  • Hajanaisuus kertoo yhteyden epävarmuudesta.

Harjoittele juuri tätä alaotsikkoa

Fokus: Hajonta, korrelaatio ja yhteyden tulkinta

KorrelaatioAineiston tulkintaFrekvenssijakaumatRegressio

Teoria

2. Regressiosuora muuntaa havainnot ennusteeksi

Regressiosuora on malli, joka kuvaa keskimääräistä yhteyttä muuttujien välillä. Jos suoran yhtälö on y = 2,5x + 10, kulmakerroin 2,5 kertoo, että kun x kasvaa yhdellä yksiköllä, y kasvaa mallin mukaan keskimäärin 2,5 yksikköä.

Vakiotermi kertoo mallin ennusteen silloin, kun x = 0. Talousaineistossa tämä ei aina ole käytännössä mielekäs tilanne, joten tulkinta pitää tehdä varoen. Kulmakertoimen merkitys on usein tärkeämpi kuin vakiotermin sinänsä.

Koetehtävässä pisteitä tulee erityisesti siitä, että osaat yhdistää kulmakertoimen ilmiöön: esimerkiksi mainonnan lisäys, hintatason nousu tai opiskeluajan kasvu.

Ydinmuistiinpano

Kulmakerroin kertoo muutoksen suunnan ja nopeuden mallissa.

Muista nämä

  • Kulmakerroin = paljonko y muuttuu, kun x kasvaa yhdellä.
  • Vakiotermi = mallin y-arvo kohdassa x = 0.
  • Tulkinta pitää liittää aineiston merkitykseen.

Harjoittele juuri tätä alaotsikkoa

Fokus: Regressio ja mallintaminen

Regressio

Teoria

3. Korrelaatio ei vielä todista syy-seurausta

Korrelaatio kertoo, liikkuvatko muuttujat samaan vai vastakkaiseen suuntaan. Se ei kuitenkaan yksin kerro, aiheuttaako toinen muuttuja toisen. Molempien taustalla voi vaikuttaa kolmas tekijä, tai yhteys voi olla osittain sattumaa.

Pääsykokeessa vahva tulkinta on varovainen. Se sanoo esimerkiksi, että aineisto viittaa positiiviseen yhteyteen, mutta pelkkä korrelaatio ei riitä osoittamaan kausaliteettia. Tämä erottaa tarkan aineistonlukijan liian pitkälle menevästä tulkitsijasta.

Sama koskee ekstrapolaatiota. Mallilla voi arvioida lähellä havaintoaluetta, mutta kauas aineiston ulkopuolelle tehty ennuste on epävarmempi.

Ydinmuistiinpano

Yhteys ei automaattisesti tarkoita syy-seurausta.

Muista nämä

  • Korrelaatio kuvaa yhteyttä, ei todistettua syytä.
  • Kolmas tekijä voi selittää havaittua yhteyttä.
  • Ekstrapolaatio kasvattaa epävarmuutta.

Harjoittele juuri tätä alaotsikkoa

Fokus: Hajonta, korrelaatio ja yhteyden tulkinta

Korrelaatio

Pikatesti

Tarkista ymmärrys ennen pidempiä tehtäviä

Valitse vastaus, tarkista heti palaute ja varmista, että luvun peruskäsitteet ovat oikeasti hallussa.

Tarkistetut0 / 3Oikein0

Kysymys 1

Mitä vakiotermi kertoo mallissa y = 2,5x + 7?

Kysymys 2

Miksi mallin ennuste voi olla heikko kaukana aineiston ulkopuolella?

Kysymys 3

Mikä on vahvan regressiotulkinnan tärkein ehto?

Esimerkit

Katso ensin ratkaistut esimerkit

Esimerkki 1: Kulmakertoimen tulkinta

Regressiomalli on y = 1,8x + 12. Mitä kulmakerroin 1,8 tarkoittaa?

  1. Kulmakerroin kertoo y:n keskimääräisen muutoksen, kun x kasvaa yhdellä yksiköllä.
  2. Siksi mallissa y kasvaa keskimäärin 1,8 yksikköä jokaista x:n lisäystä kohti.
  3. Tulkinta pitää vielä sitoa siihen, mitä x ja y tehtävässä tarkoittavat.

Vastaus: Kun x kasvaa yhdellä, y kasvaa mallin mukaan keskimäärin 1,8 yksikköä.

Esimerkki 2: Ennuste mallista

Käytä mallia y = 1,8x + 12, kun x = 5.

  1. Sijoita x = 5 malliin.
  2. y = 1,8 × 5 + 12 = 9 + 12 = 21.
  3. Tarkista, onko x = 5 havaintoalueen sisällä vai ulkopuolella.

Vastaus: Mallin ennuste on 21.

Esimerkki 3: Korrelaatio ja kausaliteetti

Aineistossa opiskeltujen tuntien ja pistemäärän välillä näkyy positiivinen korrelaatio. Mitä voidaan päätellä?

  1. Positiivinen korrelaatio kertoo, että suurempi opiskeluaika liittyy usein suurempaan pistemäärään.
  2. Pelkkä korrelaatio ei silti todista, että opiskeluaika yksin aiheuttaa eron.
  3. Taustalla voi olla myös muita tekijöitä, kuten lähtötaso tai opiskelutapa.

Vastaus: Aineisto viittaa positiiviseen yhteyteen, mutta ei yksin todista syy-seuraussuhdetta.

Esimerkki 4: Regressiomallin tulkinta aineistosta

Aineistossa markkinointikulujen x ja myynnin y välinen malli on y = 2,4x + 18, missä x on tuhansia euroja ja y kymmeniä tuhansia euroja. Miten malli tulkitaan?

  1. Kulmakerroin 2,4 kertoo, että kun markkinointikuluja lisätään 1000 euroa, myynti kasvaa mallin mukaan keskimäärin 2,4 × 10 000 euroa eli 24 000 euroa.
  2. Vakiotermi 18 kertoo mallin mukaisesta myynnin tasosta silloin, kun markkinointikuluja ei ole lainkaan. Tässä se tarkoittaa 180 000 euroa.
  3. Tulkinnan pitää pysyä aineiston yksiköissä. Muuten numero on helppo lukea väärin.
  4. Lopuksi arvioidaan, onko malli uskottava vain aineiston sisällä vai myös sen ulkopuolella.

Vastaus: Malli sanoo, että 1000 euron lisäys markkinointiin liittyy keskimäärin noin 24 000 euron lisäykseen myynnissä, ja nollakulujen lähtötaso olisi mallissa 180 000 euroa.

Koevinkit

  • Tunnista hajontakuvion suunta ja hajonta ennen mahdollista laskua.
  • Tulkitse kulmakerroin käytännön kielelle, älä jätä sitä vain numeroksi.
  • Muista kirjoittaa, jos kyse on vain korrelaatiosta eikä todistetusta syystä.

Yleiset virheet

  • Kulmakertoimen ja vakiotermin sekoittaminen.
  • Korrelaation tulkitseminen automaattisesti syy-seuraukseksi.
  • Mallin käyttö kauas havaintoalueen ulkopuolelle ilman varovaisuutta.

Harjoitukset

Ratkaise ensin itse, avaa vasta sitten ratkaisu

Tehtävä 1

Harjoitus 1

Mallina on y = 3x + 5. Tulkitse kulmakerroin ja laske ennuste, kun x = 4.

Tehtävä 2

Harjoitus 2

Miksi hajontakuvion voimakas positiivinen korrelaatio ei vielä todista kausaliteettia?

Tehtävä 3

Harjoitus 3

Milloin lineaarisen mallin käyttö ennusteeseen on erityisen epävarmaa?