Regressionsanalys

Från Wikiskola
Hoppa till navigering Hoppa till sök


[redigera]
Mål för undervisningen Regressionsanalys

Regressionsanalys handlar om att anpassa en funktion (graf) till en serie data. Det kan exempelvis vara mätvärden som inte exakt följer den teoretiska modelen.


Här ska vi titta närmare på begreppen korrelation och regressionsanalys. Med hjälp av dessa begrepp kan vi finna samband i serier av observationsvärden. Regression används för att skapa en funktion som bäst passar observerad data. Korrelation anger styrkan av ett samband mellan två variabler.

Linjär regression

Regressionslinjen i blått är funktionen som bäst approximerar de röda datapunkterna
Definition

Regressionsanalys, regression, är en gren inom statistik där målet är att skapa en funktion som bäst passar observerad data.

Vid enkel linjär regression utgår man från att en rät linje kan anpassas till data och regressionsekvationen är då

[math]\displaystyle{ y=kx + m, \, }[/math]

där y (vertikal) är den beroende (den som påverkas) variabeln och x (horisontell) är den oberoende (den som påverkar). Interceptet med y-axeln m och lutningen k beräknas så att felet jämfört med observerade data blir så litet som möjligt. Felet kan beräknas med exempelvis minstakvadratmetoden.


Korrelation och kausalitet

Kausalitet, eller orsakssamband, innebär en form av nödvändighet i relationen mellan empiriska fenomen (ting eller händelser). Om kausalitet råder mellan två fenomen, kallas det ena orsak och det andra verkan. Statistiska samband kan sakna orsakssamband: två relaterade händelser kan till exempel bero på en tredje händelse.

Definition

Korrelation anger inom statistiken styrkan och riktningen av ett samband mellan två eller flera variabler.

Kausalitet, eller orsakssamband, innebär en form av nödvändighet i relationen mellan empiriska fenomen (ting eller händelser). Om kausalitet råder mellan två fenomen, kallas det ena orsak och det andra verkan.

Stark, svag och obefintlig korrelation.
Stark, svag och obefintlig korrelation.

Debatten i media (kanske i synnerhet sociala medier) innehåller många (ibland medvetna) missuppfattningar där en korrelation presenteras som ett kausalt samband, det vill säga ett orsak och verkan-samband.

Kausalitet handlar om orsak och verkan. Korrelation innebär inte att det måste finnas en kausalitet

Kul exempel: Spurious correlations

[redigera]

Läs artikeln och diskutera (i chatten). Vad är korrelation och vad är kausalitet i detta fall?

Blodtrycket behöver inte vara orsak till coronadödsfall - SVT Nyheter

Citat

Jag tycker artikeln är ett bra exempel på att vi som konsumerar nyheter bör vara kritiska och att det underlättar om man förstår skillnaden mellan korrelation och kausalitet.

[redigera]

Regression i GeoGebras Grafräknare

  1. Lägg in dina punkter manuellt.
  2. Skapa en lista med Lista= {A,B,C,D,E,F}
  3. Skriv RegressionLin(Lista)

Andra kommandon

Exponentialfunktioner anpassas med kommandot Regression Exp.
Anpassning till falfri funktion får du med kommandot: [math]\displaystyle{ Regression( \lt Lista med Punkter\gt , \lt Funktion\gt ) }[/math] Du måste skapa funktionen i förväg. Skapa en generell funktion med glidare, till exempel [math]\displaystyle{ f(x) = a x^2 + b x + c }[/math]

Prova även kommandot:'

[math]\displaystyle{ Korrelation(Lista) }[/math]

En liten film

Korrelation i GGB Classic

[redigera]

Övning

  1. Tag en bild av ett diagram och infoga i GeoGebra. (funkar bara i Classic) Infoga bild ligger under knappen a =
  2. Sätt in punkter ovanför staplarna i diagrammet.
  3. Skapa en lista
  4. Gör regressionsanalys för exponentialfunktioner.

Detta blir resultatet:

Relevant matematik som man blir riktigt glad av.

Inlämningsuppgift

Uppgift
  1. Organisera en datainsamling i klassen eller på skolan där så många personer som möjligt anger sin längd och skostorlek. Be gärna om fler datapunkter.
  2. Undersök om längd och skostorlek är normalfördelade.
  3. Undersöka om det finns ett samband mellan längd och skostorlek.
  4. Leta efter data i nyheterna och gör regressionsanalys på dem. Vilken funktion hittar du? Viika slutsatser kan du dra.


Det är lämpligt att ni arbetar två och två.

Inlämningen kan ske i form av en GeoGebra eller Excel med textrutor med resonemnag och förklaringar.

Vi kommer att bedöma modell- och resonemangsförmåga.

Om ni ställer frågor som inte ger ett tal som svar (exempelvis ögonfärg) kan ni göra om text till tal. Se exempel nedan för Google klalkylark med kommando SWITCH.

[redigera]
Swayen till detta avsnitt: [https xxx]




Linjär regression med GGB

Anpassa en andragradskurva till tre eller fler punkter

Pendeln

Uppgift
Pendellabb

Första kolumnen visar snörets längd för en pendel. I andra kolumnen visas tiden för fem svängningar. Därefter räknas svängningstiden för en svängning ut. I GGB kan man göra regression och pröva räta linjen, en andragradsfunktion och en potensfunktion.

Läs mer om hur Pendeln fungerar.


Facit: Så här kan en regressionsanalys av pendeldata (i Classic) se ut. Vilken slutsats drar du?

Linjär regression med GGB Classic

  1. Använd GeoGebra Classic.
  2. Skriv in dina värden i två kolumner.
  3. Klicka Skapa en lista med punkter.
  4. Skriv in RegressionLin(Lista_{1}) i inmatningsfönstret
  5. Eventuellt behöver du högerklicka för att visa axlar.

Se exempel.

Exit ticket