Regressionsanalys

Från Wikiskola
Hoppa till navigering Hoppa till sök


[redigera]
Mål för undervisningen Regressionsanalys

Regressionsanalys handlar om att anpassa en funktion (graf) till en serie data. Det kan exempelvis vara mätvärden som inte exakt följer den teoretiska modelen.


Här ska vi titta närmare på begreppen korrelation och regressionsanalys. Med hjälp av dessa begrepp kan vi finna samband i serier av observationsvärden. Regression används för att skapa en funktion som bäst passar observerad data. Korrelation anger styrkan av ett samband mellan två variabler.

Linjär regression

Regressionslinjen i blått är funktionen som bäst approximerar de röda datapunkterna
Definition

Regressionsanalys, regression, är en gren inom statistik där målet är att skapa en funktion som bäst passar observerad data.

Vid enkel linjär regression utgår man från att en rät linje kan anpassas till data och regressionsekvationen är då

y=kx+m,

där y (vertikal) är den beroende (den som påverkas) variabeln och x (horisontell) är den oberoende (den som påverkar). Interceptet med y-axeln m och lutningen k beräknas så att felet jämfört med observerade data blir så litet som möjligt. Felet kan beräknas med exempelvis minstakvadratmetoden.


Korrelation och kausalitet

Kausalitet, eller orsakssamband, innebär en form av nödvändighet i relationen mellan empiriska fenomen (ting eller händelser). Om kausalitet råder mellan två fenomen, kallas det ena orsak och det andra verkan. Statistiska samband kan sakna orsakssamband: två relaterade händelser kan till exempel bero på en tredje händelse.

Definition

Korrelation anger inom statistiken styrkan och riktningen av ett samband mellan två eller flera variabler.

Kausalitet, eller orsakssamband, innebär en form av nödvändighet i relationen mellan empiriska fenomen (ting eller händelser). Om kausalitet råder mellan två fenomen, kallas det ena orsak och det andra verkan.

Stark, svag och obefintlig korrelation.
Stark, svag och obefintlig korrelation.

Debatten i media (kanske i synnerhet sociala medier) innehåller många (ibland medvetna) missuppfattningar där en korrelation presenteras som ett kausalt samband, det vill säga ett orsak och verkan-samband.

Kausalitet handlar om orsak och verkan. Korrelation innebär inte att det måste finnas en kausalitet

Kul exempel: Spurious correlations