Lägesmått och spridningsmått: Skillnad mellan sidversioner
Hoppa till navigering
Hoppa till sök
Hakan (diskussion | bidrag) |
Hakan (diskussion | bidrag) |
||
(14 mellanliggande sidversioner av samma användare visas inte) | |||
Rad 7: | Rad 7: | ||
Vi repeterar medelvärde och lär oss hur man beräknar standardavvikelsen. Vi lär oss använda digitala verktyg för beräkningar och presentation av detta. | Vi repeterar medelvärde och lär oss hur man beräknar standardavvikelsen. Vi lär oss använda digitala verktyg för beräkningar och presentation av detta. | ||
}} | }} | ||
Medelvärde, median och typvärde är olika lägesmått. Kvartil, variationsbredd och standardavvikelse är spridningsmått. | |||
=== Medelvärde och standardavvikelse === | === Medelvärde och standardavvikelse === | ||
==== Medelvärde ==== | |||
Det lägesmått som är det vanligast använda kallas för medelvärdet. Medelvärdet är definierat som summan av alla ingående observationer dividerat med antalet observationer. Medelvärdet ger ofta en bra sammanfattning av en serie observationer, men om det är stor spridning på ens observationers värden kan man få ett visserligen korrekt, men missvisande, medelvärde. | |||
==== Median ==== | |||
Om vi sorterar alla våra observationer i storleksordning och sedan undersöker det värde som hamnar i mitten av denna sorterade serie observationer, så har vi hittat medianen. Har vi ett jämnt antal observationer i vår serie så har man inget enskilt observationsvärde som kan utgöra medianen - i dessa fall beräknar man medianen som medelvärdet av de två mittersta observationsvärdena. | |||
Medianen är ett lämpligare lägesmått än medelvärdet om vi har en serie observationer där det finns enstaka värden (mycket stora eller mycket små värden) som annars riskerar att leda till att medelvärdet ger en skev bild av serien som helhet. | |||
==== Typvärde ==== | |||
Det observationsvärde som förekommer flest antal gånger i en serie värden kallas för typvärdet. | |||
Medelvärde, median och typvärde är alla exempel på olika lägesmått. Lägesmått kan vara användbara eftersom de ger en snabb överblick över en stor mängd observationsvärden och därigenom förhoppningsvis säger någonting om värdena i serien. | |||
För att kunna jämföra olika serier observationsvärden vill vi även veta hur stor spridningen är bland värdena. På samma sätt som det finns olika lägesmått finns det olika spridningsmått. | |||
==== Standardavvikelse ==== | |||
Standardavvikelsen är ett spridningsmått som ofta används. | Standardavvikelsen är ett spridningsmått som ofta används. | ||
Med standardavvikelsen menar vi ett mått på den genomsnittliga avvikelsen från medelvärdet i en serie observationsvärden. Ju större standardavvikelsen är, desto större är spridningen bland våra observationsvärden. | |||
{{defruta |'''Medelvärde, variationsbredd och standardavvikelse''' | {{defruta |'''Medelvärde, variationsbredd och standardavvikelse''' | ||
Rad 28: | Rad 52: | ||
där s är standardavvikelsen, <math> \overline{x} </math> är medlevärdet och n är antalet värden. | där s är standardavvikelsen, <math> \overline{x} </math> är medlevärdet och n är antalet värden. | ||
}} | }} | ||
Definitionen ovan och formelsamlingen från Skolverket använder en formel för standardavvikelsen för ett stickprov (urval) där man dividerar med n-1. Det förekommer en formel där man delar med n vilken används för standardavvikelsen för hela mängden. | |||
Mycket av texten ovan kommer från [https://www.matteboken.se/lektioner/matte-2/statistik/lagesmatt Matteboken]. | |||
=== Varationsbredd och låddiagram === | === Varationsbredd och låddiagram === | ||
Rad 33: | Rad 61: | ||
[[Fil:Skolinspektionen anv lådagram.PNG|400px|höger]] | [[Fil:Skolinspektionen anv lådagram.PNG|400px|höger]] | ||
{{defruta|Låddiagram | ==== Variationsbredd ==== | ||
Ett enkelt mått på spridning i en serie observationsvärden är variationsbredd, som definieras som skillnaden (differensen) mellan det största och det minsta observationsvärdet i serien. | |||
==== Kvartiler ==== | |||
Ett bättre sätt att beskriva spridningen runt medianen är att dela in observationsvärdena i kvartiler. Kvartil betyder fjärdedel och dessa kvartiler kommer vi fram till genom att dela in våra storlekssorterade observationsvärden i fyra lika stora grupper. | |||
Det finns fem viktiga värden att hålla koll på när vi ska dela in våra observationsvärden i kvartiler: | |||
Det högsta värdet och det lägsta värdet, som är de mest extrema observationsvärdena vi har åt vardera hållet i serien. Dessa motsvarar alltså det största och det minsta värdet som vi använde då vi räknade ut variationsbredden tidigare i avsnittet. | |||
Vi behöver även känna till medianen, som ju delar våra storlekssorterade observationsvärden i två lika stora delar. | |||
De två sista värdena som vi måste ta reda på är den nedre kvartilen, som delar de lägre 50 % av värdena i två lika stora delar, och den övre kvartilen, som delar upp de högre 50 % av värdena i två lika stora delar. Detta innebär att 25 % av våra observationsvärden kommer att vara mindre än den nedre kvartilen och 75 % av observationsvärdena kommer att vara mindre än den övre kvartilen. | |||
Ofta betecknar man den nedre kvartilen som Q1, medianen som Q2 och den övre kvartilen som Q3. | |||
==== Lådagram ==== | |||
Med hjälp av de begrepp rörande kvartiler som vi har introducerat ovan kan vi åskådliggöra spridningen runt medianen med hjälp av lådagram. Ett annat ord är låddiagram och på engelska kallas det BoxPlot. | |||
Ett lådagram ritas på en tallinje och består av en låda (rektangel) vars vänstra respektive högra sida befinner sig vid den nedre respektive den övre kvartilen. Observationsvärdenas medianvärde är även markerat med en vertikal linje inuti lådagrammet. Från lådans respektive sidor sträcker sig en vågrät linje ut till det största respektive lägsta observationsvärdet i serien. | |||
{{defruta|'''Låddiagram''' | |||
Lådagram, låddiagram eller boxplot är ett diagram där ett statistiskt material åskådliggörs i form av en låda, som rymmer den mittersta hälften av materialet. Lådagrammet sammanfattar materialet med hjälp av fem värden: medianvärdet, undre och övre kvartilen samt minimum och maximum. Eventuella extremvärden betraktas som utliggare och markeras med egna symboler. | Lådagram, låddiagram eller boxplot är ett diagram där ett statistiskt material åskådliggörs i form av en låda, som rymmer den mittersta hälften av materialet. Lådagrammet sammanfattar materialet med hjälp av fem värden: medianvärdet, undre och övre kvartilen samt minimum och maximum. Eventuella extremvärden betraktas som utliggare och markeras med egna symboler. | ||
Rad 41: | Rad 93: | ||
Låddiagram är inte så vanligt förekommande i nyhetsprogram och tidningar men dyker ofta upp på prov i Ma2c. | Låddiagram är inte så vanligt förekommande i nyhetsprogram och tidningar men dyker ofta upp på prov i Ma2c. | ||
Det mesta av texten ovan kommer från [https://www.matteboken.se/lektioner/matte-2/statistik/kvartiler-och-ladagram Matteboken.se]. | |||
{{clear}} | {{clear}} | ||
= Genomgång - mått = | |||
<pdf>Fil:Lägesmått_och_spridningsmått.pdf</pdf> | |||
= Genomgång - Standaravvikelse = | |||
<pdf>Fil:Standaravvikelse.pdf</pdf> | |||
= Exempeluppgift - medelvärde = | = Exempeluppgift - medelvärde = | ||
Rad 86: | Rad 148: | ||
: Stapeldiagram: '''<nowiki> Stapeldiagram( <Lista med rådata>, <Staplarnas bredd>, <Vertikal Skalfaktor (optional)> ) </nowiki>''' | : Stapeldiagram: '''<nowiki> Stapeldiagram( <Lista med rådata>, <Staplarnas bredd>, <Vertikal Skalfaktor (optional)> ) </nowiki>''' | ||
: Stolpdiagram: '''<nowiki> Stolpdiagram( <Lista med punkter> ) </nowiki>''' Exempelvis <nowiki> Lista3= {A,B,C,D,E,F,G,H,I,J} </nowiki> | : Stolpdiagram: '''<nowiki> Stolpdiagram( <Lista med punkter> ) </nowiki>''' Exempelvis <nowiki> Lista3= {A,B,C,D,E,F,G,H,I,J} </nowiki> | ||
Du kan även leta rätt på andra kommandon för vad du nu vill skapa. Börjar du skriva på kommandoraden så får du förslag från GGB. | Du kan även leta rätt på andra kommandon för vad du nu vill skapa. Börjar du skriva på kommandoraden så får du förslag från GGB. | ||
==== Histogram ==== | |||
: Histogram: '''<nowiki> Histogram( <Lista med klassgränser>, <Lista med höjder> ) </nowiki>''' | |||
: [https://www.geogebra.org/m/thagetfd GGB-verktyg] att mata in data i. | |||
: [https://wiki.geogebra.org/en/Histogram_Command Histogram Command] | |||
<nowiki>Lägg till icke-formaterad text här</nowiki> | |||
{{clear}} | {{clear}} | ||
Rad 99: | Rad 168: | ||
Nu kan du skriva standardavvikelse och GeoGebra kommer att ge dig olika förslag. Välj till exempel standardavvikelse för urval och Skriv in Lista<sub>1</sub> (här får du använda under score). | Nu kan du skriva standardavvikelse och GeoGebra kommer att ge dig olika förslag. Välj till exempel standardavvikelse för urval och Skriv in Lista<sub>1</sub> (här får du använda under score). | ||
==== Stickprov eller inte stickprov ==== | |||
StandardAvvikelseFörUrval(Lista) = Stdev(Lista) ger standardavviklese för stickprov | |||
stdevp(Lista) ger standardavvikelsen för hela mängden, dvs ett lägre värde eftersom formeln innehåller division med n. | |||
{{clear}} | {{clear}} | ||
=== Övning === | === Övning === | ||
Rad 121: | Rad 195: | ||
Klicka på knappen för analys, se bildens. | Klicka på knappen för analys, se bildens. | ||
{{clear}} | {{clear}} | ||
<html> | |||
<iframe width="560" height="315" src="https://www.youtube.com/embed/Pp0RXmWZmh4" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe> | |||
</html> | |||
= Excel & Drive = | = Excel & Drive = | ||
== Excel == | |||
[[Fil:Testa statistik i Excel.JPG|300px|höger]] | |||
Skriv likhetstecken i cellen, välj kommando och markera de celler där data ingår. | |||
{{clear}} | |||
== Google Drive == | == Google Drive == | ||
[[Fil:Testa statistik i Drive.JPG| | [[Fil:Testa statistik i Drive.JPG|300px|höger]] | ||
Skriv likhetstecken i cellen, välj kommando och markera de celler där data ingår. | Skriv likhetstecken i cellen, välj kommando och markera de celler där data ingår. | ||
{{clear}} | |||
= Python = | = Python = | ||
Rad 157: | Rad 244: | ||
{{gleerups| [https://gleerupsportal.se/laromedel/exponent-2c/article/469ab9ac-7f51-4167-b39b-103c4b7b28e7 Lägsmått (och spridningsmått)] }}<br /> | {{gleerups| [https://gleerupsportal.se/laromedel/exponent-2c/article/469ab9ac-7f51-4167-b39b-103c4b7b28e7 Lägsmått (och spridningsmått)] }}<br /> | ||
{{matteboken |[https://www.matteboken.se/lektioner/matte-2/statistik/standardavvikelse Standardavvikelse] }}<br /> | {{matteboken |[https://www.matteboken.se/lektioner/matte-2/statistik/standardavvikelse Standardavvikelse] }}<br /> | ||
|} | |} | ||
== Fördjupningstext == | |||
: [http://gauss.stat.su.se/gu/gk2/Excelkompendium.pdf Statistik i Excel – en introduktion], avThommy Perlinger, SU. | : [http://gauss.stat.su.se/gu/gk2/Excelkompendium.pdf Statistik i Excel – en introduktion], avThommy Perlinger, SU. | ||
== NP-uppgifter == | |||
Länk finns även på NP-avsnittet. | |||
* Här är en serie uppgifter på Statistik, något som man ofta inte hinner öva så mycket på. De är i en PPT: | |||
{{PPT | | |||
: [[Media:Statistik_sammanfattning_med_NP-uppgifter.pptx | Statistikuppgifter med lösningar]] }} | |||
{{clear}} | {{clear}} |
Nuvarande version från 7 maj 2020 kl. 12.48