Statistikbegrepp

The exercise was created 2023-04-23 by hannibanani. Question count: 76.




Select questions (76)

Normally, all words in an exercise is used when performing the test and playing the games. You can choose to include only a subset of the words. This setting affects both the regular test, the games, and the printable tests.

All None

  • klusterurval stickprovet består av element från valda grupper
  • stratifierat urval stickprovet består av element från varje grupp
  • Centrala gränsvärdessatsen "CGS" Om stickproven är tillräckligt stora kommer de vara normalfördelade
  • Deskriptiv statistik sammanställning av viktiga aspekter hos en datamängd. Presenteras i form av tabeller & grafer
  • Inferensstatistik man drar slutsatser om en större datamängd (populationen) baserat på en mindre datamängd genom stickprov/urval
  • Tvärsnittsdata data insamlad genom att registrera egenskaper hos många individer (utan att bry sig om tidpunkten detta gjordes)
  • Tidsseriedata data insamlad över många tidsperioder, t.ex. per timme/dag/vecka
  • Strukturerad data finns i ett fördefinierat format, man vet lite vad man kan vänta sig, t.ex. Excel, rått tabellformat
  • Ostrukturerad data passar inte i det fördefinierade formatet, t.ex. Twitter
  • Kategoriska variabler kvalitativ. Representerar kategorier, etiketter eller namn.
  • Numeriska kvantitativ. Representerar meningsfulla tal. T.ex. antal barn i en familj
  • Diskret numerisk data antar ett uppräkneligt antal värden. Ex. antal barn i en familj.
  • Kontinuerlig numerisk data antar ett överuppräkneligt antal värden i något intervall. Ex. vikt hos ett nyfött barn
  • Nominal skala kategorier eller grupper. Värdena är etiketter eller namn.
  • Ordinal kategorier som kan ordnas. Differenser har ej mening pga olika tolkningar och uppfattningar. Ex. Betyg från 1 stjärna till 5 stjärnor
  • Intervall differenser har mening. Ex. Temperatur
  • Kvot finns en “riktig“ nolla. Kvoter är meningsfulla. Ex. vinst eller lön, person som väger 80 kg väger dubbelt så mycket som person som väger 40 kg.
  • Nominaldata finns ingen ordning
  • Scatterplot för att undersöka sambandet mellan två numeriska variabler
  • Polygon beskriver hur många frekvenser
  • ogiv framställer en kumulativ frekvens eller kumulativ relativ frekvens
  • MAD mean of absolute deviation (medelvärdet av absoluta differenser)
  • Varians genomsnittet av de kvadrerade differenserna mellan observationerna och medelvärdet.
  • Aritmetiskt medelvärde adderar ihop olika värden och dividerar med antalet. Ger genomsnittet.
  • Geometriskt medelvärde medelvärde som tar hänsyn till hur räntan förändras med åren
  • typvärde det som förekommer oftast
  • Låg standardavvikelse observationerna är nära medelvärdet
  • Hög standardavvikelse observationerna är utspridda (är standardavvikelsen stor är risken stor)
  • Interkvartilavstånd (IQR) Q3-Q1
  • Boxplott används för att få uppfattning om fördelningens form
  • Positivt skev medianen är till vänster om lådans mitt och den högra whiskern är längre än den vänstra
  • Negativt skev medianen är till höger om lådans mitt och den vänstra whiskern är längre än den högra
  • Kovarians mäter riktningen på det linjära sambandet
  • Korrelation beskriver både riktning och hur starkt sambandet är. Är mellan –1 och 1
  • Utfallsrum innehåller alla möjliga utfall av ett experiment
  • Simpel händelse har endast ett element. T.ex. F på betygsskalan
  • Uttömmande (exhaustive) om alla möjliga utfall finns hos händelserna. Ex. “ta medalj” och “inte ta medalj”
  • Ömsesidigt uteslutande (mutually exklusive) om de inte har några gemensamma utfall för experimentet
  • Venn-diagram representerar händelserna och utfallsrummet
  • union som finns i åtminstone en
  • snitt händelser som finns i båda
  • Komplement som inte finns. 1 minus sannolikheten för händelsen
  • obetingad sannolikhet sannolikheten för en händelse utan några restriktioner
  • betingad sannolikhet sannolikheten för en händelse givet att en annan händelse inträffat/inträffar.
  • Beroende händelser (dependent) om inträffandet av den ena påverkar sannolikheten för att den andra inträffar
  • Oberoende händelser (independent) om inträffandet av den ena inte påverkar sannolikheten för att den andra inträffar
  • À-priori-sannolikheten den ursprungliga (obetingade) sannolikheten P(B)
  • À-posteriori-sannolikheten den uppdaterade (betingade) sannolikheten P(B I A)
  • Kombinationsformeln antalet sätt att välja x objekt bland totalt n olika objekt, där ordningen inte spelar någon roll
  • Permutationsformeln antalet sätt att välja x objekt bland totalt n olika objekt, där ordningen spelar någon roll
  • Massfunktion beskriver diskreta slumpvariabler P(X=x)
  • Täthetsfunktion (density function) beskriver kontinuerliga slumpvariabler P(X_<x)
  • Kumulativ fördelningsfunktion (cumulative distribution function) beskriver både diskreta och kontinuerliga slumpvariabler
  • Riskneutralitet man struntar i risken och tar alla erbjudanden som har positiv förväntad avkastning
  • Riskaversion förväntar sig belöning för att ta en risk. Kan avböja ett riskfyllt erbjudande även om det har positiv förväntad avkastning
  • Riskälskande kan acceptera riskfyllt erbjudande även om det har negativt förväntad avkastning
  • Binominalfördelad slumpvariabel räknar antalet lyckade försök i en serie (oberoende försök)
  • Bernoulliprocess diskret stokastisk process som består av en ändlig eller oändlig serie av oberoende slumpmässiga variabler
  • Possionfördelad slumpvariabel räknar antalet lyckade försök i ett visst tids- eller rumsintervall
  • Hypergeometrisk fördelad slumpvariabel räknar antalet lyckade försök i en serie om n försök som inte kan antas oberoende (lägger ej tillbaka)
  • Diskreta slumpvariabler tar heltalsvärden
  • Numeriska slumpvariabler kan ta vilka värden som helst i ett intervall (Finns ingen massfunktion. Finns istället täthetsfunktion)
  • Täthetsfunktion Beskriver hur troligt det är att X tar värden i ett givet intervall
  • Normalfördelning Är symmetrisk, klockformad och asymptotisk. Är bestämd av parametrarna µ och ó2
  • population består av alla objekt av intresse i det statistiska problemet
  • stickprov en delmängd av populationen
  • Stickprovsstatistikor beräknas från stickprovet och används för inferens om populationen
  • Bias tendensen för en stickprovsstatistika att över- eller underskatta en populationsparameter
  • Urvalsbias systematiskt uteslutande av vissa grupper
  • Bortfallsbias systematisk skillnad i preferenser mellan respondenter och icke-respondenter i en undersökning
  • Skattare (estimator) en statistika som används för att skatta en populationsparameter
  • Skattning (estimate) ett visst värde hos skattaren
  • Konfidensintervall ger ett spann av värden, som med en given konfidensgrad, innehåller populationsparametern (kallas också intervallskattning)
  • df frihetsgrader
  • Typ I-fel förkasta nollhypotesen när den är sann
  • Typ II-fel låt bli att förkasta nollhypotesen när den är falsk

All None

(
Shared exercise

https://spellic.com/eng/exercise/statistikbegrepp.11512462.html

)