Statistikbegrepp

Övningen är skapad 2023-04-23 av hannibanani. Antal frågor: 76.




Välj frågor (76)

Vanligtvis används alla ord som finns i en övning när du förhör dig eller spelar spel. Här kan du välja om du enbart vill öva på ett urval av orden. Denna inställning påverkar både förhöret, spelen, och utskrifterna.

Alla Inga

  • klusterurval stickprovet består av element från valda grupper
  • stratifierat urval stickprovet består av element från varje grupp
  • Centrala gränsvärdessatsen "CGS" Om stickproven är tillräckligt stora kommer de vara normalfördelade
  • Deskriptiv statistik sammanställning av viktiga aspekter hos en datamängd. Presenteras i form av tabeller & grafer
  • Inferensstatistik man drar slutsatser om en större datamängd (populationen) baserat på en mindre datamängd genom stickprov/urval
  • Tvärsnittsdata data insamlad genom att registrera egenskaper hos många individer (utan att bry sig om tidpunkten detta gjordes)
  • Tidsseriedata data insamlad över många tidsperioder, t.ex. per timme/dag/vecka
  • Strukturerad data finns i ett fördefinierat format, man vet lite vad man kan vänta sig, t.ex. Excel, rått tabellformat
  • Ostrukturerad data passar inte i det fördefinierade formatet, t.ex. Twitter
  • Kategoriska variabler kvalitativ. Representerar kategorier, etiketter eller namn.
  • Numeriska kvantitativ. Representerar meningsfulla tal. T.ex. antal barn i en familj
  • Diskret numerisk data antar ett uppräkneligt antal värden. Ex. antal barn i en familj.
  • Kontinuerlig numerisk data antar ett överuppräkneligt antal värden i något intervall. Ex. vikt hos ett nyfött barn
  • Nominal skala kategorier eller grupper. Värdena är etiketter eller namn.
  • Ordinal kategorier som kan ordnas. Differenser har ej mening pga olika tolkningar och uppfattningar. Ex. Betyg från 1 stjärna till 5 stjärnor
  • Intervall differenser har mening. Ex. Temperatur
  • Kvot finns en “riktig“ nolla. Kvoter är meningsfulla. Ex. vinst eller lön, person som väger 80 kg väger dubbelt så mycket som person som väger 40 kg.
  • Nominaldata finns ingen ordning
  • Scatterplot för att undersöka sambandet mellan två numeriska variabler
  • Polygon beskriver hur många frekvenser
  • ogiv framställer en kumulativ frekvens eller kumulativ relativ frekvens
  • MAD mean of absolute deviation (medelvärdet av absoluta differenser)
  • Varians genomsnittet av de kvadrerade differenserna mellan observationerna och medelvärdet.
  • Aritmetiskt medelvärde adderar ihop olika värden och dividerar med antalet. Ger genomsnittet.
  • Geometriskt medelvärde medelvärde som tar hänsyn till hur räntan förändras med åren
  • typvärde det som förekommer oftast
  • Låg standardavvikelse observationerna är nära medelvärdet
  • Hög standardavvikelse observationerna är utspridda (är standardavvikelsen stor är risken stor)
  • Interkvartilavstånd (IQR) Q3-Q1
  • Boxplott används för att få uppfattning om fördelningens form
  • Positivt skev medianen är till vänster om lådans mitt och den högra whiskern är längre än den vänstra
  • Negativt skev medianen är till höger om lådans mitt och den vänstra whiskern är längre än den högra
  • Kovarians mäter riktningen på det linjära sambandet
  • Korrelation beskriver både riktning och hur starkt sambandet är. Är mellan –1 och 1
  • Utfallsrum innehåller alla möjliga utfall av ett experiment
  • Simpel händelse har endast ett element. T.ex. F på betygsskalan
  • Uttömmande (exhaustive) om alla möjliga utfall finns hos händelserna. Ex. “ta medalj” och “inte ta medalj”
  • Ömsesidigt uteslutande (mutually exklusive) om de inte har några gemensamma utfall för experimentet
  • Venn-diagram representerar händelserna och utfallsrummet
  • union som finns i åtminstone en
  • snitt händelser som finns i båda
  • Komplement som inte finns. 1 minus sannolikheten för händelsen
  • obetingad sannolikhet sannolikheten för en händelse utan några restriktioner
  • betingad sannolikhet sannolikheten för en händelse givet att en annan händelse inträffat/inträffar.
  • Beroende händelser (dependent) om inträffandet av den ena påverkar sannolikheten för att den andra inträffar
  • Oberoende händelser (independent) om inträffandet av den ena inte påverkar sannolikheten för att den andra inträffar
  • À-priori-sannolikheten den ursprungliga (obetingade) sannolikheten P(B)
  • À-posteriori-sannolikheten den uppdaterade (betingade) sannolikheten P(B I A)
  • Kombinationsformeln antalet sätt att välja x objekt bland totalt n olika objekt, där ordningen inte spelar någon roll
  • Permutationsformeln antalet sätt att välja x objekt bland totalt n olika objekt, där ordningen spelar någon roll
  • Massfunktion beskriver diskreta slumpvariabler P(X=x)
  • Täthetsfunktion (density function) beskriver kontinuerliga slumpvariabler P(X_<x)
  • Kumulativ fördelningsfunktion (cumulative distribution function) beskriver både diskreta och kontinuerliga slumpvariabler
  • Riskneutralitet man struntar i risken och tar alla erbjudanden som har positiv förväntad avkastning
  • Riskaversion förväntar sig belöning för att ta en risk. Kan avböja ett riskfyllt erbjudande även om det har positiv förväntad avkastning
  • Riskälskande kan acceptera riskfyllt erbjudande även om det har negativt förväntad avkastning
  • Binominalfördelad slumpvariabel räknar antalet lyckade försök i en serie (oberoende försök)
  • Bernoulliprocess diskret stokastisk process som består av en ändlig eller oändlig serie av oberoende slumpmässiga variabler
  • Possionfördelad slumpvariabel räknar antalet lyckade försök i ett visst tids- eller rumsintervall
  • Hypergeometrisk fördelad slumpvariabel räknar antalet lyckade försök i en serie om n försök som inte kan antas oberoende (lägger ej tillbaka)
  • Diskreta slumpvariabler tar heltalsvärden
  • Numeriska slumpvariabler kan ta vilka värden som helst i ett intervall (Finns ingen massfunktion. Finns istället täthetsfunktion)
  • Täthetsfunktion Beskriver hur troligt det är att X tar värden i ett givet intervall
  • Normalfördelning Är symmetrisk, klockformad och asymptotisk. Är bestämd av parametrarna µ och ó2
  • population består av alla objekt av intresse i det statistiska problemet
  • stickprov en delmängd av populationen
  • Stickprovsstatistikor beräknas från stickprovet och används för inferens om populationen
  • Bias tendensen för en stickprovsstatistika att över- eller underskatta en populationsparameter
  • Urvalsbias systematiskt uteslutande av vissa grupper
  • Bortfallsbias systematisk skillnad i preferenser mellan respondenter och icke-respondenter i en undersökning
  • Skattare (estimator) en statistika som används för att skatta en populationsparameter
  • Skattning (estimate) ett visst värde hos skattaren
  • Konfidensintervall ger ett spann av värden, som med en given konfidensgrad, innehåller populationsparametern (kallas också intervallskattning)
  • df frihetsgrader
  • Typ I-fel förkasta nollhypotesen när den är sann
  • Typ II-fel låt bli att förkasta nollhypotesen när den är falsk

Alla Inga

(
Utdelad övning

https://spellic.com/swe/ovning/statistikbegrepp.11512462.html

)