Hoofd- » zakelijke leiders » Chi-vierkant (χ2) Statistische definitie

Chi-vierkant (χ2) Statistische definitie

zakelijke leiders : Chi-vierkant (χ2) Statistische definitie
Wat is een Chi-kwadraatstatistiek?

Een chikwadraat ( χ 2 ) statistiek is een test die meet hoe verwachtingen worden vergeleken met daadwerkelijk waargenomen gegevens (of modelresultaten). De gegevens die worden gebruikt bij het berekenen van een chi-kwadraatstatistiek moeten willekeurig, ruw, wederzijds exclusief, afkomstig van onafhankelijke variabelen en afkomstig van een voldoende grote steekproef zijn. De resultaten van het 100 keer gooien van een munt voldoen bijvoorbeeld aan deze criteria.

Chi-kwadraattoetsen worden vaak gebruikt in hypothesetesten.

De formule voor Chi Square is

χc2 = ∑ (Oi − Ei) 2Eiwhere: c = vrijheidsgradenO = waargenomen waarde (s) E = verwachte waarde (n) \ begin {uitgelijnd} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {waar:} \\ & c = \ text {vrijheidsgraden} \\ & O = \ text {waargenomen waarde (n)} \\ & E ​​= \ text {verwachte waarde (n) )} \\ \ end {uitgelijnd} χc2 = ∑Ei (Oi −Ei) 2 waarbij: c = vrijheidsgradenO = waargenomen waarde (n) E = verwachte waarde (n)

Wat zegt een Chi-kwadraatstatistiek?

Er zijn twee hoofdtypen chikwadraattoetsen: de onafhankelijkheidstest, waarbij een kwestie van verwantschap wordt gevraagd, zoals: "Is er een verband tussen geslacht en SAT-scores?"; en de goodness-of-fit-test, die zoiets vraagt ​​als "Als een munt 100 keer wordt gegooid, komt deze dan 50 keer kop en 50 keer de kop op?"

Voor deze tests worden vrijheidsgraden gebruikt om te bepalen of een bepaalde nulhypothese kan worden afgewezen op basis van het totale aantal variabelen en steekproeven in het experiment.

Wanneer bijvoorbeeld studenten en cursuskeuze worden overwogen, is een steekproef van 30 of 40 studenten waarschijnlijk niet groot genoeg om significante gegevens te genereren. Het verkrijgen van dezelfde of vergelijkbare resultaten van een onderzoek met een steekproefgrootte van 400 of 500 studenten is meer geldig.

Overweeg in een ander voorbeeld 100 keer een munt te gooien. Het verwachte resultaat van 100 keer gooien van een eerlijke munt is dat koppen 50 keer omhoog komen en staarten 50 keer omhoog. Het werkelijke resultaat kan zijn dat koppen 45 keer omhoog komen en staarten 55 keer omhoog. De chi-kwadraatstatistiek toont eventuele verschillen tussen de verwachte resultaten en de werkelijke resultaten.

Belangrijkste leerpunten

  • Een chikwadraat (χ 2 ) statistiek is een test die meet hoe verwachtingen worden vergeleken met daadwerkelijk waargenomen gegevens.
  • Er zijn twee hoofdtypen van chikwadraat-tests: de onafhankelijkheidstest voor gegevens en de geschiktheidstoets voor een model.
  • Deze tests kunnen worden gebruikt om te bepalen of een bepaalde nulhypothese kan worden afgewezen in hypothesetests.

Voorbeeld van een Chi Squared Test

Stel je voor dat er een willekeurige enquête is gehouden onder 2.000 verschillende kiezers, zowel mannelijke als vrouwelijke. De mensen die reageerden, werden geclassificeerd op basis van hun geslacht en of ze republikeins, democraat of onafhankelijk waren. Stel je een rooster voor met de kolommen republikeins, democraat en onafhankelijk, en twee rijen met het label mannelijk en vrouwelijk. Neem aan dat de gegevens van de 2.000 respondenten als volgt zijn:

RepublikeinsDemocraatOnafhankelijkTotaal
Mannetje400300100800
Vrouw5006001001200
Totaal9009002002000

De eerste stap om de chi-kwadraat statistiek te berekenen, is het vinden van de verwachte frequenties. Deze worden berekend voor elke "cel" in het raster. Aangezien er twee categorieën geslacht en drie categorieën politieke opvattingen zijn, zijn er in totaal zes verwachte frequenties. De formule voor de verwachte frequentie is:

E (r, c) = n (r) × c (r) nwhere: r = rij in questionc = kolom in questionn = overeenkomstig totaal \ begin {uitgelijnd} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {where:} \\ & r = \ text {row in question} \\ & c = \ text {column in kwestie} \\ & n = \ text {overeenkomstig totaal } \\ \ end {uitgelijnd} E (r, c) = nn (r) × c (r) waar: r = rij in questionc = kolom in questionn = overeenkomstig totaal

In dit voorbeeld zijn de verwachte frequenties:

  • E (1, 1) = (900 x 800) / 2.000 = 360
  • E (1, 2) = (900 x 800) / 2.000 = 360
  • E (1, 3) = (200 x 800) / 2.000 = 80
  • E (2, 1) = (900 x 1.200) / 2.000 = 540
  • E (2, 2) = (900 x 1.200) / 2.000 = 540
  • E (2, 3) = (200 x 1.200) / 2.000 = 120

Vervolgens zijn dit de gebruikte waarden om de chi-kwadraat statistiek te berekenen met behulp van de volgende formule:

Chi-kwadraat = ∑ [O (r, c) −E (r, c)] 2E (r, c) waar: O (r, c) = waargenomen gegevens voor de gegeven rij en kolom \ begin {uitgelijnd} & \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {where:} \\ & O (r, c) = \ text {waargenomen gegevens voor de gegeven rij en kolom} \\ \ end {uitgelijnd} Chi-squared = ∑E (r, c) [O (r, c) −E (r, c)] 2 waarbij: O (r, c) = waargenomen gegevens voor de gegeven rij en kolom

In dit voorbeeld is de uitdrukking voor elke waargenomen waarde:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600 - 540) 2/540 = 6, 67
  • O (2, 3) = (100 - 120) 2/120 = 3, 33

De chi-kwadraat statistiek is dan gelijk aan de som van deze waarde, of 32, 41. We kunnen dan naar een chi-kwadraat statistiektabel kijken om, gezien de vrijheidsgraden in onze opstelling, te zien of het resultaat statistisch significant is of niet.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Vrijheidsgraden Definitie Vrijheidsgraden verwijst naar het maximale aantal logisch onafhankelijke waarden, waarden die vrij zijn om te variëren, in het gegevensmonster. meer T-testdefinitie Een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die mogelijk verband houden met bepaalde kenmerken. meer Wat omgekeerde correlatie ons vertelt Een omgekeerde correlatie, ook bekend als negatieve correlatie, is een tegengestelde relatie tussen twee variabelen zodat ze in tegengestelde richtingen bewegen. meer Hoe de resterende standaardafwijking werkt De resterende standaardafwijking is een statistische term die wordt gebruikt om het verschil in standaardafwijkingen van waargenomen waarden versus voorspelde waarden te beschrijven, zoals aangegeven door punten in een regressieanalyse. meer Hoe Analysis of Variance (ANOVA) werkt Analysis of Variance (ANOVA) is een hulpmiddel voor statistische analyse dat de totale variabiliteit in een gegevensset in twee componenten scheidt: willekeurige en systematische factoren. meer Correlatie Correlatie is een statistische maat voor hoe twee effecten ten opzichte van elkaar bewegen. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter