Hoofd- » brokers » T-Test

T-Test

brokers : T-Test
Wat is een T-test?

Een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die mogelijk verband houden met bepaalde kenmerken. Het wordt meestal gebruikt wanneer de gegevensverzamelingen, zoals de gegevensverzameling die is geregistreerd als het resultaat van het 100 keer omdraaien van een munt, een normale verdeling zouden volgen en onbekende variaties zouden kunnen hebben. Een t-test wordt gebruikt als een tool voor het testen van hypotheses, waarmee een veronderstelling kan worden getest die op een populatie van toepassing is.

Een t-test kijkt naar de t-statistiek, de t-distributiewaarden en de vrijheidsgraden om de waarschijnlijkheid van verschil tussen twee gegevenssets te bepalen. Om een ​​test met drie of meer variabelen uit te voeren, moet men een variantieanalyse gebruiken.

01:38

T-Test

Uitleg over de T-test

In wezen stelt een t-test ons in staat om de gemiddelde waarden van de twee gegevenssets te vergelijken en te bepalen of ze uit dezelfde populatie kwamen. Als we in de bovenstaande voorbeelden een steekproef van studenten uit klasse A en een andere steekproef van studenten uit klasse B zouden nemen, zouden we niet verwachten dat ze exact hetzelfde gemiddelde en dezelfde standaardafwijking hebben. Evenzo moeten monsters genomen uit de met placebo gevoede controlegroep en die genomen uit de voorgeschreven medicijngroep een iets andere gemiddelde en standaarddeviatie hebben.

Wiskundig neemt de t-test een steekproef uit elk van de twee sets en stelt de probleemstelling vast door een nulhypothese aan te nemen dat de twee gemiddelden gelijk zijn. Op basis van de toepasselijke formules worden bepaalde waarden berekend en vergeleken met de standaardwaarden en de veronderstelde nulhypothese wordt dienovereenkomstig geaccepteerd of afgewezen.

Als de nulhypothese in aanmerking komt om te worden afgewezen, geeft dit aan dat de gegevenswaarden sterk zijn en niet toevallig. De t-test is slechts een van de vele tests die voor dit doel worden gebruikt. Statistici moeten bovendien andere tests dan de t-test gebruiken om meer variabelen en tests met grotere steekproefgroottes te onderzoeken. Voor een grote steekproef gebruiken statistici een z-test. Andere testopties zijn de chikwadraat-test en de f-test.

Er zijn drie soorten t-tests en deze zijn gecategoriseerd als afhankelijke en onafhankelijke t-tests.

Belangrijkste leerpunten

  • Een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die mogelijk verband houden met bepaalde kenmerken.
  • De t-toets is een van de vele toetsen die worden gebruikt voor het testen van hypothesen in de statistiek.
  • Voor het berekenen van een t-test zijn drie belangrijke gegevenswaarden vereist. Ze omvatten het verschil tussen de gemiddelde waarden van elke gegevensset (het gemiddelde verschil genoemd), de standaarddeviatie van elke groep en het aantal gegevenswaarden van elke groep.
  • Er zijn verschillende soorten t-tests die kunnen worden uitgevoerd, afhankelijk van de gegevens en het vereiste type analyse.

Dubbelzinnige testresultaten

Overweeg dat een geneesmiddelenfabrikant een nieuw uitgevonden medicijn wil testen. Het volgt de standaardprocedure om het medicijn op een groep patiënten uit te proberen en een placebo aan een andere groep te geven, de controlegroep. De placebo die aan de controlegroep wordt gegeven, is een stof zonder beoogde therapeutische waarde en dient als benchmark om te meten hoe de andere groep, die het eigenlijke medicijn krijgt, reageert.

Na de medicijnstudie rapporteerden de leden van de met placebo gevoede controlegroep een toename van de gemiddelde levensverwachting van drie jaar, terwijl de leden van de groep die het nieuwe medicijn voorgeschreven krijgen, een toename van de gemiddelde levensverwachting van vier jaar melden. Onmiddellijke observatie kan erop wijzen dat het medicijn inderdaad werkt, omdat de resultaten beter zijn voor de groep die het medicijn gebruikt. Het is echter ook mogelijk dat de waarneming te wijten is aan een toevallige gebeurtenis, vooral een verrassend geluk. Een t-test is nuttig om te concluderen of de resultaten daadwerkelijk correct zijn en van toepassing zijn op de hele populatie.

Op een school scoorden 100 leerlingen in klas A gemiddeld 85% met een standaarddeviatie van 3%. Nog eens 100 studenten behoorden tot klasse B scoorden gemiddeld 87% met een standaardafwijking van 4%. Hoewel het gemiddelde van klasse B beter is dan dat van klasse A, is het misschien niet correct om te concluderen dat de algehele prestaties van studenten in klasse B beter zijn dan die van studenten in klasse A. Dit komt omdat, samen met de gemiddelde, de standaardafwijking van klasse B is ook hoger dan die van klasse A. Het geeft aan dat hun extreme percentages, aan lagere en hogere kanten, veel meer verspreid waren in vergelijking met die van klasse A. Een t-test kan helpen om te bepalen welke klasse deed het beter.

T-test veronderstellingen

  1. De eerste veronderstelling met betrekking tot t-tests betreft de meetschaal. De veronderstelling voor een t-test is dat de meetschaal die wordt toegepast op de verzamelde gegevens een continue of ordinale schaal volgt, zoals de scores voor een IQ-test.
  2. De tweede veronderstelling is dat van een eenvoudige willekeurige steekproef, dat de gegevens worden verzameld uit een representatief, willekeurig geselecteerd deel van de totale populatie.
  3. De derde veronderstelling is dat de gegevens, wanneer ze worden uitgezet, resulteren in een normale distributie, klokvormige distributiecurve.
  4. De vierde veronderstelling is dat een redelijk grote steekproef wordt gebruikt. Grotere steekproefgrootte betekent dat de verdeling van de resultaten een normale klokvormige curve moet benaderen.
  5. De uiteindelijke veronderstelling is de homogeniteit van variantie. Homogene of gelijke variantie bestaat wanneer de standaardafwijkingen van monsters ongeveer gelijk zijn.

T-tests berekenen

Voor het berekenen van een t-test zijn drie belangrijke gegevenswaarden vereist. Ze omvatten het verschil tussen de gemiddelde waarden van elke gegevensset (het gemiddelde verschil genoemd), de standaarddeviatie van elke groep en het aantal gegevenswaarden van elke groep.

De uitkomst van de t-toets levert de t-waarde op. Deze berekende t-waarde wordt vervolgens vergeleken met een waarde verkregen uit een kritieke waardetabel (de T-distributietabel genoemd). Deze vergelijking helpt om te bepalen hoe waarschijnlijk het verschil tussen de gemiddelden toevallig is geweest of dat de datasets echt intrinsieke verschillen hebben. De t-test vraagt ​​zich af of het verschil tussen de groepen een echt verschil in de studie vertegenwoordigt of dat het waarschijnlijk een zinloos statistisch verschil is.

T-distributietabellen

De T-distributietabel is beschikbaar in formaten met één staart en twee staarten. De eerste wordt gebruikt voor het beoordelen van gevallen met een vaste waarde of bereik met een duidelijke richting (positief of negatief). Wat is bijvoorbeeld de kans dat de uitvoerwaarde onder -3 blijft of meer dan zeven krijgt bij het werpen van een paar dobbelstenen? De laatste wordt gebruikt voor bereikgebonden analyse, zoals vragen of de coördinaten tussen -2 en +2 vallen.

De berekeningen kunnen worden uitgevoerd met standaard softwareprogramma's die de nodige statistische functies ondersteunen, zoals die in MS Excel.

T-waarden en vrijheidsgraden

De t-test produceert twee waarden als output: t-waarde en vrijheidsgraden. De t-waarde is een verhouding van het verschil tussen het gemiddelde van de twee monstersets en het verschil dat bestaat binnen de monstersets. Hoewel de tellerwaarde (het verschil tussen het gemiddelde van de twee steekproefsets) eenvoudig te berekenen is, kan de noemer (het verschil dat binnen de steekproefsets bestaat) een beetje ingewikkeld worden, afhankelijk van het type gegevenswaarden. De noemer van de verhouding is een maat voor de spreiding of variabiliteit. Hogere waarden van de t-waarde, ook wel t-score genoemd, geven aan dat er een groot verschil bestaat tussen de twee steekproefsets. Hoe kleiner de t-waarde, hoe meer overeenkomst er bestaat tussen de twee steekproefsets.

  • Een grote t-score geeft aan dat de groepen verschillend zijn.
  • Een kleine t-score geeft aan dat de groepen vergelijkbaar zijn.

Vrijheidsgraden verwijzen naar de waarden in een onderzoek dat de vrijheid heeft om te variëren en essentieel zijn voor het beoordelen van het belang en de geldigheid van de nulhypothese. Berekening van deze waarden hangt meestal af van het aantal beschikbare gegevensrecords in de steekproefset.

Gecorreleerde (of gepaarde) T-test

De gecorreleerde t-test wordt uitgevoerd wanneer de monsters typisch bestaan ​​uit gepaarde paren van vergelijkbare eenheden, of wanneer er gevallen van herhaalde metingen zijn. Er kunnen bijvoorbeeld gevallen zijn waarbij dezelfde patiënten herhaaldelijk worden getest - voor en na een bepaalde behandeling. In dergelijke gevallen wordt elke patiënt gebruikt als een controlemonster tegen zichzelf.

Deze methode is ook van toepassing op gevallen waarin de monsters op een bepaalde manier aan elkaar zijn gerelateerd of overeenkomende kenmerken hebben, zoals een vergelijkende analyse met kinderen, ouders of broers en zussen. Gecorreleerde of gepaarde t-tests zijn van een afhankelijk type, omdat dit gevallen betreft waarbij de twee sets monsters verwant zijn.

De formule voor het berekenen van de t-waarde en vrijheidsgraden voor een gepaarde t-test is:

  • Gemiddelde1 en gemiddelde2 zijn de gemiddelde waarden van elk van de monstersets, terwijl var1 en var2 de variantie van elk van de monstersets vertegenwoordigen.

De resterende twee typen behoren tot de onafhankelijke t-tests. De voorbeelden van deze typen worden onafhankelijk van elkaar geselecteerd. Dat wil zeggen dat de gegevenssets in de twee groepen niet naar dezelfde waarden verwijzen. Ze omvatten gevallen zoals een groep van 100 patiënten die worden opgesplitst in twee sets van elk 50 patiënten. Een van de groepen wordt de controlegroep en krijgt een placebo, terwijl de andere groep de voorgeschreven behandeling krijgt. Dit vormt twee onafhankelijke voorbeeldgroepen die niet met elkaar zijn gekoppeld.

Gelijke variantie (of gepoolde) T-test

De gelijke variantie t-test wordt gebruikt wanneer het aantal monsters in elke groep hetzelfde is, of de variantie van de twee gegevenssets vergelijkbaar is. De volgende formule wordt gebruikt voor het berekenen van de t-waarde en vrijheidsgraden voor de t-test met gelijke variantie:

T-waarde = gemiddelde1 − gemiddelde2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2waar: gemiddelde1 en gemiddelde2 = Gemiddelde waarden van elk van de steekproefsetsvar1 en var2 = Variantie van elk sample setsn1 en n2 = Aantal records in elke sample set \ begin {uitgelijnd} & \ text {T-waarde} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { waar:} \\ & mean1 \ text {en} mean2 = \ text {Gemiddelde waarden van elke} \\ & \ text {van de voorbeeldsets} \\ & var1 \ text {en} var2 = \ text {Variantie van elk van de voorbeeldsets} \\ & n1 \ text {en} n2 = \ text {Aantal records in elke voorbeeldset} \\ \ end {uitgelijnd} T-waarde = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 gemiddelde1 − gemiddelde2 waarbij: gemiddelde1 en gemiddelde2 = gemiddelde waarden van elk van de steekproefsetsvar1 en var2 = variantie van elk van de steekproefsetsn1 en n2 = aantal records in elke steekproef reeks

en,

Vrijheidsgraden = n1 + n2-2 waar: n1 en n2 = Aantal records in elke voorbeeldset \ begin {uitgelijnd} & \ text {Vrijheidsgraden} = n1 + n2 - 2 \\ & \ textbf {waar:} \\ & n1 \ text {en} n2 = \ text {Aantal records in elke voorbeeldset} \\ \ end {uitgelijnd} Vrijheidsgraden = n1 + n2-2 waar: n1 en n2 = Aantal records in elke voorbeeldset

Ongelijke variantie T-test

De ongelijke variantie t-test wordt gebruikt wanneer het aantal monsters in elke groep verschillend is en de variantie van de twee gegevenssets ook verschillend is. Deze test wordt ook wel de Welch's t-test genoemd. De volgende formule wordt gebruikt voor het berekenen van de t-waarde en vrijheidsgraden voor een ongelijke variantie t-test:

T-waarde = gemiddelde1 − gemiddelde2var12n1 + var22n2where: gemiddelde1 en gemiddelde2 = Gemiddelde waarden van elk van de steekproefsetsvar1 en var2 = Variantie van elk van de steekproefsetsn1 en n2 = Aantal records in elke steekproefset \ begin {uitgelijnd} & \ text {T-waarde} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {where:} \ \ & mean1 \ text {en} mean2 = \ text {Gemiddelde waarden van elke} \\ & \ text {van de voorbeeldsets} \\ & var1 \ text {en} var2 = \ text {Variantie van elk van de voorbeeldsets} \ \ & n1 \ text {en} n2 = \ text {Aantal records in elke voorbeeldset} \\ \ end {uitgelijnd} T-waarde = n1var12 + n2var22 gemiddelde1 − gemiddelde2 waarbij: gemiddelde1 en gemiddelde2 = gemiddelde waarden van elk van de sample setsvar1 en var2 = Variantie van elk van de sample setsn1 en n2 = Aantal records in elke sample set

en,

Vrijheidsgraden = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1where: var1 en var2 = Variantie van elk van de steekproefsetsn1 en n2 = Aantal records in elke steekproefset \ begin {uitgelijnd } & \ text {Vrijheidsgraden} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {and} var2 = \ text {Variantie van elk van de voorbeeldsets} \\ & n1 \ text {en} n2 = \ text {Aantal records in elke voorbeeldset } \\ \ end {uitgelijnd} Vrijheidsgraden = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 waarbij: var1 en var2 = variantie van elk van de sample setsn1 en n2 = Aantal records in elke sample set

Bepaling van de juiste T-test om te gebruiken

Het volgende stroomdiagram kan worden gebruikt om te bepalen welke t-test moet worden gebruikt op basis van de kenmerken van de monstersets. De belangrijkste te overwegen items zijn of de voorbeeldrecords vergelijkbaar zijn, het aantal gegevensrecords in elke voorbeeldset en de variantie van elke voorbeeldset.

Afbeelding door Julie Bang © Investopedia 2019

Voorbeeld ongelijke variantie T-test

Stel dat we een diagonaal meten van schilderijen ontvangen in een kunstgalerie. Een groep monsters bevat 10 schilderijen, terwijl de andere 20 schilderijen bevat. De gegevenssets, met de bijbehorende gemiddelde en variantiewaarden, zijn als volgt:

Set 1Set 2
19.728.3
20.426.7
19.620.1
17.823.3
18.525.2
18.922.1
18.317.7
18.927.6
19.520.6
21.9513.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.9
13.3
Gemeen19.421.6
variance1.417.1

Hoewel het gemiddelde van Set 2 hoger is dan dat van Set 1, kunnen we niet concluderen dat alle schilderijen een gemiddelde lengte hebben van ongeveer 21, 6 eenheden, omdat de variantie van Set 2 aanzienlijk groter is dan Set 1. Is dit toevallig of bestaan ​​er echt verschillen in de totale populatie van alle schilderijen ontvangen in de kunstgalerij ">

Aangezien het aantal gegevensrecords verschilt (n1 = 10 en n2 = 20) en de variantie ook verschillend is, worden de t-waarde en vrijheidsgraden berekend voor de bovenstaande gegevensset met behulp van de formule die wordt vermeld in de Unequal Variance T-test sectie.

De t-waarde is -2.24787. Aangezien het minteken kan worden genegeerd bij het vergelijken van de twee t-waarden, is de berekende waarde 2.24787.

De waarde van de vrijheidsgraden is 24, 38 en wordt gereduceerd tot 24 vanwege de formuledefinitie waarbij de waarde naar beneden moet worden afgerond op de laagst mogelijke gehele waarde.

Wanneer een normale verdeling wordt verondersteld, kan men een waarschijnlijkheidsniveau (alfaniveau, niveau van significantie, p ) specificeren als een criterium voor acceptatie. In de meeste gevallen kan een waarde van 5% worden aangenomen.

Gebruikmakend van de mate van vrijheidswaarde als 24 en een significantieniveau van 5%, geeft een blik op de verdeling van de t-waarde een waarde van 2, 064. Vergelijking van deze waarde met de berekende waarde van 2.247 geeft aan dat de berekende t-waarde groter is dan de tabelwaarde bij een significantieniveau van 5%. Daarom is het veilig om de nulhypothese te verwerpen dat er geen verschil is tussen gemiddelden. De populatie heeft intrinsieke verschillen, en ze zijn niet toevallig.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Hoe Analysis of Variance (ANOVA) werkt Analysis of Variance (ANOVA) is een hulpmiddel voor statistische analyse dat de totale variabiliteit in een gegevensset in twee componenten scheidt: willekeurige en systematische factoren. meer T-verdeling begrijpen AT-verdeling is een type waarschijnlijkheidsfunctie die geschikt is voor het schatten van populatieparameters voor kleine steekproefgroottes of onbekende varianties. meer Vrijheidsgraden Definitie Vrijheidsgraden verwijst naar het maximale aantal logisch onafhankelijke waarden, waarden die de vrijheid hebben om te variëren, in het gegevensmonster. meer Hoe de resterende standaardafwijking werkt De resterende standaardafwijking is een statistische term die wordt gebruikt om het verschil in standaardafwijkingen van waargenomen waarden versus voorspelde waarden te beschrijven, zoals aangegeven door punten in een regressieanalyse. meer Hoe de Chi-kwadraatstatistiek werkt Een chi-kwadraat (χ2) -statistiek is een test die meet hoe verwachtingen worden vergeleken met daadwerkelijk waargenomen gegevens (of modelresultaten). De gegevens die worden gebruikt bij het berekenen van een chi-kwadraatstatistiek moeten willekeurig, ruw, wederzijds exclusief, afkomstig van onafhankelijke variabelen en afkomstig van een voldoende grote steekproef zijn. meer Hoe de Wilcoxon-test wordt gebruikt De Wilcoxon-test, die verwijst naar de Rank Sum-test of de Signed Rank-test, is een niet-parametrische test die twee gepaarde groepen vergelijkt. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter