Hoofd- » algoritmische handel » Hypothesetesten in financiën: concept en voorbeelden

Hypothesetesten in financiën: concept en voorbeelden

Uw beleggingsadviseur stelt u een maandelijks beleggingsplan voor inkomsten voor dat elke maand een variabel rendement belooft. U zult er alleen in investeren als u verzekerd bent van een gemiddeld maandelijks inkomen van $ 180. Uw adviseur vertelt u ook dat de regeling de afgelopen 300 maanden beleggingsrendementen had met een gemiddelde waarde van $ 190 en een standaardafwijking van $ 75. Moet u in deze regeling investeren? Hypothesetesten helpen een dergelijke besluitvorming.

Dit artikel gaat uit van de bekendheid van de lezers met concepten van een normale distributietabel, formule, p-waarde en gerelateerde basisprincipes van statistieken.

Wat is hypothesetesten?

Hypothese of significantie testen is een wiskundig model voor het testen van een claim, idee of hypothese over een parameter van interesse in een bepaalde populatieset, met behulp van gegevens gemeten in een steekproefset. Berekeningen worden uitgevoerd op geselecteerde monsters om meer beslissende informatie te verzamelen over de kenmerken van de gehele populatie, wat een systematische manier mogelijk maakt om claims of ideeën over de hele dataset te testen.

Hier is een eenvoudig voorbeeld: een schooldirecteur meldt dat leerlingen op haar school gemiddeld 7 op 10 scoren voor examens. Om deze 'hypothese' te testen, registreren we cijfers van bijvoorbeeld 30 studenten (steekproef) van de gehele studentenpopulatie van de school (bijvoorbeeld 300) en berekenen we het gemiddelde van die steekproef. We kunnen dan het (berekende) steekproefgemiddelde vergelijken met het (gerapporteerde) populatiegemiddelde en proberen de hypothese te bevestigen.

Om een ander voorbeeld te nemen, het jaarlijkse rendement van een bepaald beleggingsfonds is 8%. Stel dat het beleggingsfonds al 20 jaar bestaat. We nemen een willekeurige steekproef van jaarlijkse rendementen van het beleggingsfonds voor bijvoorbeeld vijf jaar (steekproef) en berekenen het gemiddelde. Vervolgens vergelijken we het (berekende) steekproefgemiddelde met het (geclaimde) populatiegemiddelde om de hypothese te verifiëren.

De besluitvormingscriteria moeten gebaseerd zijn op bepaalde parameters van datasets.

Er bestaan verschillende methoden voor het testen van hypothesen, maar dezelfde vier basisstappen zijn betrokken:

Stap 1: Definieer de hypothese

Gewoonlijk wordt de gerapporteerde waarde (of de claimstatistieken) vermeld als de hypothese en wordt aangenomen dat deze waar is. Voor de bovenstaande voorbeelden is de hypothese:

Voorbeeld A: Studenten op school scoren gemiddeld 7 van de 10 examens.
Voorbeeld B: Het jaarlijkse rendement van het beleggingsfonds is 8% per jaar.

Deze vermelde beschrijving vormt de " nulhypothese (H ₀ ) " en wordt verondersteld waar te zijn - de manier waarop een verdachte in een juryzaak onschuldig wordt geacht totdat hij schuldig is bevonden door het bewijsmateriaal dat voor de rechtbank is gepresenteerd. Evenzo begint het testen van hypothesen door een 'nulhypothese' te stellen en aan te nemen, en vervolgens bepaalt het proces of de veronderstelling waarschijnlijk waar of onwaar is.

Het belangrijke punt om op te merken is dat we de nulhypothese testen omdat er twijfel bestaat over de geldigheid ervan. Alle informatie die tegen de genoemde nulhypothese is, is vastgelegd in de alternatieve hypothese (H ₁ ). Voor de bovenstaande voorbeelden is de alternatieve hypothese:

Studenten scoren een gemiddelde dat niet gelijk is aan 7.
Het jaarlijkse rendement van het beleggingsfonds is niet gelijk aan 8% per jaar.

Met andere woorden, de alternatieve hypothese is een directe tegenspraak met de nulhypothese.

Net als in een rechtszaak gaat de jury uit van de onschuld van de verdachte (nulhypothese). De officier van justitie moet het tegendeel bewijzen (alternatieve hypothese). Evenzo moet de onderzoeker bewijzen dat de nulhypothese waar of onwaar is. Als de officier van justitie er niet in slaagt de alternatieve hypothese te bewijzen, moet de jury de verdachte laten gaan (gebaseerd op de nulhypothese). Op dezelfde manier wordt aangenomen dat de nulhypothese waar is als de onderzoeker geen alternatieve hypothese bewijst (of gewoon niets doet).

Stap 2: Stel de criteria in

De beslissingscriteria moeten gebaseerd zijn op bepaalde parameters van datasets en dit is waar de verbinding met normale distributie in beeld komt.

Volgens de standaardstatistieken over de steekproefverdeling: "Voor elke steekproefgrootte n, is de steekproefverdeling van X̅ normaal als de populatie X waaruit de steekproef wordt getrokken normaal verdeeld is." Daarom betekent de waarschijnlijkheid van alle andere mogelijke steekproeven dat men zou kunnen selecteren zijn normaal verdeeld.

Bepaal bijvoorbeeld of het gemiddelde dagelijkse rendement van aandelen die op XYZ-aandelen genoteerd zijn, rond Nieuwjaarsdag groter is dan 2%.

H ₀ : nulhypothese: gemiddelde = 2%

H ₁ : Alternatieve hypothese: gemiddelde> 2% (dit willen we bewijzen)

Neem de steekproef (zeg van 50 aandelen op een totaal van 500) en bereken het gemiddelde van de steekproef.

Voor een normale verdeling ligt 95% van de waarden binnen twee standaarddeviaties van het populatiegemiddelde. Daarom stellen deze normale verdeling en centrale limietaanname voor de voorbeeldgegevensset ons in staat om 5% als een significantieniveau vast te stellen. Het is logisch, want volgens deze veronderstelling is er minder dan 5% kans (100-95) om uitbijters te krijgen die verder gaan dan twee standaarddeviaties van het populatiegemiddelde. Afhankelijk van de aard van datasets, kunnen andere significantieniveaus worden genomen op 1%, 5% of 10%. Voor financiële berekeningen (inclusief gedragsfinanciering) is 5% de algemeen aanvaarde limiet. Als we berekeningen vinden die verder gaan dan de gebruikelijke twee standaarddeviaties, hebben we een sterk geval van uitbijters om de nulhypothese te verwerpen.

Grafisch wordt het als volgt weergegeven:

Als het gemiddelde van de steekproef in het bovenstaande voorbeeld veel groter is dan 2% (zeg 3, 5%), dan verwerpen we de nulhypothese. De alternatieve hypothese (gemiddeld> 2%) wordt aanvaard, wat bevestigt dat het gemiddelde dagelijkse rendement van de aandelen inderdaad meer dan 2% is.

Als het gemiddelde van de steekproef echter waarschijnlijk niet significant groter is dan 2% (en blijft rond de ongeveer 2, 2%), KUNNEN we de nulhypothese NIET afwijzen. De uitdaging is om te beslissen over dergelijke gevallen van dichtbij. Om een conclusie te trekken uit geselecteerde steekproeven en resultaten, moet een significantieniveau worden bepaald, waarmee een conclusie kan worden getrokken over de nulhypothese. De alternatieve hypothese maakt het mogelijk het niveau van significantie of het "kritieke waarde" -concept te bepalen voor het beslissen over dergelijke gevallen van dichtbij.

Volgens de standaarddefinitie van het leerboek: “Een kritische waarde is een grenswaarde die de grenzen definieert waarboven minder dan 5% van de steekproefgemiddelden kan worden verkregen als de nulhypothese waar is. Steekproefgemiddelden verkregen buiten een kritische waarde zullen resulteren in een beslissing om de nulhypothese te verwerpen. "Als we in het bovenstaande voorbeeld de kritieke waarde hebben gedefinieerd als 2, 1% en het berekende gemiddelde komt uit op 2, 2%, dan verwerpen we de nulhypothese Een kritische waarde legt een duidelijke afbakening over acceptatie of afwijzing.

Stap 3: bereken de statistiek

Deze stap omvat het berekenen van de vereiste figuur (s), bekend als teststatistieken (zoals gemiddelde, z-score, p-waarde, enz.), Voor de geselecteerde steekproef. (We komen hier later op terug.)

Stap 4: een conclusie trekken

Bepaal met de berekende waarde (n) de nulhypothese. Als de kans om een steekproefgemiddelde te krijgen minder dan 5% is, is de conclusie de nulhypothese te verwerpen . Accepteer en behoud anders de nulhypothese.

Soorten fouten

Er zijn vier mogelijke uitkomsten bij steekproefgebaseerde besluitvorming, met betrekking tot de juiste toepasbaarheid op de hele populatie:

Besluit om te behouden

Besluit tot afwijzing

Geldt voor de hele populatie

Correct

Niet correct

(TYPE 1 Fout - a)

Geldt niet voor de gehele bevolking

Niet correct

(TYPE 2 Fout - b)

Correct

De "Correcte" gevallen zijn die gevallen waarin de beslissingen die op de monsters worden genomen echt van toepassing zijn op de hele populatie. De gevallen van fouten doen zich voor wanneer men besluit de nulhypothese op basis van de steekproefberekeningen te behouden (of te verwerpen), maar die beslissing is niet echt van toepassing op de hele populatie. Deze gevallen vormen Type 1 (alfa) en Type 2 (bèta) fouten, zoals aangegeven in de bovenstaande tabel.

Door de juiste kritische waarde te selecteren, kunt u de type 1-alfafouten elimineren of beperken tot een acceptabel bereik.

Alpha geeft de fout aan op het niveau van significantie en wordt bepaald door de onderzoeker. Om het standaard significantieniveau of betrouwbaarheidsniveau van 5% voor waarschijnlijkheidsberekeningen te handhaven, wordt dit op 5% behouden.

Volgens de toepasselijke benchmarks en definities voor besluitvorming:

“Dit (alfa) criterium is meestal ingesteld op 0, 05 (a = 0, 05) en we vergelijken het alfaniveau met de p-waarde. Wanneer de kans op een Type I-fout kleiner is dan 5% (p <0, 05), besluiten we de nulhypothese te verwerpen; anders behouden we de nulhypothese. ”
De technische term die voor deze waarschijnlijkheid wordt gebruikt, is p-waarde . Het wordt gedefinieerd als "de kans op het verkrijgen van een steekproefresultaat, gegeven het feit dat de waarde vermeld in de nulhypothese waar is. De p-waarde voor het verkrijgen van een steekproefresultaat wordt vergeleken met het significantieniveau. "
Een Type II-fout of bèta-fout wordt gedefinieerd als "de kans dat de nulhypothese onjuist wordt gehandhaafd, terwijl deze in feite niet van toepassing is op de hele populatie."

Nog een paar voorbeelden zullen deze en andere berekeningen demonstreren.

voorbeeld 1

Er bestaat een maandelijks beleggingsplan dat variabele maandelijkse rendementen belooft. Een belegger zal er alleen in beleggen als hij verzekerd is van een gemiddeld $ 180 maandelijks inkomen. Hij heeft een steekproef van 300 maanden rendement met een gemiddelde van $ 190 en een standaardafwijking van $ 75. Moet hij of zij in deze regeling investeren ">

Laten we het probleem oplossen. De belegger zal in de regeling investeren als hij of zij verzekerd is van zijn gewenste gemiddelde rendement van $ 180.

H ₀ : nulhypothese: gemiddelde = 180

H ₁ : Alternatieve hypothese: gemiddelde> 180

Methode 1: Kritische waardebenadering

Identificeer een kritische waarde X _L voor het steekproefgemiddelde, die groot genoeg is om de nulhypothese te verwerpen - dat wil zeggen de nulhypothese verwerpen als het steekproefgemiddelde> = kritische waarde X _L

P (identificeer een Type I alpha-fout) = P (verwerp H ₀ gegeven dat H ₀ waar is),

Dit zou worden bereikt wanneer het steekproefgemiddelde de kritische limieten overschrijdt.

= P (gegeven dat H ₀ waar is) = alfa

Grafisch ziet het er als volgt uit:

Neem alfa = 0, 05 (dwz 5% significantieniveau), Z _{0, 05} = 1, 645 (uit de Z-tabel of de normale distributietabel)

=> X _L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Aangezien het steekproefgemiddelde (190) groter is dan de kritische waarde (187.12), wordt de nulhypothese verworpen en de conclusie is dat het gemiddelde maandelijkse rendement inderdaad groter is dan $ 180, zodat de belegger kan overwegen in deze regeling te beleggen.

Methode 2: gestandaardiseerde teststatistieken gebruiken

Men kan ook gestandaardiseerde waarde z gebruiken.

Teststatistiek, Z = (steekproefgemiddelde - populatiegemiddelde) / (std-dev / sqrt (aantal monsters).

Vervolgens wordt het afwijzingsgebied het volgende:

Z = (190 - 180) / (75 / sqrt (300)) = 2.309

Ons afwijzingsgebied bij een significantieniveau van 5% is Z> Z _{0, 05} = 1, 645.

Omdat Z = 2.309 groter is dan 1.645, kan de nulhypothese worden afgewezen met een soortgelijke hierboven genoemde conclusie.

Methode 3: P-waardeberekening

We willen P identificeren (steekproefgemiddelde> = 190, wanneer gemiddelde = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

De volgende tabel voor het afleiden van p-waardeberekeningen concludeert dat er bevestigde aanwijzingen zijn dat gemiddelde maandelijkse rendementen hoger zijn dan 180:

p-value

Gevolgtrekking

minder dan 1%

Bevestigd bewijs ter ondersteuning van alternatieve hypothesen

tussen 1% en 5%

Sterk bewijs ter ondersteuning van alternatieve hypothesen

tussen 5% en 10%

Zwak bewijsmateriaal dat alternatieve hypothese ondersteunt

groter dan 10%

Geen bewijs voor alternatieve hypothese

Voorbeeld 2

Een nieuwe effectenmakelaar (XYZ) beweert dat zijn bemiddelingskosten lager zijn dan die van uw huidige effectenmakelaar (ABC). Uit gegevens van een onafhankelijk onderzoeksbureau blijkt dat het gemiddelde en de standaardwaarde van alle ABC-brokercliënten respectievelijk $ 18 en $ 6 zijn.

Er wordt een steekproef van 100 klanten van ABC genomen en de bemiddelingskosten worden berekend met de nieuwe tarieven van XYZ-makelaar. Als het gemiddelde van de steekproef $ 18, 75 is en std-dev hetzelfde is ($ 6), kan er een conclusie worden getrokken over het verschil in de gemiddelde makelaarsrekening tussen ABC en XYZ-makelaar ">

H ₀ : nulhypothese: gemiddelde = 18

H ₁ : Alternatieve hypothese: gemiddelde 18 (dit willen we bewijzen.)

Afstellingsgebied: Z <= - Z _2.5 en Z> = Z _2.5 (uitgaande van een 5% significantieniveau, split 2, 5 aan elke kant).

Z = (steekproefgemiddelde - gemiddelde) / (std-dev / sqrt (aantal monsters))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Deze berekende Z-waarde valt tussen de twee limieten gedefinieerd door:

- Z _{2, 5} = -1, 96 en Z _{2, 5} = 1, 96.

Dit concludeert dat er onvoldoende bewijs is om te concluderen dat er een verschil is tussen de tarieven van uw bestaande makelaar en de nieuwe makelaar.

Als alternatief kan de p-waarde = P (Z1.25)

= 2 * 0.1056 = 0.2112 = 21.12% dat groter is dan 0.05 of 5%, wat tot dezelfde conclusie leidt.

Grafisch wordt het voorgesteld door het volgende:

Kritiekpunten voor de hypothetische testmethode:

Een statistische methode gebaseerd op veronderstellingen
Foutgevoelig zoals gedetailleerd in termen van alfa- en bètafouten
De interpretatie van p-waarde kan dubbelzinnig zijn en tot verwarrende resultaten leiden

Het komt neer op

Met behulp van hypothesetests kan een wiskundig model een claim of idee met een bepaald betrouwbaarheidsniveau valideren. Net als de meeste statistische hulpmiddelen en modellen, zijn er echter enkele beperkingen. Het gebruik van dit model voor het nemen van financiële beslissingen moet kritisch worden overwogen, rekening houdend met alle afhankelijkheden. Alternatieve methoden zoals Bayesiaanse inferentie zijn ook de moeite van het verkennen waard voor vergelijkbare analyses.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

← 10 aandelen die zullen gedijen als een stijging van de consumentenuitgaven

Quickbooks versus Quicken: wat is het verschil? →

Aanbevolen

Laat Een Reactie Achter