Hoofd- » algoritmische handel » Empirische regel

Empirische regel

Wat is de empirische regel?

De empirische regel, ook wel de three-sigma-regel of 68-95-99.7-regel genoemd, is een statistische regel die stelt dat voor een normale verdeling bijna alle gegevens binnen drie standaarddeviaties vallen (aangegeven met σ) van het gemiddelde ( aangegeven met µ). Uitgesplitst toont de empirische regel dat 68% binnen de eerste standaardafwijking (µ ± σ) valt, 95% binnen de eerste twee standaardafwijkingen (µ ± 2σ) en 99, 7% binnen de eerste drie standaardafwijkingen (µ ± 3σ) .

01:33

Empirische regel

De empirische regel begrijpen

De empirische regel wordt vaak gebruikt in statistieken voor het voorspellen van eindresultaten. Na het berekenen van de standaarddeviatie en voordat exacte gegevens worden verzameld, kan deze regel worden gebruikt als een ruwe schatting van de uitkomst van de komende gegevens. Deze kans kan tussentijds worden gebruikt, omdat het verzamelen van geschikte gegevens tijdrovend of zelfs onmogelijk kan zijn. De empirische regel wordt ook gebruikt als een ruwe manier om de 'normaliteit' van een distributie te testen. Als te veel gegevenspunten buiten de drie standaardafwijkingsgrenzen vallen, suggereert dit dat de verdeling niet normaal is.

Belangrijkste leerpunten

De empirische regel stelt dat bijna alle gegevens binnen 3 standaarddeviaties van het gemiddelde liggen voor een normale verdeling.
Volgens deze regel valt 68% van de gegevens binnen één standaarddeviatie.
Vijfennegentig procent van de gegevens ligt binnen twee standaarddeviaties.
Binnen drie standaarddeviaties is 99, 7% van de gegevens.

Voorbeelden van de empirische regel

Laten we aannemen dat een populatie dieren in een dierentuin bekend is als normaal verspreid. Elk dier leeft gemiddeld 13, 1 jaar oud (gemiddeld) en de standaardafwijking van de levensduur is 1, 5 jaar. Als iemand de waarschijnlijkheid wil weten dat een dier langer dan 14, 6 jaar zal leven, kunnen ze de empirische regel gebruiken. Wetende dat het gemiddelde van de verdeling 13, 1 jaar oud is, treden de volgende leeftijdsgroepen op voor elke standaardafwijking:

Eén standaardafwijking (µ ± σ): (13, 1 - 1, 5) tot (13, 1 + 1, 5), of 11, 6 tot 14, 6
Twee standaardafwijkingen (µ ± 2σ): 13.1 - (2 x 1.5) tot 13.1 + (2 x 1.5), of 10.1 tot 16.1
Drie standaardafwijkingen (µ ± 3σ): 13, 1 - (3 x 1, 5) tot 13, 1 + (3 x 1, 5), of 8, 6 tot 17, 6

De persoon die dit probleem oplost, moet de totale waarschijnlijkheid berekenen dat het dier 14, 6 jaar of langer leeft. De empirische regel laat zien dat 68% van de verdeling binnen één standaardafwijking ligt, in dit geval van 11, 6 tot 14, 6 jaar. De resterende 32% van de verdeling ligt dus buiten dit bereik. De helft ligt boven 14.6 en de helft ligt onder 11.6. Dus de kans dat het dier meer dan 14, 6 leeft is 16% (berekend als 32% gedeeld door twee).

Als een ander voorbeeld, neem in plaats daarvan aan dat een dier in de dierentuin gemiddeld 10 jaar oud wordt, met een standaardafwijking van 1, 4 jaar. Stel dat de dierenverzorger probeert uit te rekenen hoe groot de kans is dat een dier langer dan 7, 2 jaar leeft. Deze verdeling ziet er als volgt uit:

Eén standaardafwijking (µ ± σ): 8, 6 tot 11, 4 jaar
Twee standaardafwijkingen (µ ± 2σ): 7, 2 tot 12, 8 jaar
Drie standaardafwijkingen ((µ ± 3σ): 5, 8 tot 14, 2 jaar

De empirische regel stelt dat 95% van de verdeling binnen twee standaarddeviaties ligt. Aldus ligt 5% buiten twee standaarddeviaties; half boven 12, 8 jaar en half onder 7, 2 jaar. De kans om langer dan 7, 2 jaar te leven is dus:

95% + (5% / 2) = 97, 5%

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Monte Carlo-simulatie Monte Carlo-simulaties worden gebruikt om de waarschijnlijkheid van verschillende uitkomsten te modelleren in een proces dat niet gemakkelijk kan worden voorspeld vanwege de interventie van willekeurige variabelen. meer Wat zijn de kansen? Hoe de kansverdeling werkt Een kansverdeling is een statistische functie die mogelijke waarden en waarschijnlijkheden beschrijft die een willekeurige variabele binnen een gegeven bereik kan hebben. meer Bellen in de belcurve Een belcurve is het meest voorkomende type verdeling voor een variabele en wordt daarom als een normale verdeling beschouwd. De term "klokkromme" komt voort uit het feit dat de grafiek die wordt gebruikt om een normale verdeling weer te geven, bestaat uit een klokvormige lijn. meer Normale verdeling Normale verdeling is een continue kansverdeling waarbij waarden op een symmetrische manier liggen die meestal rond het gemiddelde ligt. meer Log-normale verdeling Een log-normale verdeling is een statistische verdeling van logaritmische waarden uit een gerelateerde normale verdeling. meer Standaardafwijking Definitie De standaardafwijking is een statistiek die de spreiding van een gegevensset ten opzichte van het gemiddelde meet en wordt berekend als de vierkantswortel van de variantie. Het wordt berekend als de vierkantswortel van variantie door de variatie tussen elk gegevenspunt ten opzichte van het gemiddelde te bepalen. meer partnerlinks

← De voors en (meestal) nadelen van vervroegde uittreding

Natuurlijke selectie →

Aanbevolen

Laat Een Reactie Achter