Hoofd- » algoritmische handel » Definitie van residuele standaardafwijking

Definitie van residuele standaardafwijking

algoritmische handel : Definitie van residuele standaardafwijking
Wat is de resterende standaardafwijking?

De resterende standaardafwijking is een statistische term die wordt gebruikt om het verschil in standaardafwijkingen van waargenomen waarden versus voorspelde waarden te beschrijven, zoals aangegeven door punten in een regressieanalyse. Regressie-analyse is een methode die in statistieken wordt gebruikt om een ​​relatie tussen twee verschillende variabelen te laten zien en om te beschrijven hoe goed u het gedrag van de ene variabele kunt voorspellen op basis van het gedrag van een andere.

Resterende standaardafwijking wordt ook de standaardafwijking van punten rond een gepaste lijn of de standaardschattingsfout genoemd.

De formules voor resterende en resterende standaardafwijking zijn

Residual = (Y − Yest) Sres = ∑ (Y − Yest) 2n − 2where: Sres = Residual standard deviationY = Observed valueYest = Geschatte of geprojecteerde valuen = Gegevenspunten in populatie \ begin {uitgelijnd} & \ text {Residual} = \ left (Y-Y_ {est} \ right) \\ & S_ {res} = \ sqrt {\ frac {\ sum \ left (Y-Y_ {est} \ right) ^ 2} {n-2}} \\ & \ textbf {where:} \\ & S_ {res} = \ text {Resterende standaarddeviatie} \\ & Y = \ text {Waargenomen waarde} \\ & Y_ {est} = \ text {Geschatte of geprojecteerde waarde} \\ & n = \ text {Gegevenspunten in populatie} \\ \ end {uitgelijnd} Residual = (Y − Yest) Sres = n − 2∑ (Y − Yest) 2 waarbij: Sres = Residual standard deviationY = Observed valueYest = Geschatte of geprojecteerde valuen = Gegevenspunten in populatie

Hoe de resterende standaardafwijking te berekenen

Om de resterende standaardafwijking te berekenen, moet eerst het verschil tussen de voorspelde waarden en de werkelijke waarden gevormd rond een passende lijn worden berekend. Dit verschil staat bekend als de restwaarde of, eenvoudigweg, residuen of de afstand tussen bekende gegevenspunten en die gegevenspunten voorspeld door het model.

Om de resterende standaardafwijking te berekenen, sluit u de residuen aan op de vergelijking voor de resterende standaardafwijking om de formule op te lossen.

Wat zegt de resterende standaardafwijking?

De resterende standaardafwijking is een goodness-of-fit-maat die kan worden gebruikt om te analyseren hoe goed een set datapunten in het daadwerkelijke model passen. In een bedrijfsomgeving, bijvoorbeeld, na een regressieanalyse op meerdere gegevenspunten van kosten in de loop van de tijd te hebben uitgevoerd, kan de resterende standaardafwijking een bedrijfseigenaar informatie verschaffen over het verschil tussen werkelijke kosten en geprojecteerde kosten en een idee van hoeveel geprojecteerde kosten kan afwijken van het gemiddelde van de historische kostengegevens.

Belangrijkste leerpunten

  • De resterende standaardafwijking is eenvoudig de standaardafwijking van de restwaarden, of het verschil tussen een reeks waargenomen en voorspelde waarden.
  • De standaarddeviatie van de residuen berekent hoeveel de datapunten zich over de regressielijn verspreiden.
  • Het resultaat wordt gebruikt om de fout van de voorspelbaarheid van de regressielijn te meten.

Voorbeeld van het berekenen van de resterende standaardafwijking

Begin met het berekenen van restwaarden. Ervan uitgaande dat u een set van vier waargenomen waarden hebt voor een naamloos experiment, geeft de onderstaande tabel y-waarden weer die zijn waargenomen en vastgelegd voor gegeven waarden van x :

X


Y


1


1


2


4


3


6


4


7


Als de lineaire vergelijking of helling van de lijn die wordt voorspeld door de gegevens in het model wordt gegeven als y est = 1x + 2 waarbij y est = voorspelde y-waarde, kan het residu voor elke observatie worden gevonden.

Het restant is gelijk aan (y - y est ), dus voor de eerste set is de werkelijke y-waarde 1 en de voorspelde yest- waarde die wordt gegeven door de vergelijking is y est = 1 (1) + 2 = 3. De restwaarde is dus 1 - 3 = -2, een negatieve restwaarde.

Voor de tweede set x- en y-gegevenspunten kan de voorspelde y-waarde wanneer x 2 is en y 4 is, worden berekend als 1 (2) + 2 = 4.

In dit geval zijn de werkelijke en voorspelde waarden hetzelfde, dus de restwaarde is nul. U zou hetzelfde proces gebruiken om te komen tot de voorspelde waarden voor y in de resterende twee gegevenssets.

Nadat u de restwaarden voor alle punten hebt berekend met behulp van de tabel of een grafiek, gebruikt u de formule voor de resterende standaardafwijking.

Breid de bovenstaande tabel uit en bereken de resterende standaardafwijking:

X

Y

ja est

Overig (jj est )

Som van elke resterende kwadraat, of Σ (jj est ) 2

1

1

3

-2

4

2

4

4

0

0

3

6

5

1

1

4

7

6

1

1

Merk op dat de som van de gekwadrateerde residuen = 6, die de teller van de standaardrestafwijkingsvergelijking vertegenwoordigt.

Voor het onderste gedeelte of de noemer van de residuele standaardafwijkingvergelijking, n = het aantal gegevenspunten, dat in dit geval 4 is. Bereken de noemer van de vergelijking als:

  • (Aantal residuen - 2) = (4 - 2) = 2

Bereken ten slotte de vierkantswortel van de resultaten:

  • Reststandaardafwijking: √ (6/2) = √3 ≈ 1.732

De grootte van een typische restwaarde kan u in het algemeen een idee geven van hoe dicht uw schattingen zijn. Hoe kleiner de resterende standaardafwijking, des te dichter is de aanpassing van de schatting aan de werkelijke gegevens. In feite, hoe kleiner de resterende standaardafwijking wordt vergeleken met de standaardafwijking van de steekproef, hoe voorspellend of bruikbaar het model is.

De resterende standaardafwijking kan worden berekend wanneer een regressieanalyse is uitgevoerd, evenals een variantieanalyse (ANOVA). Bij het bepalen van een kwantificatielimiet (LoQ) is het gebruik van een residuele standaarddeviatie toegestaan ​​in plaats van de standaarddeviatie.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Wat is een foutterm? Een foutterm wordt gedefinieerd als een variabele in een statistisch model, die wordt gemaakt wanneer het model niet de werkelijke relatie tussen de onafhankelijke en afhankelijke variabelen weergeeft. meer Hoe de minst kwadratenmethode werkt De minst kwadratenmethode is een statistische techniek om de best passende lijn voor een model te bepalen, gespecificeerd door een vergelijking met bepaalde parameters voor waargenomen gegevens. meer Inzicht in de statistiek van Durbin Watson De statistiek van Durbin Watson is een getal dat test op autocorrelatie in de residuen van een statistische regressieanalyse. meer Hoe de som van kwadraten statistische techniek werkt Som van kwadraten is een statistische techniek die wordt gebruikt in regressieanalyse om de spreiding van gegevenspunten te bepalen op basis van hun gemiddelde waarde. In een regressieanalyse is het doel om te bepalen hoe goed een gegevensreeks kan worden aangepast aan een functie die kan helpen verklaren hoe de gegevensreeks is gegenereerd. meer Hoe meervoudige lineaire regressie werkt Meervoudige lineaire regressie (MLR) is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen. meer Standaardafwijking Definitie De standaardafwijking is een statistiek die de spreiding van een gegevensset ten opzichte van het gemiddelde meet en wordt berekend als de vierkantswortel van de variantie. Het wordt berekend als de vierkantswortel van variantie door de variatie tussen elk gegevenspunt ten opzichte van het gemiddelde te bepalen. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter