Hoofd- » algoritmische handel » Som van de kwadraten

Som van de kwadraten

algoritmische handel : Som van de kwadraten
Wat is de som van vierkanten?

Som van vierkanten is een statistische techniek die wordt gebruikt in regressieanalyse om de spreiding van gegevenspunten te bepalen. In een regressieanalyse is het doel om te bepalen hoe goed een gegevensreeks kan worden aangepast aan een functie die kan helpen verklaren hoe de gegevensreeks is gegenereerd. Som van vierkanten wordt gebruikt als een wiskundige manier om de functie te vinden die het beste past (het minst varieert) van de gegevens.

De formule voor som van vierkanten is

Voor een set X van n items: Som van vierkanten = ∑i = 0n (Xi − X‾) 2where: Xi = Het ith-item in de setX‾ = Het gemiddelde van alle items in de set (Xi − X‾) = De afwijking van elk item van het gemiddelde \ begin {uitgelijnd} & \ text {Voor een set} X \ text {of} n \ text {items:} \\ & \ text {Som van vierkanten} = \ sum_ {i = 0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {where:} \\ & X_i = \ text {The} i ^ {th} \ text {item in het set} \\ & \ overline {X} = \ text {Het gemiddelde van alle items in de set} \\ & \ left (X_i- \ overline {X} \ right) = \ text {De afwijking van elk item van de gemiddelde} \\ \ einde {uitgelijnd} Voor een set X van n items: Som van vierkanten = i = 0∑n (Xi −X) 2waar: Xi = Het ith-item in de setX = Het gemiddelde van alle items in de set (Xi −X) = De afwijking van elk item van het gemiddelde

Som van vierkanten is ook bekend als variatie.

Wat zegt de som van vierkanten?

De som van vierkanten is een maat voor afwijking van het gemiddelde. In de statistiek is het gemiddelde het gemiddelde van een reeks getallen en is het de meest gebruikte maat voor centrale neiging. Het rekenkundig gemiddelde wordt eenvoudig berekend door de waarden in de gegevensset samen te vatten en te delen door het aantal waarden.

Laten we zeggen dat de slotkoersen van Microsoft (MSFT) in de afgelopen vijf dagen 74, 01, 74, 77, 73, 94, 73, 61 en 73, 40 in Amerikaanse dollars waren. De som van de totale prijzen is $ 369, 73 en de gemiddelde of gemiddelde prijs van het handboek zou dus $ 369, 73 / 5 = $ 73, 95 zijn.

Maar het gemiddelde van een meetset kennen is niet altijd voldoende. Soms is het handig om te weten hoeveel variatie er is in een reeks metingen. Hoe ver de individuele waarden zich van het gemiddelde bevinden, kan enig inzicht geven in hoe geschikt de waarnemingen of waarden zijn voor het gecreëerde regressiemodel.

Als een analist bijvoorbeeld wil weten of de aandelenkoers van MSFT samen met de koers van Apple (AAPL) beweegt, kan hij de reeks observaties voor het proces van beide aandelen voor een bepaalde periode, bijvoorbeeld 1, 2, op een rij zetten., of 10 jaar en maak een lineair model met elk van de waargenomen waarnemingen of metingen. Als de relatie tussen beide variabelen (dat wil zeggen de prijs van AAPL en de prijs van MSFT) geen rechte lijn is, zijn er variaties in de gegevensset die moeten worden onderzocht.

In statistieken gesproken, als de lijn in het gecreëerde lineaire model niet alle waardemetingen doorloopt, is een deel van de variabiliteit die is waargenomen in de aandelenkoersen niet verklaard. De som van kwadraten wordt gebruikt om te berekenen of er een lineair verband bestaat tussen twee variabelen, en elke onverklaarde variabiliteit wordt de resterende som van kwadraten genoemd.

De som van vierkanten is de som van het kwadraat van variatie, waarbij variatie wordt gedefinieerd als de spreiding tussen elke individuele waarde en het gemiddelde. Om de som van de vierkanten te bepalen, wordt de afstand tussen elk gegevenspunt en de best passende lijn gekwadrateerd en vervolgens opgeteld. De best passende lijn zal deze waarde minimaliseren.

Hoe de som van vierkanten te berekenen

Nu kunt u zien waarom de meting de som van kwadratische afwijkingen wordt genoemd, of de som van kwadraten in het kort. Met behulp van ons MSFT-voorbeeld hierboven kan de som van vierkanten worden berekend als:

  • SS = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 2
  • SS = (0.06) 2 + (0.82) 2 + (-0.01) 2 + (-0.34) 2 + (-0.55) 2
  • SS = 1, 0942

Het optellen van de som van de afwijkingen alleen zonder het kwadraat zal resulteren in een getal gelijk aan of bijna nul, aangezien de negatieve afwijkingen de positieve afwijkingen vrijwel perfect zullen compenseren. Om een ​​realistischer getal te krijgen, moet de som van de afwijkingen worden gekwadrateerd. De som van de kwadraten zal altijd een positief getal zijn omdat het kwadraat van een willekeurig getal, of het nu positief of negatief is, altijd positief is.

Voorbeeld van het gebruik van de som van vierkanten

Op basis van de resultaten van de MSFT-berekening geeft een hoge som van vierkanten aan dat de meeste waarden verder van het gemiddelde verwijderd zijn en dat er dus een grote variabiliteit in de gegevens is. Een lage som van vierkanten verwijst naar lage variabiliteit in de reeks observaties.

In het bovenstaande voorbeeld laat 1.0942 zien dat de variabiliteit in de aandelenkoers van MSFT in de afgelopen vijf dagen erg laag is en dat beleggers die willen beleggen in aandelen die worden gekenmerkt door prijsstabiliteit en lage volatiliteit, kunnen kiezen voor MSFT.

Belangrijkste leerpunten

  • De som van de vierkanten meet de afwijking van gegevenspunten weg van de gemiddelde waarde.
  • Een hoger resultaat van de kwadraten duidt op een grote mate van variabiliteit binnen de gegevensverzameling, terwijl een lager resultaat aangeeft dat de gegevens aanzienlijk verschillen van de gemiddelde waarde.

Beperkingen van het gebruik van de som van vierkanten

Het nemen van een investeringsbeslissing over welke aandelen u moet kopen, vereist veel meer observaties dan de hier vermelde. Een analist moet mogelijk met jaren aan gegevens werken om met een grotere zekerheid te weten hoe hoog of laag de variabiliteit van een actief is. Naarmate er meer gegevenspunten aan de set worden toegevoegd, wordt de som van de vierkanten groter naarmate de waarden meer gespreid zijn.

De meest gebruikte variatiemetingen zijn de standaardafwijking en variantie. Om een ​​van de twee metrieken te berekenen, moet echter eerst de som van de vierkanten worden berekend. De variantie is het gemiddelde van de som van vierkanten (dat wil zeggen de som van vierkanten gedeeld door het aantal waarnemingen). De standaarddeviatie is de vierkantswortel van de variantie.

Er zijn twee methoden voor regressieanalyse die de som van vierkanten gebruiken: de lineaire kleinste kwadratenmethode en de niet-lineaire kleinste kwadratenmethode. De methode met de kleinste kwadraten verwijst naar het feit dat de regressiefunctie de som van de kwadraten van de variantie van de feitelijke gegevenspunten minimaliseert. Op deze manier is het mogelijk om een ​​functie te tekenen die statistisch gezien het beste past bij de gegevens. Merk op dat een regressiefunctie lineair (een rechte lijn) of niet-lineair (een kromme lijn) kan zijn.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Hoe de kleinste kwadratenmethode werkt De kleinste kwadratenmethode is een statistische techniek om de best passende lijn voor een model te bepalen, gespecificeerd door een vergelijking met bepaalde parameters voor waargenomen gegevens. meer Hoe de kleinste vierkanten-criteriummethode werkt Het kleinste-vierkantencriterium is een methode voor het meten van de nauwkeurigheid van een lijn bij het weergeven van de gegevens die zijn gebruikt om deze te genereren. Dat wil zeggen dat de formule de best passende lijn bepaalt. meer Standaardafwijking Definitie De standaardafwijking is een statistiek die de spreiding van een gegevensset ten opzichte van het gemiddelde meet en wordt berekend als de vierkantswortel van de variantie. Het wordt berekend als de vierkantswortel van variantie door de variatie tussen elk gegevenspunt ten opzichte van het gemiddelde te bepalen. meer De variantie-vergelijking gebruiken Variantie is een meting van de spreiding tussen getallen in een gegevensset. Beleggers gebruiken de variantie-vergelijking om de activaspreiding van een portefeuille te evalueren. meer Hoe de resterende standaardafwijking werkt De resterende standaardafwijking is een statistische term die wordt gebruikt om het verschil in standaardafwijkingen van waargenomen waarden versus voorspelde waarden te beschrijven, zoals aangegeven door punten in een regressieanalyse. meer Hoe de bepalingscoëfficiënt werkt De bepalingscoëfficiënt is een maat die wordt gebruikt in statistische analyse om te beoordelen hoe goed een model toekomstige resultaten verklaart en voorspelt. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter