Hoofd- » algoritmische handel » Meervoudige lineaire regressie - MLR-definitie

Meervoudige lineaire regressie - MLR-definitie

algoritmische handel : Meervoudige lineaire regressie - MLR-definitie
Wat is multiple lineaire regressie - MLR?

Multiple linear regression (MLR), ook bekend als multiple regressie, is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen. Het doel van multiple linear regression (MLR) is het modelleren van de lineaire relatie tussen de verklarende (onafhankelijke) variabelen en respons (afhankelijke) variabele.

In essentie is meervoudige regressie de uitbreiding van gewone OLS-regressie (minste vierkanten) waarbij meer dan één verklarende variabele betrokken is.

De formule voor meervoudige lineaire regressie is

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵwaar, voor i = n observaties: yi = afhankelijke variabelexi = expanatory variabelenβ0 = y-intercept (constante term) βp = hellingscoëfficiënten voor elke verklarende variabeleϵ = de foutterm van het model (ook bekend als de residuen) \ begin {uitgelijnd} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {where, for} i = n \ textbf {observaties:} \\ & y_i = \ text {afhankelijke variabele} \\ & x_i = \ text {expanatory variables} \\ & \ beta_0 = \ text {y-intercept (constant term)} \\ & \ beta_p = \ text {hellingcoëfficiënten voor elke verklarende variabele} \\ & \ epsilon = \ text {de foutterm van het model (ook bekend als de residuen)} \\ \ end {uitgelijnd} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵwaar, voor i = n observaties: yi = afhankelijke variabelexi = expanatory variabelenβ0 = y-intercept (constante term) βp = Hellingscoëfficiënten voor elke verklarende variabeleϵ = de foutterm van het model (ook bekend als de residuen)

Meerdere lineaire regressie verklaren

Een eenvoudige lineaire regressie is een functie waarmee een analist of statisticus voorspellingen kan doen over een variabele op basis van de informatie die bekend is over een andere variabele. Lineaire regressie kan alleen worden gebruikt als er twee continue variabelen zijn - een onafhankelijke variabele en een afhankelijke variabele. De onafhankelijke variabele is de parameter die wordt gebruikt om de afhankelijke variabele of uitkomst te berekenen. Een meervoudig regressiemodel strekt zich uit tot verschillende verklarende variabelen.

Het meervoudige regressiemodel is gebaseerd op de volgende veronderstellingen:

  • Er is een lineair verband tussen de afhankelijke variabelen en de onafhankelijke variabelen.
  • De onafhankelijke variabelen zijn niet al te sterk met elkaar gecorreleerd.
  • y i observaties worden onafhankelijk en willekeurig uit de populatie geselecteerd.
  • Residuen moeten normaal verdeeld worden met een gemiddelde van 0 en variantie σ.

De bepalingscoëfficiënt (R-kwadraat) is een statistische metriek die wordt gebruikt om te meten hoeveel van de variatie in uitkomst kan worden verklaard door de variatie in de onafhankelijke variabelen. R2 neemt altijd toe naarmate er meer voorspellers aan het MLR-model worden toegevoegd, ook al zijn de voorspellers mogelijk niet gerelateerd aan de uitkomstvariabele.

R2 kan op zichzelf dus niet worden gebruikt om te bepalen welke voorspellers in een model moeten worden opgenomen en welke moeten worden uitgesloten. R2 kan alleen tussen 0 en 1 zijn, waarbij 0 aangeeft dat de uitkomst niet kan worden voorspeld door een van de onafhankelijke variabelen en 1 geeft aan dat de uitkomst kan worden voorspeld zonder fouten uit de onafhankelijke variabelen.

Bij het interpreteren van de resultaten van een meervoudige regressie zijn bèta-coëfficiënten geldig terwijl alle andere variabelen constant worden gehouden ("al het andere gelijk"). De uitvoer van een meervoudige regressie kan horizontaal worden weergegeven als een vergelijking, of verticaal in tabelvorm.

Voorbeeld met meerdere lineaire regressie

Een analist wil bijvoorbeeld weten hoe de beweging van de markt de prijs van Exxon Mobil (XOM) beïnvloedt. In dit geval heeft zijn lineaire vergelijking de waarde van de S&P 500-index als de onafhankelijke variabele of voorspeller en de prijs van XOM als de afhankelijke variabele.

In werkelijkheid zijn er meerdere factoren die de uitkomst van een gebeurtenis voorspellen. De prijsontwikkeling van Exxon Mobil is bijvoorbeeld afhankelijk van meer dan alleen de prestaties van de totale markt. Andere voorspellers zoals de olieprijs, rentetarieven en de prijsbeweging van oliefutures kunnen de prijs van XOM en aandelenkoersen van andere oliemaatschappijen beïnvloeden. Om een ​​relatie te begrijpen waarin meer dan twee variabelen aanwezig zijn, wordt een meervoudige lineaire regressie gebruikt.

Meervoudige lineaire regressie (MLR) wordt gebruikt om een ​​wiskundige relatie tussen een aantal willekeurige variabelen te bepalen. Met andere woorden, MLR onderzoekt hoe meerdere onafhankelijke variabelen gerelateerd zijn aan één afhankelijke variabele. Nadat elk van de onafhankelijke factoren is bepaald om de afhankelijke variabele te voorspellen, kan de informatie over de meerdere variabelen worden gebruikt om een ​​nauwkeurige voorspelling te maken van het effectniveau dat ze hebben op de uitkomstvariabele. Het model creëert een relatie in de vorm van een rechte lijn (lineair) die het beste alle individuele gegevenspunten benadert.

Verwijzend naar de MLR-vergelijking hierboven, in ons voorbeeld:

  • y i = afhankelijke variabele: prijs van XOM
  • x i1 = rentetarieven
  • x i2 = olieprijs
  • x i3 = waarde van de S&P 500-index
  • x i4 = prijs van oliefutures
  • B 0 = y-onderscheppen op tijdstip nul
  • B 1 = regressiecoëfficiënt die een eenheidsverandering in de afhankelijke variabele meet wanneer x i1 verandert - de verandering in XOM-prijs wanneer rentetarieven veranderen
  • B 2 = coëfficiëntwaarde die een eenheidsverandering meet in de afhankelijke variabele wanneer x i2 verandert - de verandering in XOM-prijs wanneer de olieprijzen veranderen

De schattingen van de kleinste kwadraten, B 0, B 1, B 2 ... B p, worden meestal berekend door statistische software. Zoals veel variabelen kunnen worden opgenomen in het regressiemodel waarin elke onafhankelijke variabele wordt onderscheiden met een getal - 1, 2, 3, 4 ... p. Met het meervoudige regressiemodel kan een analist een uitkomst voorspellen op basis van informatie die wordt verstrekt over meerdere verklarende variabelen.

Toch is het model niet altijd perfect nauwkeurig, omdat elk gegevenspunt enigszins kan verschillen van de door het model voorspelde uitkomst. De restwaarde, E, wat het verschil is tussen de werkelijke uitkomst en de voorspelde uitkomst, is in het model opgenomen om rekening te houden met dergelijke kleine variaties.

Ervan uitgaande dat we ons XOM-prijsregressiemodel uitvoeren via statistische berekeningssoftware, die deze uitvoer retourneert:

Een analist interpreteert deze output als betekent dat als andere variabelen constant worden gehouden, de prijs van XOM met 7, 8% zal stijgen als de olieprijs op de markten met 1% stijgt. Het model laat ook zien dat de prijs van XOM met 1, 5% zal dalen na een rentestijging van 1%. R2 geeft aan dat 86, 5% van de variaties in de aandelenkoers van Exxon Mobil kan worden verklaard door veranderingen in de rente, de olieprijs, de oliefutures en de S&P 500-index.

Belangrijkste leerpunten

  • Multiple linear regression (MLR), ook bekend als eenvoudigweg multiple regressie, is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen.
  • Meervoudige regressie is een uitbreiding van lineaire (OLS) regressie die slechts één verklarende variabele gebruikt.
  • MLR wordt veelvuldig gebruikt in econometrie en financiële inferentie.

Het verschil tussen lineaire en meervoudige regressie

Lineaire (OLS) regressie vergelijkt de respons van een afhankelijke variabele bij een wijziging in een verklarende variabele. Het is echter zeldzaam dat een afhankelijke variabele wordt verklaard door slechts één variabele. In dit geval gebruikt een analist meervoudige regressie, die probeert een afhankelijke variabele uit te leggen met behulp van meer dan één onafhankelijke variabele. Meerdere regressies kunnen lineair en niet-lineair zijn.

Meerdere regressies zijn gebaseerd op de veronderstelling dat er een lineair verband bestaat tussen zowel de afhankelijke als de onafhankelijke variabelen. Het veronderstelt ook geen belangrijke correlatie tussen de onafhankelijke variabelen.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Welke regressiemaatregelen Regressie is een statistische meting die probeert de sterkte van de relatie tussen een afhankelijke variabele (meestal aangeduid met Y) en een reeks andere veranderende variabelen (bekend als onafhankelijke variabelen) te bepalen. meer Wat is een foutterm "> Een foutterm wordt gedefinieerd als een variabele in een statistisch model, dat wordt gemaakt wanneer het model de werkelijke relatie tussen de onafhankelijke en afhankelijke variabelen niet volledig weergeeft. meer Hoe de methode met de minste vierkanten het minst werkt kwadratenmethode is een statistische techniek om de best passende lijn voor een model te bepalen, gespecificeerd door een vergelijking met bepaalde parameters voor waargenomen gegevens meer Econometrie: wat het betekent en hoe het wordt gebruikt Econometrie is de toepassing van statistische en wiskundige modellen op economische gegevens voor het testen van theorieën, hypothesen en toekomstige trends meer R-kwadraat R-kwadraat is een statistische maat die het deel van de variantie voor een afhankelijke variabele weergeeft dat wordt verklaard door een onafhankelijke variabele meer Hoe de bepalingscoëfficiënt werkt De bepalingscoëfficiënt is een maat die in de statistische analyse wordt gebruikt om te beoordelen hoe goed een model toekomstige resultaten verklaart en voorspelt. rtner-links
Aanbevolen
Laat Een Reactie Achter