Hoofd- » algoritmische handel » Regressiebeginselen voor bedrijfsanalyse

Regressiebeginselen voor bedrijfsanalyse

algoritmische handel : Regressiebeginselen voor bedrijfsanalyse

Als je je ooit hebt afgevraagd hoe twee of meer gegevens op elkaar betrekking hebben (bijvoorbeeld hoe het bbp wordt beïnvloed door veranderingen in werkloosheid en inflatie), of als je baas je ooit heeft gevraagd om een ​​voorspelling te maken of voorspellingen te analyseren op basis van over relaties tussen variabelen, dan zou het leren van regressieanalyse de moeite waard zijn.

In dit artikel leert u de basisprincipes van eenvoudige lineaire regressie, ook wel 'gewone kleinste kwadraten' of OLS-regressie genoemd - een hulpmiddel dat vaak wordt gebruikt bij prognoses en financiële analyses. We zullen beginnen met het leren van de kernprincipes van regressie, eerst leren over covariantie en correlatie, en dan verder gaan met het bouwen en interpreteren van een regressie-output. Populaire bedrijfssoftware zoals Microsoft Excel kan alle regressieberekeningen en -outputs voor u uitvoeren, maar het is nog steeds belangrijk om de onderliggende mechanismen te leren.

Variabelen

De kern van een regressiemodel is de relatie tussen twee verschillende variabelen, de afhankelijke en onafhankelijke variabelen. Stel bijvoorbeeld dat u de verkopen voor uw bedrijf wilt voorspellen en dat u hebt geconcludeerd dat de verkopen van uw bedrijf stijgen en dalen, afhankelijk van veranderingen in het bbp.

De omzet die u voorspelt zou de afhankelijke variabele zijn omdat hun waarde "afhankelijk" is van de waarde van het BBP en het BBP de onafhankelijke variabele zou zijn. U moet dan de sterkte van de relatie tussen deze twee variabelen bepalen om de verkoop te voorspellen. Als het BBP met 1% toeneemt / afneemt, hoeveel zal uw omzet dan stijgen of dalen?

covariantie

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {uitgelijnd} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {uitgelijnd} Cov (x, y) = ∑N (xn −xu) (yn −yu)

De formule om de relatie tussen twee variabelen te berekenen, wordt covariantie genoemd. Deze berekening toont u de richting van de relatie. Als de ene variabele toeneemt en de andere variabele de neiging heeft ook te stijgen, zou de covariantie positief zijn. Als de ene variabele omhoog gaat en de andere de neiging heeft om omlaag te gaan, dan zou de covariantie negatief zijn.

Het werkelijke aantal dat u krijgt door dit te berekenen, kan moeilijk te interpreteren zijn omdat het niet gestandaardiseerd is. Een covariantie van vijf kan bijvoorbeeld worden geïnterpreteerd als een positieve relatie, maar de sterkte van de relatie kan alleen worden gezegd sterker te zijn dan als het getal vier of zwakker was dan als het getal zes was.

Correlatiecoëfficiënt

Correlatie = ρxy = Covxysxsy \ begin {uitgelijnd} & Correlatie = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {uitgelijnd} Correlatie = ρxy = sx sy Covxy

We moeten de covariantie standaardiseren om ons in staat te stellen deze beter te interpreteren en te gebruiken bij het voorspellen, en het resultaat is de correlatieberekening. De correlatieberekening neemt eenvoudig de covariantie en deelt deze door het product van de standaarddeviatie van de twee variabelen. Dit bindt de correlatie tussen een waarde van -1 en +1.

Een correlatie van +1 kan worden geïnterpreteerd om te suggereren dat beide variabelen perfect positief met elkaar bewegen en een -1 impliceert dat ze perfect negatief gecorreleerd zijn. In ons vorige voorbeeld, als de correlatie +1 is en het BBP met 1% toeneemt, zou de omzet met 1% stijgen. Als de correlatie -1 is, zou een toename van het bbp met 1% leiden tot een daling van de omzet met 1% - precies het tegenovergestelde.

Regressievergelijking

Nu we weten hoe de relatieve relatie tussen de twee variabelen wordt berekend, kunnen we een regressievergelijking ontwikkelen om de gewenste variabele te voorspellen of te voorspellen. Hieronder staat de formule voor een eenvoudige lineaire regressie. De "y" is de waarde die we proberen te voorspellen, de "b" is de helling van de regressielijn, de "x" is de waarde van onze onafhankelijke waarde en de "a" vertegenwoordigt het y-onderschepping. De regressievergelijking beschrijft eenvoudig de relatie tussen de afhankelijke variabele (y) en de onafhankelijke variabele (x).

y = bx + a \ begin {uitgelijnd} & y = bx + a \\ \ end {uitgelijnd} y = bx + a

Het onderscheppen, of "a", is de waarde van y (afhankelijke variabele) als de waarde van x (onafhankelijke variabele) nul is en wordt daarom soms eenvoudig de 'constante' genoemd. Dus als er geen verandering in het BBP zou zijn, zou uw bedrijf nog wat verkopen - deze waarde, wanneer de verandering in het BBP nul is, is de onderschepping. Bekijk de onderstaande grafiek om een ​​grafische weergave van een regressievergelijking te zien. In deze grafiek worden slechts vijf gegevenspunten weergegeven door de vijf punten in de grafiek. Lineaire regressie probeert een lijn te schatten die het beste bij de gegevens past (een lijn die het beste past) en de vergelijking van die lijn resulteert in de regressievergelijking.

Afbeelding 1: Lijn van de beste pasvorm

Bron: Investopedia

Regressies in Excel

Nu u een deel van de achtergrond begrijpt die in een regressieanalyse komt, laten we een eenvoudig voorbeeld maken met de regressietools van Excel. We zullen voortbouwen op het vorige voorbeeld van proberen de omzet van volgend jaar te voorspellen op basis van veranderingen in het bbp. In de volgende tabel worden enkele kunstmatige gegevenspunten vermeld, maar deze cijfers zijn in het echt gemakkelijk toegankelijk.

JaarverkoopBBP
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Als je alleen maar naar de tabel kijkt, zie je dat er een positieve correlatie is tussen omzet en BBP. Beide hebben de neiging om samen omhoog te gaan. Met Excel hoeft u alleen maar op de vervolgkeuzelijst Extra te klikken, Gegevensanalyse te selecteren en vervolgens Regressie te kiezen. Het pop-upvenster is vanaf daar eenvoudig in te vullen; uw Input Y-bereik is uw kolom "Verkoop" en uw Input X-bereik is de wijziging in de kolom GDP; kies het uitvoerbereik voor waar u de gegevens wilt weergeven in uw spreadsheet en druk op OK. U zou iets moeten zien dat lijkt op wat in de onderstaande tabel wordt gegeven:

Regressie Statistieken Coëfficiënten

Meerdere R0.8292243Onderscheppen34, 58409

R plein


0.687613BBP88, 15552
Bijgestelde
R plein


0.583484

-


-


Standaardfout51.021807-

-


Waarnemingen5

-


-


Interpretatie

De belangrijkste outputs waar u zich zorgen over moet maken voor eenvoudige lineaire regressie zijn de R-kwadraat, de intercept (constant) en de beta (b) -coëfficiënt van het BBP. Het R-kwadraatgetal in dit voorbeeld is 68, 7% - dit laat zien hoe goed ons model de toekomstige verkopen voorspelt of voorspelt, wat suggereert dat de verklarende variabelen in het model 68, 7% van de variatie in de afhankelijke variabele voorspelden. Vervolgens hebben we een onderschepping van 34, 58, wat ons vertelt dat als de voorspelling van de verandering van het BBP nul zou zijn, onze verkoop ongeveer 35 eenheden zou bedragen. En ten slotte vertelt de BBP-bèta of correlatiecoëfficiënt van 88, 15 ons dat als het BBP met 1% stijgt, de verkoop waarschijnlijk met ongeveer 88 eenheden zal stijgen.

Het komt neer op

Dus hoe zou u dit eenvoudige model in uw bedrijf gebruiken ">

Natuurlijk is dit slechts een eenvoudige regressie en er zijn modellen die u kunt bouwen die verschillende onafhankelijke variabelen gebruiken die meerdere lineaire regressies worden genoemd. Maar meerdere lineaire regressies zijn ingewikkelder en hebben verschillende problemen die een ander artikel nodig hebben om te bespreken.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.
Aanbevolen
Laat Een Reactie Achter