Hoofd- » algoritmische handel » overfitting

overfitting

algoritmische handel : overfitting
Wat is overfitting?

Overfitting is een modelleringsfout die optreedt wanneer een functie te nauw aansluit bij een beperkte set gegevenspunten. Overfitting van het model neemt meestal de vorm aan van het maken van een te complex model om eigenaardigheden in de gegevens te bestuderen.

In werkelijkheid bevatten de vaak bestudeerde gegevens een zekere mate van fouten of willekeurige ruis. Aldus kan een poging om het model te dicht te conformeren aan enigszins onnauwkeurige gegevens het model met aanzienlijke fouten infecteren en zijn voorspellende kracht verminderen.

[Belangrijk: financiële professionals moeten zich altijd bewust zijn van de gevaren van overfitting van een model op basis van beperkte gegevens.]

Overfitting begrijpen

Een veel voorkomend probleem is bijvoorbeeld het gebruik van computeralgoritmen om uitgebreide databases van historische marktgegevens te doorzoeken om patronen te vinden. Bij voldoende studie is het vaak mogelijk om uitgebreide stellingen te ontwikkelen die dingen lijken te voorspellen, zoals rendementen op de aandelenmarkt, met grote nauwkeurigheid.

Wanneer ze echter worden toegepast op gegevens buiten de steekproef, kunnen dergelijke stellingen waarschijnlijk slechts blijken te zijn dat het model te veel past bij wat in werkelijkheid slechts toevallige gebeurtenissen waren. In alle gevallen is het belangrijk om een ​​model te testen aan de hand van gegevens die buiten de steekproef vallen die wordt gebruikt om het te ontwikkelen.

Belangrijkste leerpunten

  • Overfitting is een modelleringsfout die optreedt wanneer een functie te nauw aansluit bij een beperkte set gegevenspunten.
  • Financiële professionals moeten zich altijd bewust zijn van de gevaren van overfitting van een model op basis van beperkte gegevens.
Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Waarom statistische significantie belangrijk is Statistische significantie verwijst naar een resultaat dat waarschijnlijk niet willekeurig zal optreden, maar eerder waarschijnlijk te wijten is aan een specifieke oorzaak. meer Hoe Data Smoothing werkt Data Smoothing wordt gedaan door een algoritme te gebruiken om ruis uit een dataset te verwijderen. Hierdoor kunnen belangrijke patronen opvallen. Data smoothing kan worden gebruikt om trends te voorspellen, zoals die in effectenprijzen. meer Voorbeeld Een voorbeeld is een kleinere, beheersbare versie van een grotere groep. Monsters worden gebruikt in statistische tests wanneer de populatiegrootte te groot is. meer Heteroskedasticiteit In de statistiek komt heteroskedasticiteit voor wanneer de standaardafwijkingen van een variabele, die gedurende een bepaalde tijd worden gemonitord, niet constant zijn. meer Inlezen van Stratified Random Sampling Stratified random sampling is een methode van bemonstering waarbij een populatie wordt verdeeld in kleinere groepen die strata worden genoemd. meer Hoe eenvoudige willekeurige steekproeven werken Een eenvoudige willekeurige steekproef is een deelverzameling van een statistische populatie waarin elk lid van de deelverzameling een gelijke waarschijnlijkheid heeft om te worden gekozen. Een eenvoudige willekeurige steekproef is bedoeld als een onpartijdige voorstelling van een groep. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter