Hoofd- » algoritmische handel » Niet-parametrische statistieken

Niet-parametrische statistieken

Wat zijn niet-parametrische statistieken?

Niet-parametrische statistieken verwijzen naar een statistische methode waarbij de gegevens niet nodig zijn om in een normale verdeling te passen. Niet-parametrische statistieken maken gebruik van gegevens die vaak ordinaal zijn, wat betekent dat deze niet afhankelijk is van getallen, maar eerder van een rangorde of soortvolgorde. Een enquête die de voorkeuren van de consument uiteenzet, variërend van leuk tot niet leuk, wordt bijvoorbeeld als ordinaire gegevens beschouwd.

Niet-parametrische statistieken omvatten niet-parametrische beschrijvende statistieken, statistische modellen, inferenties en statistische tests. De modelstructuur van niet-parametrische modellen is niet a priori gespecificeerd, maar wordt in plaats daarvan bepaald op basis van gegevens. De term niet- parametrisch betekent niet dat dergelijke modellen volledig parameters missen, maar dat het aantal en de aard van de parameters flexibel zijn en niet vooraf zijn vastgelegd. Een histogram is een voorbeeld van een niet-parametrische schatting van een kansverdeling.

Inzicht in niet-parametrische statistieken

In statistieken omvatten parametrische statistieken parameters zoals het gemiddelde, de mediaan, de standaarddeviatie, de variantie, enz. Deze vorm van statistieken gebruikt de waargenomen gegevens om de parameters van de verdeling te schatten. Onder parametrische statistieken wordt aangenomen dat de gegevens passen in een normale verdeling met onbekende parameters μ (populatiegemiddelde) en σ ² (populatievariantie), die vervolgens worden geschat met behulp van het steekproefgemiddelde en de steekproefvariantie.

Niet-parametrische statistieken maken geen aanname over de steekproefomvang of dat de waargenomen gegevens kwantitatief zijn.

Niet-parametrische statistieken gaan er niet van uit dat gegevens uit een normale distributie worden gehaald. In plaats daarvan wordt de vorm van de verdeling geschat onder deze vorm van statistische meting. Hoewel er veel situaties zijn waarin een normale verdeling kan worden aangenomen, zijn er ook enkele scenario's waarin het niet mogelijk is om te bepalen of de gegevens normaal worden verdeeld.

Voorbeelden van niet-parametrische statistieken

Overweeg in het eerste voorbeeld dat een onderzoeker die een schatting wil van het aantal baby's in Noord-Amerika dat met bruine ogen wordt geboren, kan besluiten om een steekproef van 150.000 baby's te nemen en een analyse van de gegevensset uit te voeren. De meting die ze afleiden, zal worden gebruikt als een schatting van de hele populatie baby's met bruine ogen die het volgende jaar worden geboren.

Neem voor een tweede voorbeeld een andere onderzoeker die wil weten of vroeg of laat naar bed gaan verband houdt met hoe vaak iemand ziek wordt. Ervan uitgaande dat de steekproef willekeurig wordt gekozen uit de populatie, kan worden aangenomen dat de steekproefomvang van de ziektefrequentie normaal is. Van een experiment dat de weerstand van het menselijk lichaam tegen een bacteriestam meet, kan echter niet worden aangenomen dat het een normale verdeling heeft.

Dit komt omdat een willekeurig geselecteerde monstergegevens weerstand tegen de stam kunnen zijn. Aan de andere kant, als de onderzoeker factoren als genetische make-up en etniciteit overweegt, kan hij vinden dat een steekproefgrootte die met deze kenmerken is geselecteerd, mogelijk niet resistent is tegen de stam. Daarom kan men geen normale verdeling aannemen.

Deze methode is handig wanneer de gegevens geen duidelijke numerieke interpretatie hebben en is het beste te gebruiken met gegevens met een rangorde van soorten. Een persoonlijkheidstoets kan bijvoorbeeld een rangorde van zijn statistieken hebben als sterk oneens, oneens, onverschillig, eens en zeer eens. In dit geval moeten niet-parametrische methoden worden gebruikt.

Speciale overwegingen

Niet-parametrische statistieken hebben waardering gekregen vanwege hun gebruiksgemak. Omdat de behoefte aan parameters is opgeheven, worden de gegevens beter toepasbaar op een grotere verscheidenheid aan tests. Dit type statistieken kan worden gebruikt zonder het gemiddelde, de steekproefomvang, de standaardafwijking of de schatting van andere gerelateerde parameters wanneer geen van die informatie beschikbaar is.

Omdat niet-parametrische statistieken minder veronderstellingen maken over de voorbeeldgegevens, is de toepassing ervan breder dan parametrische statistieken. In gevallen waar parametrisch testen meer geschikt is, zullen niet-parametrische methoden minder efficiënt zijn. Dit komt omdat de resultaten van niet-parametrische statistieken minder betrouwbaar zijn dan wanneer de resultaten zouden worden verkregen met behulp van parametrische statistieken.

Belangrijkste leerpunten

Niet-parametrische statistieken zijn eenvoudig te gebruiken, maar bieden niet de uiterste nauwkeurigheid van andere statistische modellen.
Dit type analyse is het meest geschikt bij het overwegen van de volgorde van iets, waar zelfs als de numerieke gegevens veranderen, de resultaten waarschijnlijk hetzelfde zullen blijven.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

T-verdeling begrijpen AT-verdeling is een type waarschijnlijkheidsfunctie die geschikt is voor het schatten van populatieparameters voor kleine steekproefgroottes of onbekende varianties. meer Hoe de steekproefverdeling werkt Een steekproefverdeling is een waarschijnlijkheidsverdeling van een statistiek die is verkregen via een groot aantal steekproeven uit een specifieke populatie. meer Hoe de Wilcoxon-test wordt gebruikt De Wilcoxon-test, die verwijst naar de Rank Sum-test of de Signed Rank-test, is een niet-parametrische test die twee gepaarde groepen vergelijkt. meer Niet-parametrische methode Niet-parametrische methode verwijst naar een type statistiek dat niet vereist dat de te analyseren gegevens voldoen aan bepaalde veronderstellingen of parameters. meer T-testdefinitie Een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die mogelijk verband houden met bepaalde kenmerken. meer betrouwbaarheidsinterval Een betrouwbaarheidsinterval meet de waarschijnlijkheid dat een populatieparameter tussen twee ingestelde waarden zal vallen. meer partnerlinks

← Aanvragen voor Amerikaanse MBA-programma's vallen voor het vijfde opeenvolgende jaar

Bullish Engulfing-patroondefinitie →

Aanbevolen

Laat Een Reactie Achter