Hoofd- » algoritmische handel » Gestratificeerde willekeurige bemonstering

Gestratificeerde willekeurige bemonstering

algoritmische handel : Gestratificeerde willekeurige bemonstering
Wat is Stratified Random Sampling?

Gestratificeerde willekeurige bemonstering is een bemonsteringsmethode waarbij een populatie in kleinere subgroepen wordt verdeeld, strata genoemd. Bij gestratificeerde willekeurige steekproeven of stratificatie worden de lagen gevormd op basis van de gedeelde attributen of kenmerken van leden, zoals inkomen of opleidingsniveau.

Gestratificeerde willekeurige bemonstering wordt ook proportionele willekeurige bemonstering of quota willekeurige bemonstering genoemd.

[Belangrijk: Gestratificeerde steekproeven worden gebruikt om verschillen tussen groepen in een populatie te benadrukken, in tegenstelling tot eenvoudige willekeurige steekproeven, waarbij alle leden van een populatie als gelijk worden behandeld, met een gelijke waarschijnlijkheid van steekproef.]

01:40

Gestratificeerde willekeurige bemonstering

Hoe Stratified Random Sampling werkt

Bij het voltooien van analyse of onderzoek naar een groep entiteiten met vergelijkbare kenmerken, kan een onderzoeker vinden dat de populatiegrootte te groot is om het onderzoek te voltooien. Om tijd en geld te besparen, kan een analist een meer haalbare aanpak volgen door een kleine groep uit de populatie te selecteren. De kleine groep wordt een steekproefgrootte genoemd, een deelverzameling van de populatie die wordt gebruikt om de volledige populatie weer te geven. Een steekproef kan op een aantal manieren uit een populatie worden gekozen, waaronder de gestratificeerde willekeurige steekproefmethode.

Een gestratificeerde willekeurige steekproef omvat het verdelen van de gehele populatie in homogene groepen genaamd strata (meervoud voor stratum). Willekeurige monsters worden vervolgens uit elke laag geselecteerd. Overweeg bijvoorbeeld een academische onderzoeker die graag het aantal MBA-studenten in 2007 wil weten dat binnen drie maanden na zijn afstuderen een baan heeft ontvangen.

Hij zal snel merken dat er bijna 200.000 MBA-afgestudeerden waren voor het jaar. Hij zou kunnen besluiten om gewoon een eenvoudige steekproef van 50.000 afgestudeerden te nemen en een enquête uit te voeren. Beter nog, hij kon de populatie in lagen verdelen en een willekeurige steekproef uit de lagen nemen. Om dit te doen, zou hij bevolkingsgroepen creëren op basis van geslacht, leeftijdscategorie, ras, land van nationaliteit en loopbaanachtergrond. Een willekeurige steekproef van elke stratum wordt genomen in een aantal dat evenredig is aan de grootte van de stratum in vergelijking met de populatie. Deze subsets van de lagen worden vervolgens samengevoegd om een ​​willekeurige steekproef te vormen.

Belangrijkste leerpunten

  • Gestratificeerde steekproeven stellen onderzoekers in staat om een ​​steekproefpopulatie te verkrijgen die het beste overeenkomt met de gehele populatie die wordt onderzocht.
  • Gestratificeerde willekeurige steekproef omvat het verdelen van de gehele populatie in homogene groepen die strata worden genoemd.
  • Gestratificeerde willekeurige bemonstering verschilt van eenvoudige willekeurige bemonstering, waarbij willekeurige gegevens uit een volledige populatie worden geselecteerd, dus elke mogelijke steekproef is even waarschijnlijk.

Voorbeeld van Stratified Random Sampling

Stel dat een onderzoeksteam de GPA van studenten in de VS wil bepalen. Het onderzoeksteam heeft moeite met het verzamelen van gegevens van alle 21 miljoen studenten; het besluit een steekproef van de bevolking te nemen met behulp van 4.000 studenten.

Ga er nu vanuit dat het team naar de verschillende kenmerken van de steekproefdeelnemers kijkt en zich afvraagt ​​of er verschillen zijn in GPA's en majors van studenten. Stel dat er 560 studenten Engelse majors zijn, 1.135 wetenschappelijke majors, 800 zijn informatica majors, 1.090 zijn technische majors en 415 zijn wiskundige majors. Het team wil een proportionele gestratificeerde willekeurige steekproef gebruiken waarbij de stratum van de steekproef evenredig is aan de willekeurige steekproef in de populatie.

Stel dat het team de demografie van studenten in de VS onderzoekt en het percentage van de belangrijkste studenten vindt in 12% major in Engels, 28% major in wetenschappen, 24% major in informatica, 21% major in engineering en 15% major in wiskunde. Er worden dus vijf lagen gecreëerd uit het gestratificeerde willekeurige steekproefproces.

Het team moet vervolgens bevestigen dat de stratum van de populatie in verhouding staat tot de stratum in de steekproef; ze vinden echter dat de verhoudingen niet gelijk zijn. Het team moet vervolgens 4.000 studenten uit de populatie opnieuw steekproeven en willekeurig 480 Engelse, 1.120 wetenschap, 960 computerwetenschappen, 840 technische en 600 wiskundestudenten selecteren.

Daarmee heeft het een evenredige gestratificeerde willekeurige steekproef van studenten, wat een betere weergave biedt van de universiteits majors van studenten in de VS. De onderzoekers kunnen vervolgens specifieke stratum markeren, de variërende studies van Amerikaanse studenten observeren en de verschillende ranggemiddelden bekijken .

Eenvoudige willekeurige versus gestratificeerde willekeurige monsters

Eenvoudige willekeurige steekproeven en gestratificeerde willekeurige steekproeven zijn beide statistische meetinstrumenten. Een eenvoudige willekeurige steekproef wordt gebruikt om de gehele gegevenspopulatie weer te geven. Een gestratificeerde willekeurige steekproef verdeelt de populatie in kleinere groepen, of lagen, op basis van gedeelde kenmerken.

De eenvoudige willekeurige steekproef wordt vaak gebruikt wanneer er zeer weinig informatie beschikbaar is over de gegevenspopulatie, wanneer de gegevenspopulatie veel te veel verschillen heeft om te verdelen in verschillende subsets, of wanneer er slechts één onderscheidend kenmerk is onder de gegevenspopulatie.

Een snoepbedrijf wil bijvoorbeeld de koopgewoonten van zijn klanten bestuderen om de toekomst van zijn productlijn te bepalen. Als er 10.000 klanten zijn, mag deze 100 van die klanten als willekeurige steekproef gebruiken. Het kan dan toepassen wat het vindt van die 100 klanten op de rest van zijn basis. In tegenstelling tot de stratificatie, zal het 100 willekeurige leden steekproefsgewijs nemen zonder rekening te houden met hun individuele kenmerken.

Evenredige en onevenredige stratificatie

Gestratificeerde willekeurige steekproeven zorgen ervoor dat elke subgroep van een bepaalde populatie voldoende wordt vertegenwoordigd binnen de hele steekproefpopulatie van een onderzoeksstudie. Stratificatie kan evenredig of onevenredig zijn. Bij een evenredige gestratificeerde methode is de steekproefgrootte van elke stratum evenredig aan de populatiegrootte van de stratum.

Als de onderzoeker bijvoorbeeld een steekproef van 50.000 afgestudeerden op basis van leeftijdscategorie wilde, wordt de evenredige gestratificeerde willekeurige steekproef verkregen met deze formule: (steekproefgrootte / populatiegrootte) x stratumgrootte. De onderstaande tabel gaat uit van een populatiegrootte van 180.000 MBA-afgestudeerden per jaar.

Leeftijdsgroep


24-28


29-33


34-37


Totaal


Aantal mensen in stratum


90.000


60.000


30.000


180.000


Steekproefgrootte


25.000


16.667


8333


50.000


De strata-steekproefgrootte voor MBA-afgestudeerden in de leeftijd van 24 tot 28 jaar oud wordt berekend als (50.000 / 180.000) x 90.000 = 25.000. Dezelfde methode wordt gebruikt voor de andere leeftijdsgroepen. Nu de steekproefomvang van de strata bekend is, kan de onderzoeker in elke stratum een ​​eenvoudige steekproef nemen om zijn deelnemers aan de enquête te selecteren. Met andere woorden, 25.000 afgestudeerden uit de 24-28-leeftijdscategorie zullen willekeurig worden gekozen uit de gehele populatie, 16.667 afgestudeerden uit de 29-33-leeftijdscategorie zullen willekeurig worden gekozen uit de populatie, enzovoort.

In een onevenredig gestratificeerde steekproef is de grootte van elke laag niet evenredig met de grootte in de populatie. De onderzoeker kan besluiten om 1/2 van de afgestudeerden in de leeftijdsgroep 34-37 en 1/3 van de afgestudeerden in de leeftijdsgroep 29-33 te bemonsteren.

Het is belangrijk op te merken dat één persoon niet in meerdere lagen kan passen. Elke entiteit moet slechts in één laag passen. Het hebben van overlappende subgroepen betekent dat sommige individuen hogere kansen hebben om te worden geselecteerd voor de enquête, wat het concept van gestratificeerde steekproeven als een type waarschijnlijkheidssteekproeven volledig teniet doet.

[Belangrijk: Portefeuillebeheerders kunnen gestratificeerde willekeurige steekproeven gebruiken om portefeuilles te maken door een index zoals een obligatie-index te repliceren.]

Voordelen van Stratified Random Sampling

Het belangrijkste voordeel van gestratificeerde willekeurige steekproeven is dat het belangrijke populatiekarakteristieken in de steekproef vastlegt. Net als bij een gewogen gemiddelde, levert deze bemonsteringsmethode kenmerken in de steekproef op die evenredig zijn aan de totale populatie. Gestratificeerde willekeurige bemonstering werkt goed voor populaties met verschillende attributen, maar is anders niet effectief als er geen subgroepen kunnen worden gevormd.

Stratificatie geeft een kleinere schattingsfout en een grotere nauwkeurigheid dan de eenvoudige willekeurige bemonsteringsmethode. Hoe groter de verschillen tussen de lagen, hoe groter de nauwkeurigheidswinst.

Nadelen van Stratified Random Sampling

Helaas kan deze onderzoeksmethode niet in elke studie worden gebruikt. Het nadeel van de methode is dat aan verschillende voorwaarden moet worden voldaan om correct te kunnen worden gebruikt. Onderzoekers moeten elk lid van een populatie die wordt bestudeerd identificeren en elk van hen in één en slechts één subpopulatie classificeren. Het gevolg hiervan is dat gestratificeerde steekproeven nadelig zijn wanneer onderzoekers niet elk lid van de bevolking met vertrouwen in een subgroep kunnen indelen. Het kan ook een uitdaging zijn om een ​​volledige en definitieve lijst van een volledige populatie te vinden.

Overlapping kan een probleem zijn als er onderwerpen zijn die in meerdere subgroepen vallen. Wanneer eenvoudige steekproeven worden uitgevoerd, is de kans groter dat degenen die zich in meerdere subgroepen bevinden, worden gekozen. Het resultaat kan een verkeerde voorstelling van zaken of een onjuiste afspiegeling van de bevolking zijn.

De bovenstaande voorbeelden maken het gemakkelijk: studenten, afgestudeerden, mannen en vrouwen zijn duidelijk gedefinieerde groepen. In andere situaties kan het echter veel moeilijker zijn. Stel je voor dat je kenmerken zoals ras, etniciteit of religie opneemt. Het sorteerproces wordt moeilijker, waardoor gestratificeerde willekeurige steekproeven een ineffectieve en minder dan ideale methode worden.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Voorbeeld Een voorbeeld is een kleinere, beheersbare versie van een grotere groep. Monsters worden gebruikt in statistische tests wanneer de populatie te groot is. meer Hoe eenvoudige willekeurige steekproeven werken Een eenvoudige willekeurige steekproef is een deelverzameling van een statistische populatie waarin elk lid van de deelverzameling een gelijke waarschijnlijkheid heeft om te worden gekozen. Een eenvoudige willekeurige steekproef is bedoeld als een onpartijdige voorstelling van een groep. meer representatieve steekproef wordt vaak gebruikt om een ​​breder sentiment te extrapoleren. Een representatieve steekproef is een deelverzameling van een populatie die de kenmerken van de gehele populatie weerspiegelt. meer De ins en outs van systematische bemonstering Systematische bemonstering is een methode voor waarschijnlijkheidsbemonstering waarbij een willekeurige steekproef uit een grotere populatie wordt geselecteerd. meer Bemonstering Definitie Bemonstering is een proces dat wordt gebruikt in statistische analyse waarbij een groep observaties worden geëxtraheerd uit een grotere populatie. meer T-testdefinitie Een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die mogelijk verband houden met bepaalde kenmerken. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter