kwartiel

algoritmische handel : kwartiel
Wat is een kwartiel?

Een kwartiel is een statistische term die een verdeling van waarnemingen beschrijft in vier gedefinieerde intervallen op basis van de waarden van de gegevens en hoe deze zich verhouden tot de volledige reeks waarnemingen.

Kwartielen begrijpen

Om het kwartiel te begrijpen, is het belangrijk om de mediaan te begrijpen als een maat voor de centrale neiging. De mediaan in statistieken is de middelste waarde van een reeks getallen. Het is het punt waarop precies de helft van de gegevens onder en boven de centrale waarde ligt.

Dus, gegeven een set van 13 getallen, zou de mediaan het zevende getal zijn. De zes cijfers voorafgaand aan deze waarde zijn de laagste cijfers in de gegevens en de zes cijfers na de mediaan zijn de hoogste cijfers in de gegeven gegevensset. Omdat de mediaan niet wordt beïnvloed door extreme waarden of uitschieters in de verdeling, heeft deze soms de voorkeur boven het gemiddelde.

De mediaan is een robuuste schatter van de locatie, maar zegt niets over hoe de gegevens aan weerszijden van de waarde worden verspreid of verspreid. Dat is waar het kwartiel instapt. Het kwartiel meet de spreiding van waarden boven en onder het gemiddelde door de verdeling in vier groepen te verdelen.

Belangrijkste leerpunten

  • Het kwartiel meet de spreiding van waarden boven en onder het gemiddelde door de verdeling in vier groepen te verdelen.
  • Een kwartiel verdeelt gegevens in drie punten - een onderste kwartiel, mediaan en bovenste kwartiel - om vier groepen van de gegevensset te vormen.
  • Kwartielen worden gebruikt om het interkwartielbereik te berekenen, een maat voor de variabiliteit rond de mediaan.

Hoe kwartielen werken

Net zoals de mediaan de gegevens in tweeën deelt zodat 50% van de meting onder de mediaan ligt en 50% erboven ligt, splitst het kwartiel de gegevens in kwartalen op, zodat 25% van de meting minder is dan het onderste kwartiel, 50 % is minder dan het gemiddelde en 75% is minder dan het bovenste kwartiel.

Een kwartiel verdeelt gegevens in drie punten - een onderste kwartiel, mediaan en bovenste kwartiel - om vier groepen van de gegevensset te vormen. Het onderste kwartiel of eerste kwartiel wordt aangeduid als Q1 en is het middelste getal dat valt tussen de kleinste waarde van de gegevensverzameling en de mediaan. Het tweede kwartiel, Q2, is ook de mediaan. Het bovenste of derde kwartiel, aangeduid als Q3, is het centrale punt dat ligt tussen de mediaan en het hoogste nummer van de verdeling.

Nu kunnen we de vier groepen uit de kwartielen in kaart brengen. De eerste groep waarden bevat het kleinste getal tot Q1; de tweede groep omvat Q1 tot de mediaan; de derde set is de mediaan tot Q3; de vierde categorie omvat Q3 tot het hoogste gegevenspunt van de hele set.

Elk kwartiel bevat 25% van de totale waarnemingen. Over het algemeen worden de gegevens gerangschikt van klein naar groot:

  1. Eerste kwartiel: de laagste 25% van de cijfers
  2. Tweede kwartiel: tussen 25, 1% en 50% (tot de mediaan)
  3. Derde kwartiel: 51% tot 75% (boven de mediaan)
  4. Vierde kwartiel: de hoogste 25% van de cijfers

Voorbeeld kwartiel

Laten we met een voorbeeld werken. Stel dat de verdeling van wiskundescores in een klas van 19 studenten in oplopende volgorde is:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Markeer eerst de mediaan, Q2, in dit geval de tiende waarde: 75.

Q1 is het centrale punt tussen de kleinste score en de mediaan. In dit geval valt Q1 tussen de eerste en vijfde score: 68. [Merk op dat de mediaan ook kan worden opgenomen bij het berekenen van Q1 of Q3 voor een oneven reeks waarden. Als we de mediaan aan weerszijden van het middelpunt opnemen, dan is Q1 de middelste waarde tussen de eerste en tiende score, wat het gemiddelde is van de vijfde en zesde score - (vijfde + zesde) / 2 = (68 + 69) / 2 = 68.5].

Q3 is de middelste waarde tussen Q2 en de hoogste score: 84. [Of als u de mediaan meetelt, Q3 = (82 + 84) / 2 = 83].

Nu we onze kwartielen hebben, laten we hun aantallen interpreteren. Een score van 68 (Q1) vertegenwoordigt het eerste kwartiel en is het 25 e percentiel. 68 is de mediaan van de onderste helft van de score die is vastgelegd in de beschikbare gegevens, dwz de mediaan van de scores van 59 tot 75.

Q1 vertelt ons dat 25% van de scores lager zijn dan 68 en 75% van de klassenscores hoger zijn. Q2 (de mediaan) is het 50e percentiel en laat zien dat 50% van de scores minder dan 75 zijn en 50% van de scores boven 75. Ten slotte onthult Q3, het 75ste percentiel, dat 25% van de scores groter en 75% zijn minder dan 84.

Speciale overwegingen

Als het gegevenspunt voor Q1 verder van de mediaan verwijderd is dan Q3 van de mediaan, kunnen we zeggen dat er een grotere spreiding is tussen de kleinere waarden van de gegevensverzameling dan onder de grotere waarden. Dezelfde logica is van toepassing als Q3 verder van Q2 verwijderd is dan Q1 van de mediaan.

Als alternatief, als er een even aantal gegevenspunten is, is de mediaan het gemiddelde van de middelste twee getallen. In ons voorbeeld hierboven, als we 20 studenten hadden in plaats van 19, is de mediaan van hun scores het rekenkundig gemiddelde van het tiende en elfde getal.

Kwartielen worden gebruikt om het interkwartielbereik te berekenen, een maat voor de variabiliteit rond de mediaan. Het interkwartielbereik wordt eenvoudig berekend als het verschil tussen het eerste en derde kwartiel: Q3 - Q1. In feite is het het bereik van de middelste helft van de gegevens die laat zien hoe verspreid de gegevens zijn.

Voor grote gegevenssets heeft Microsoft Excel een QUARTILE-functie om kwartielen te berekenen.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Hoe de kwantitatieve methode van het deciel werkt Een deciel is een kwantitatieve methode om een ​​reeks gerangschikte gegevens op te splitsen in 10 subsecties van gelijke grootte. Dit type gegevensclassificatie wordt uitgevoerd als onderdeel van veel academische en statistische studies op het gebied van financiën en economie. meer Beschrijvende statistieken Beschrijvende statistieken zijn een reeks korte beschrijvende coëfficiënten die een gegeven gegevensverzameling samenvatten die representatief is voor een volledige of steekproefpopulatie. meer Quintiles Definitie Een quintile is een statistische waarde van een gegevensset die 20% van een bepaalde populatie vertegenwoordigt. meer Het gebruik van het Winsorized-gemiddelde Winsorized-gemiddelde is een middelingsmethode die in eerste instantie de kleinste en grootste waarden vervangt door de waarnemingen die het dichtst bij hen liggen. Dit wordt gedaan om het effect van abnormale extreme waarden of uitschieters op de berekening te beperken. meer Three-Sigma Limits: wat u moet weten Three-Sigma Limits is een statistische berekening die verwijst naar gegevens binnen drie standaarddeviaties van een gemiddelde. meer Standaardafwijking Definitie De standaardafwijking is een statistiek die de spreiding van een gegevensset ten opzichte van het gemiddelde meet en wordt berekend als de vierkantswortel van de variantie. Het wordt berekend als de vierkantswortel van variantie door de variatie tussen elk gegevenspunt ten opzichte van het gemiddelde te bepalen. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter