Popisná statistika je obor, který je odpovědný za shromažďování, ukládání, objednávání, vytváření tabulek nebo grafů a výpočet základních parametrů v datové sadě.
Popisná statistika je spolu se statistickou inferencí nebo inferenční statistikou jedním ze dvou velkých oborů statistiky. Jeho vlastní název to naznačuje, snaží se něco popsat. Ale nepopisujte to žádným způsobem, ale kvantitativním způsobem. Zvažte váhu krabice se zeleninou, výšku osoby nebo množství peněz, které firma vydělá. O těchto proměnných bychom mohli říci mnoho. Mohli bychom například naznačit, že ta nebo ta krabička rajčat váží hodně nebo váží méně než ostatní. Pokračováním dalšího příkladu bychom mohli říci, že příjem společnosti se v průběhu času značně liší nebo že má člověk průměrnou výšku.
Abychom diktovali výše uvedená tvrzení, o velkém, malém, vysokém, nízkém, velmi proměnném nebo malé proměnné potřebujeme proměnné měření. To znamená, že je musíme vyčíslit, nabídnout číslo. S ohledem na to bychom mohli použít gramy nebo kilogramy jako měrnou jednotku k nalezení hmotnosti tolika krabic rajčat, kolik považujeme. Jakmile zvážíme třicet krabic, budeme vědět, které z nich váží více, které z nich váží méně, kolik se nejvíce opakuje nebo zda existuje velký rozdíl mezi váhami různých krabic.
S touto myšlenkou se zrodila popisná statistika za účelem sběru dat, jejich ukládání, vytváření tabulek nebo dokonce grafů, které nám nabízejí informace o určitém tématu. Navíc nám nabízejí opatření, která shrnují informace o velkém množství dat.
Druhy statistických proměnných
V rámci popisné statistiky můžeme údaje popsat kvalitativně nebo kvantitativně.
- Kvalitativní proměnná: Odkazuje na kvalitu. Příklady: barva očí nebo barva vlasů člověka.
- Kvantitativní proměnná: Odkazuje na kvantitativní měřítko. Příklady: výška osoby v centimetrech nebo hmotnost osoby v kilogramech.
Na těchto proměnných lze tedy vypočítat určité parametry. Zejména na kvantitativních proměnných. Jaká je například průměrná hodnota barvy očí? Pokud je pět lidí s modrou barvou očí a pět se zelenou barvou očí, průměr nebude takový, že mají průměrnou modrozelenou barvu očí. V takovém případě by tedy nebylo možné vypočítat některé parametry, které uvidíme níže.
Statistická proměnnáZákladní statistické parametry
Aby bylo možné shrnout informace, byly navrženy různé vzorce, které nabízejí opatření určitého typu. Existují tedy ty, které nám nabízejí informace o centru, jiné o rozptylu nebo variabilitě a další o poloze hodnoty.
- Opatření centrální tendence: Takže pojmenované, protože poskytují informace o centru datových sad. Například průměr je měřítkem trendu nebo centrální polohy, protože průměr nám dává středovou hodnotu souboru dat. Kde bychom mohli říci, že se nachází střed? Ve středu, přibližně uprostřed. Dalším příkladem míry centrální tendence je medián.
- Míry disperze: Jsou také známé jako měřítka variability. Například směrodatná odchylka je měřítkem variability, protože nám říká, zda jsou hodnoty souboru dat velmi rozdílné nebo ne. Dalšími dvěma příklady míry disperze mohou být rozptyl a statistický rozsah.
- Měření polohy: Nejsou nejznámější, ale často se používají. Příklad tohoto lze nalézt v percentilech nebo decilech. Když jsou konkrétní data na 90. percentilu, znamená to, že 90% dat je pod těmito daty. Existují i další míry polohy, jako jsou kvartily nebo některé varianty, jako je první kvartil.
Distribuce frekvence
Je také zajímavé sledovat, jak jsou frekvence distribuovány. K tomu musíme znát určité koncepty:
- Absolutní frekvence: Je to celkový počet opakování pozorování. Pozorování lze někdy prezentovat v intervalech.
- Relativní frekvence: Jedná se o počet v procentech, kdy se pozorování nebo jejich množina opakuje.
- Akumulovaná frekvence: Může být akumulována relativní nebo akumulovaná absolutně. Udává množství nahromaděné do určitého pozorování.
Tabulky a grafy v popisné statistice
Ačkoli tabulky a grafy nejsou pro popisné statistiky jedinečné, charakterizují je. Ve zprávách, studiích a výzkumech je použití grafů velmi běžné. Pomáhají nám zobrazovat informace jednodušším a omezenějším způsobem.
Samozřejmě v tabulkách a grafech existuje obrovské množství typů. Zde je několik příkladů často používaných grafů a tabulek.
- Histogram.
- Sloupcová grafika.
- Výsečový graf.
- Pravděpodobnostní tabulky.
- Dvourozměrné tabulky.
- Boxový graf.
Popisné statistické příklady
Příkladem popisných statistik by bylo, když chceme vypočítat průměrné cíle na zápas fotbalisty. Jedná se o popisnou statistiku, protože se snažíme popsat proměnnou (počet cílů). V tomto případě výpočtem metriky.
Říci tedy, že Ronaldo během posledních 30 her vstřelil 1,05 gólu na zápas, je správná popisná statistická fráze.
Mohli bychom například říci, že 30% Juanových spolužáků má modré oči, 60% hnědé a zbývajících 10% černé. Byla by to kvalitativní proměnná (barva očí), ale popisujeme frekvenci, s jakou se objevuje.