Mírou centrální tendence jsou statistické parametry, které informují o středu distribuce vzorku nebo statistické populaci.
Někdy se zabýváme velkým množstvím informací. Proměnné, které představují spoustu dat a jsou velmi rozdílné. Data s mnoha desetinnými místy, různého znaménka nebo délky. V těchto případech je vždy lepší vypočítat míry, které nám poskytnou souhrnné informace o uvedené proměnné. Například měření, která nám říkají, jaká je hodnota, která se nejvíce opakuje.
Bez ohledu na výše uvedené nemusíte jít tak daleko. Pokud se podíváme na následující tabulku, která ukazuje plat, který dostává každý z pracovníků společnosti, která vyrábí kartonové krabice, budeme mít následující:
Zaměstnanec | Plat |
1 | € 1.235 |
2 | € 1.002 |
3 | € 859 |
4 | € 486 |
5 | € 1.536 |
6 | € 1.248 |
7 | € 1.621 |
8 | € 978 |
9 | € 1.125 |
10 | € 768 |
Někdo by se mohl divit, kolik vydělává průměrný pracovník v této společnosti? V takovém případě by nám mohla pomoci opatření centrální tendence. Konkrétně průměr. Jediné, co víme, je a priori, že počet bude mezi minimem a maximem.
Opatření centrální tendence
Mezi měřítky centrální tendence můžeme najít následující:
Polovina
Průměr je průměrná hodnota ze sady číselných dat, vypočítaná jako součet množiny hodnot dělený celkovým počtem hodnot. Níže je vzorec pro aritmetický průměr:
Projděte si vysvětlení a příklad střední hodnotyJak je vysvětleno v článku propojeném výše, existuje mnoho typů médií. Volba každého typu průměru má co do činění, zejména s typem dat, na který se počítá.
Medián
Medián je statistika centrální polohy, která rozděluje rozdělení na dvě části, to znamená, že na jedné straně ponechává stejný počet hodnot jako na druhé. Navrhované vzorce nám nebudou dávat střední hodnotu, to, co nám dají, bude pozice, ve které se nachází v souboru dat. Vzorce, které označují polohu mediánu v řadě, jsou následující:
- Když je počet pozorování sudý:
Medián = (n + 1) / 2 → Průměr z pozorovaných pozic
- Když je počet pozorování lichý:
Medián = (n + 1) / 2 → Pozorovaná hodnota
Konzultujte vysvětlení a příklad mediánumóda
Režim je hodnota, která se ve statistickém vzorku nebo populaci vyskytuje nejvíce. To samo o sobě nemá žádný vzorec. Je třeba udělat součet opakování každé hodnoty. Například jaký je režim následující tabulky mezd?
Zaměstnanec | Plat |
1 | € 1.236 |
2 | € 1.236 |
3 | € 859 |
4 | € 486 |
5 | € 1.536 |
6 | € 1.536 |
7 | € 1.621 |
8 | € 978 |
9 | € 1.236 |
10 | € 768 |
Režim by byl 1 236 EUR. Podíváme-li se na mzdy 10 pracovníků, zjistíme, že 1 236 EUR se opakuje třikrát.
Kritika opatření centrální tendence
Míry centrální polohy jsou užitečné v souhrnné formě, ale nejsou kategorické. Jako shrnutí nám mohou poskytnout informace o tom, co by člověk v průměru očekával. Ale nejsou vždy přesné.
Pro lepší analýzu těchto opatření je vhodné kombinovat opatření centrální tendence s mírou rozptylu. Ani disperzní opatření nejsou neomylná, ale nabízejí nám informace o variabilitě určité proměnné. Předpokládejme tedy podle příkladu mezd, že existují dvě společnosti A a B. Ve společnosti A je průměrný plat 3 100 $, zatímco společnost B je také 3 100 $. To by nás mohlo vést k tomu, abychom udělali chybu, že mzdy jsou stejné nebo velmi podobné. Ale nemusí to tak být.
Může se stát, že společnost A má standardní odchylku 400 $, zatímco společnost B má standardní odchylku 1 000 $. To naznačuje, že ve společnosti B je z jakéhokoli důvodu větší nerovnost než ve společnosti A.