Variační koeficient - co to je, definice a význam

Variační koeficient, známý také jako variační koeficient Pearson, je statistickým měřítkem, které nás informuje o relativním rozptylu datové sady.

To znamená, že nás informuje, stejně jako jiná měřítka rozptylu, o tom, zda se proměnná pohybuje hodně, trochu, více či méně než jiná.

Vzorec variačního koeficientu

Jeho výpočet se získá vydělením směrodatné odchylky absolutní hodnotou průměru množiny a pro lepší pochopení se obvykle vyjadřuje v procentech.

  • X: proměnná, na kterou se má odchylka vypočítat
  • σX: Směrodatná odchylka proměnné X.
  • | x̄ |: Je to průměr proměnné X v absolutní hodnotě s x̄ ≠ 0

Variační koeficient lze vidět vyjádřený písmeny CV nebo r, v závislosti na manuálu nebo použitém písmu. Jeho vzorec je následující:

Variační koeficient se používá k porovnání souborů dat patřících k různým populacím. Podíváme-li se na jeho vzorec, zjistíme, že bere v úvahu hodnotu průměru. Variační koeficient nám proto umožňuje mít disperzní míru, která eliminuje možná zkreslení průměrů dvou nebo více populací.

Hodnost

Příklady použití variačního koeficientu místo směrodatné odchylky

Zde je několik příkladů této míry disperze:

Porovnání souborů dat různých dimenzí

Chceme koupit rozptyl mezi výškou 50 studentů ve třídě a jejich hmotností. Pro srovnání výšky bychom mohli použít metry a centimetry jako jednotku měření a kilogram pro váhu. Porovnání těchto dvou distribucí pomocí směrodatné odchylky by nedávalo smysl, protože se pokoušíme měřit dvě různé kvalitativní proměnné (délku a hmotnost).

Porovnejte sady s velkým rozdílem mezi prostředky

Představte si například, že chceme měřit váhu brouků a hrochů. Hmotnost brouků se měří v gramech nebo miligramech a hmotnost hrochů se obvykle měří v tunách. Pokud pro naše měření převedeme váhu brouků na tuny tak, aby obě populace byly ve stejném měřítku, použití směrodatné odchylky jako míry disperze by nebylo vhodné. Průměrná hmotnost brouka měřená v tunách by byla tak malá, že kdybychom použili směrodatnou odchylku, v datech by byl téměř žádný rozptyl. To by byla chyba, protože váha mezi různými druhy brouků se může značně lišit.

Příklad výpočtu variačního koeficientu

Uvažujme o populaci slonů a další z myší. Populace slonů má průměrnou hmotnost 5 000 kilogramů a standardní odchylku 400 kilogramů. Populace myší má průměrnou hmotnost 15 gramů a standardní odchylku 5 gramů. Pokud porovnáme disperzi obou populací pomocí směrodatné odchylky, mohli bychom si myslet, že pro populaci slonů existuje větší disperze než pro myši.

Při výpočtu variačního koeficientu pro obě populace bychom si však uvědomili, že je to přesně naopak.

Sloni: 400/5000 = 0,08
Myši: 5/15 = 0,33

Pokud vynásobíme obě data 100, máme, že variační koeficient pro slony je pouze 8%, zatímco u myší je 33%. V důsledku rozdílu mezi populacemi a jejich střední hmotností vidíme, že populace s největší disperzí není populace s největší směrodatnou odchylkou.

Interval spolehlivostiLineární korelační koeficient

Vám pomůže rozvoji místa, sdílet stránku s přáteli

wave wave wave wave wave