Variance je míra rozptylu, která představuje variabilitu datové řady vzhledem k jejímu průměru. Formálně se počítá jako součet čtverců reziduí dělený celkovým počtem pozorování.
Lze jej také vypočítat jako standardní odchylku na druhou. Mimochodem, reziduum chápeme jako rozdíl mezi hodnotou proměnné najednou a střední hodnotou celé proměnné.
Podívejte se na všechny míry disperzeNež se podíváme na rozptylový vzorec, musíme říci, že rozptyl ve statistice je velmi důležitý. Jelikož se jedná o jednoduché opatření, může poskytnout mnoho informací o konkrétní proměnné.
Vzorec pro výpočet rozptylu
Měrnou jednotkou odchylky bude vždy měrná jednotka odpovídající datům, ale na druhou. Rozptyl je vždy větší nebo roven nule. Vzhledem k tomu, že zbytky jsou čtvercové, je matematicky nemožné, aby odchylka vyšla záporně. A tak to nemůže být menší než nula.
Kde
- X: proměnná, na kterou se má odchylka vypočítat
- Xi: pozorovací číslo i proměnné X. mohu nabývat hodnot mezi 1 a n.
- n: počet pozorování.
- X: Je to průměr proměnné X.
Nebo co je stejné:
Proč jsou zbytky na druhou?
Důvod, proč jsou zbytky na druhou, je jednoduchý. Pokud by nebyly na druhou, součet zbytků by byl nula. Je to vlastnost odpadu. Aby se tomu zabránilo, stejně jako u standardní odchylky, jsou čtvercové. Výsledkem je měrná jednotka, ve které jsou data měřena, ale čtvercová.
Pokud bychom například měli údaje o mzdě souboru lidí v eurech, údaje, které dávají rozptyl, by byly v čtverečních eurech. Aby interpretace měla smysl, vypočítali bychom směrodatnou odchylku a přenesli údaje do eur.
- Odchylka -> (2-3) = -1
- Odchylka -> (4-3) = 1
- Odchylka -> (2-3) = -1
- Odchylka -> (4-3) = 1
- Odchylka -> (2-3) = -1
- Odchylka -> (4-3) = 1
Pokud sečteme všechny odchylky, výsledek je nula.
HodnostJaký je rozdíl mezi rozptylem a směrodatnou odchylkou?
Jednou otázkou, kterou lze položit, a z dobrého důvodu, by byl rozdíl mezi rozptylem a směrodatnou odchylkou. Ve skutečnosti přicházejí měřit totéž. Rozptyl je směrodatná odchylka na druhou. Nebo naopak, směrodatná odchylka je druhá odmocnina rozptylu.
Směrodatná odchylka je vytvořena, aby bylo možné pracovat v počátečních měrných jednotkách. Samozřejmě, jak je normální, lze si klást otázku, k čemu je použití rozptylu jako konceptu? Ačkoli nám interpretace hodnoty, kterou vrací, neposkytuje mnoho informací, je její výpočet nezbytný k získání hodnoty dalších parametrů.
Pro výpočet kovariance potřebujeme rozptyl a ne směrodatnou odchylku, k výpočtu některých ekonometrických matic se použije odchylka, nikoli směrodatná odchylka. Při práci s daty podle toho, jaké výpočty jsou, jde o pohodlí.
Příklad výpočtu odchylky
Budeme razit řadu údajů o mzdách. Máme pět lidí, z nichž každý má jiný plat:
Juan: 1 500 eur
Pepe: 1200 eur
José: 1700 eur
Miguel: 1300 eur
Mateo: 1 800 eur
Průměrná mzda, kterou pro náš výpočet potřebujeme, je ((1 500 + 1 200 + 1 700 + 1 300 + 1 800) / 5) 1 500 eur.
Protože varianční vzorec ve své rozložené formě je formulován takto:
Zjistíme, že musí být vypočítán tak, aby:
Výsledkem je 52 000 eur na druhou. Je důležité si uvědomit, že kdykoli vypočítáme rozptyl, máme jednotky měření na druhou. Chcete-li jej převést na eura, v tomto případě bychom museli provést směrodatnou odchylku. Přibližný výsledek by byl 228 eur. To znamená, že v průměru bude rozdíl mezi platy různých lidí 228 eur.