Analýza rozptylu nebo ANOVA (analýza rozptylu) jsou techniky vícerozměrné analýzy závislostí používané k určení, zda existují významné rozdíly mezi průměrem tří nebo více skupin populace.
Proto s touto analýzou zjistíme, zda existují rozdíly mezi určitými skupinami, když upravíme jednu nebo více charakteristik. Abychom to zjistili, použijeme hodnotu průměru dat.
Jeho použití je velmi časté v oborech jako ekonomie nebo medicína.
Předchozí předpoklady analýzy rozptylu
Existuje několik předpokladů pro provedení ANOVA, které by měly být známy. To je zásadní, aby byly výsledky adekvátní.
- Nejprve musí populace sledovat normální rozdělení. Proto máme co do činění s typem parametrického kontrastu, protože jsou známy populační parametry průměru a směrodatné odchylky.
- Kromě toho musí být použité vzorky navzájem nezávislé. To znamená, že změna v jednom z nich nemusí ovlivnit hodnotu ostatních.
- Na druhou stranu musí být rozdíly mezi studovanými populacemi stejné. Tomu se říká homoscedasticita.
Klasifikace analýzy variačních modelů
Pro analýzu variačních modelů lze použít tři níže uvedené klasifikace:
- Model s pevnými efekty: Populace jsou normální a liší se pouze hodnotou příslušných prostředků.
- Model náhodných efektů: V tomto případě mají data hierarchii a závisejí na nich populační rozdíly.
- Model smíšených efektů: Čelili bychom modelu, který je směsicí předchozích dvou.
Příklad ANOVA: důležité koncepty
Existují matematické rovnice určité složitosti k provedení ANOVA. Na Economy-Wiki.com se však rozhodujeme pro jednoduchou ekonomiku, a proto a s využitím technologie ukážeme, jak by to bylo možné provést v tabulce.
Představme si, že chceme vědět, zda existují významné rozdíly mezi čtenáři Economy-Wiki.com na základě afinity jejich titulu s ekonomií.
Upozornění: Data, která použijeme, jsou fiktivní.
Musíme jít na Data, Analýza dat a zvolíme analýzu rozptylu faktoru.
Hodnost by byla maticí tří skupin. Může být zajímavější zahrnout záhlaví později a zadat požadované formátování. V našem případě s logem a modrou barvou.
Vidíme, že existují některé pojmy, jako jsou stupně volnosti a pravděpodobnosti nebo významnosti. První se počítá automaticky a je počet skupin minus jedna. Druhý nám říká, zda jsou rozdíly významné nebo ne.
Obvykle vycházíte z přijaté úrovně důvěry. V ekonomii je to obvykle 95% (0,95), což souvisí s významností 0,05 (1-0,095). Pokud je tedy tato pravděpodobnost nebo hodnota p pod přijatelnou významností, jsou rozdíly významné.
V tomto případě se zdá, že stupeň nemá vliv na počet čtenářů (významnost> 0,05). Zdá se tedy, že analýza rozptylu naznačuje, že stránka Economy-Wiki.com zajímá každého, nejen specializované čtenáře. Samozřejmě jsou to fiktivní data, nebo ne?