Analýza rozptylu - co to je, definice a pojem

Obsah:

Anonim

Analýza rozptylu nebo ANOVA (analýza rozptylu) jsou techniky vícerozměrné analýzy závislostí používané k určení, zda existují významné rozdíly mezi průměrem tří nebo více skupin populace.

Proto s touto analýzou zjistíme, zda existují rozdíly mezi určitými skupinami, když upravíme jednu nebo více charakteristik. Abychom to zjistili, použijeme hodnotu průměru dat.

Jeho použití je velmi časté v oborech jako ekonomie nebo medicína.

Předchozí předpoklady analýzy rozptylu

Existuje několik předpokladů pro provedení ANOVA, které by měly být známy. To je zásadní, aby byly výsledky adekvátní.

  • Nejprve musí populace sledovat normální rozdělení. Proto máme co do činění s typem parametrického kontrastu, protože jsou známy populační parametry průměru a směrodatné odchylky.
  • Kromě toho musí být použité vzorky navzájem nezávislé. To znamená, že změna v jednom z nich nemusí ovlivnit hodnotu ostatních.
  • Na druhou stranu musí být rozdíly mezi studovanými populacemi stejné. Tomu se říká homoscedasticita.

Klasifikace analýzy variačních modelů

Pro analýzu variačních modelů lze použít tři níže uvedené klasifikace:

  • Model s pevnými efekty: Populace jsou normální a liší se pouze hodnotou příslušných prostředků.
  • Model náhodných efektů: V tomto případě mají data hierarchii a závisejí na nich populační rozdíly.
  • Model smíšených efektů: Čelili bychom modelu, který je směsicí předchozích dvou.

Příklad ANOVA: důležité koncepty

Existují matematické rovnice určité složitosti k provedení ANOVA. Na Economy-Wiki.com se však rozhodujeme pro jednoduchou ekonomiku, a proto a s využitím technologie ukážeme, jak by to bylo možné provést v tabulce.

Představme si, že chceme vědět, zda existují významné rozdíly mezi čtenáři Economy-Wiki.com na základě afinity jejich titulu s ekonomií.

Upozornění: Data, která použijeme, jsou fiktivní.

Musíme jít na Data, Analýza dat a zvolíme analýzu rozptylu faktoru.

Hodnost by byla maticí tří skupin. Může být zajímavější zahrnout záhlaví později a zadat požadované formátování. V našem případě s logem a modrou barvou.

Vidíme, že existují některé pojmy, jako jsou stupně volnosti a pravděpodobnosti nebo významnosti. První se počítá automaticky a je počet skupin minus jedna. Druhý nám říká, zda jsou rozdíly významné nebo ne.

Obvykle vycházíte z přijaté úrovně důvěry. V ekonomii je to obvykle 95% (0,95), což souvisí s významností 0,05 (1-0,095). Pokud je tedy tato pravděpodobnost nebo hodnota p pod přijatelnou významností, jsou rozdíly významné.

V tomto případě se zdá, že stupeň nemá vliv na počet čtenářů (významnost> 0,05). Zdá se tedy, že analýza rozptylu naznačuje, že stránka Economy-Wiki.com zajímá každého, nejen specializované čtenáře. Samozřejmě jsou to fiktivní data, nebo ne?