Spearman's Rho - Co to je, definice a koncept

Obsah:

Anonim

Spearmanovo rho je neparametrické měřítko závislosti, ve kterém se vypočítá střední hierarchie pozorování, rozdíly se čtverce a začlení do vzorce.

Jinými slovy, pozorováním každé proměnné přiřadíme hodnocení a studujeme závislostní vztah mezi dvěma danými proměnnými.

Klasifikované korelace jsou neparametrickou alternativou jako měřítko závislosti mezi dvěma proměnnými, když nemůžeme použít Pearsonův korelační koeficient.

Obecně je přiřazeno písmeno giega rho na korelační koeficient.

Spearmanův odhad rho je dán vztahem:

Postup Rho Spearmana

0. Vycházíme ze vzorku n pozorování (Ai, Bi).

1. Klasifikujte pozorování každé proměnné a upravte je podle vazeb.

  • Používáme funkci aplikace Excel, která za nás klasifikuje pozorování a automaticky je upravuje, pokud najde vazby mezi prvky. Tato funkce se nazývá HERARCH.MEDIA (klasifikace Ai; Klasifikacen;objednat).
  • Poslední faktor funkce je volitelný a říká nám, v jakém pořadí chceme pozorování uspořádat. Nenulové číslo seřadí pozorování ve vzestupném pořadí. Například přiřadí nejmenšímu prvku hodnost 1. Pokud dáme do proměnné nulu objednat, přiřadí největší položce pořadí 1 (sestupně).

Praktický příklad

  • V našem případě přiřadíme proměnné pořadí nenulové číslo, aby se pozorování seřadila vzestupně. To znamená přiřadit nejmenšímu prvku proměnné hodnost 1.
  • Zkontrolujeme, že celkový součet sloupců Klasifikace A Y Klasifikace B jsou si navzájem rovni a setkávají se:

V tomto případě n = 10, protože v každé proměnné máme celkem 10 prvků / pozorování NA Y B.

Celkový součet klasifikace A se rovná celkovému součtu klasifikace Y a rovněž splňují výše uvedený vzorec.

NA B Klasifikace A Klasifikace B Čtvercové rozdíly
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Celkový 55 55 130

2. Přidejte rozdíly mezi žebříčky a srovnejte je.

  • Jakmile máme všechna klasifikovaná pozorování s přihlédnutím k vazbám mezi nimi, vypočítáme rozdíl ve formě:

di = Ai - Bi

Definujeme (di) jako rozdíl mezi klasifikací Ai a klasifikace Bi.

  • Jakmile je rozdíl získán, vyrovnáme ho. Čtverce rozdílů se použijí, aby měly pouze kladné hodnoty.

Definujeme di2 jako čtvercový rozdíl mezi klasifikací Ai a klasifikace Bi.

Ve sloupci čtvercových rozdílů budeme mít:

di2 = (A.i - Bi)2

3. Vypočítejte Spearmanovo rho:

  • Vypočítáme celkový součet čtvercových rozdílů formuláře:

V našem příkladu:

  • Výsledek začleňujeme do Spearmanova vzorce rho:

V našem příkladu:

Srovnání: Pearson vs Spearman

Pokud vypočítáme Pearsonův korelační koeficient vzhledem k předchozím pozorováním a porovnáme jej s Spearmanovým korelačním koeficientem, dostaneme:

  • Pearson = 0,1109
  • Spearman = 0,2121

Vidíme, že závislost mezi proměnnými A a B zůstává slabá i při použití Spearmana místo Pearsona.

Pokud by odlehlé hodnoty měly velký vliv na výsledky, našli bychom velký rozdíl mezi Pearsonem a Spearmanem, a proto bychom měli použít Spearmana jako měřítko závislosti.