Kendall's Tau (I) - Co to je, definice a koncept

Obsah:

Kendall's Tau (I) - Co to je, definice a koncept
Kendall's Tau (I) - Co to je, definice a koncept
Anonim

Jedná se o neparametrické měřítko závislosti, které identifikuje shodné a nesouhlasné páry dvou proměnných. Po identifikaci se vypočítají součty a vytvoří se podíl.

Klasifikované korelace jsou neparametrickou alternativou jako měřítko závislosti mezi dvěma proměnnými, když nemůžeme použít Pearsonův korelační koeficient.

Jinými slovy, pozorováním každé proměnné přiřadíme hodnocení a studujeme závislostní vztah mezi dvěma danými proměnnými. Existují dva způsoby, jak vypočítat Kendall's Tau; po objednání pozorování každé proměnné se rozhodneme vypočítat vztah závislosti. V našem příkladu uvidíme, že jsme seřazili pořadí ve sloupci X ve vzestupném pořadí.

Matematicky,

Definujeme:

Cn = celkový počet odpovídajících párů.

NCn = celkový počet nesouhlasných (nesouhlasných) párů.

Postup a praktický příklad

Abychom získali Kendallovo Tau, musíme nejprve vědět, jak identifikovat shodné a nesouhlasné páry dvou proměnných.

Využijeme preference lyžařů. V tomto příkladu předpokládáme, že chceme vyhodnotit, zda lyžaři klasifikují své preference pro alpské lyžování nebo severské lyžování ve stejném pořadí na stanici i. Jejich hodnocení se může pohybovat od 1 (velmi výhodné) do 7 (velmi málo výhodné).

Naše otázka by byla: existuje závislost mezi preferencemi sjezdových lyžařů a severských lyžařů v daných lyžařských střediscích?

Definujeme:

X = hodnocení lyžařů pro sjezd na lyžích ve stanici i.

Y = hodnocení lyžařů pro severské lyžování na stanici i.

C = shodné páry.

NC = neshodné / nesouhlasné páry.

Ai = lyžařské středisko i.

Proces

  • Vycházíme ze vzorku n = 7 pozorování lyžařských středisek. Každý řádek tabulky jsou klasifikace dané lyžaři. Každá dvojice stanic může být shodná nebo nesouhlasná. Ve sloupcích C a NC počítáme páry pouze v jednom směru. Například pár AB a BA se počítá jako jeden pár, aby se zabránilo opakování.

Získaná pozorování jsou:

Lyžařský areál (i) X Z
NA 1 1
B 2 3
C 3 4
D 4 2
A 5 7
F 6 6
G 7 5
  1. Seřadili jsme prvky sloupce X ve vzestupném pořadí, abychom je mohli porovnat s prvky sloupce Z
  2. Najdeme shodné páry a nesouhlasné páry.
Lyžařský areál (i) X Z CNC
NA 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
A 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Celkový
  • Nejprve se podíváme na sloupec Z, protože sloupec X je již seřazen vzestupně. V důsledku toho budou všechny klasifikace ve sloupci Z, které nejsou vzestupné, nesouhlasnými dvojicemi stanic.
    • Když hledáme páry stanic (shodné a nesouhlasné), vždy budeme mít poslední řadu pozorování, protože hledáme páry (sady dvou pozorování).
    • Všichni, kteří jsou pod referenční klasifikací, budou shodnými páry. V prvním případě oba lyžaři stanoví referenční klasifikaci na 1. Všechny klasifikace pod 1 budou páry shodné s A. Celkově máme ke klasifikaci 7 stanic. Bude tedy 6 shodných párů A. Protože nemáme žádné nesouhlasné páry spojené s A, dáme nulu.

Přečtěte si druhou část Kendall's Tau (II)