Jedná se o neparametrické měřítko závislosti, které identifikuje shodné a nesouhlasné páry dvou proměnných. Po identifikaci se vypočítají součty a vytvoří se podíl.
Klasifikované korelace jsou neparametrickou alternativou jako měřítko závislosti mezi dvěma proměnnými, když nemůžeme použít Pearsonův korelační koeficient.
Jinými slovy, pozorováním každé proměnné přiřadíme hodnocení a studujeme závislostní vztah mezi dvěma danými proměnnými. Existují dva způsoby, jak vypočítat Kendall's Tau; po objednání pozorování každé proměnné se rozhodneme vypočítat vztah závislosti. V našem příkladu uvidíme, že jsme seřazili pořadí ve sloupci X ve vzestupném pořadí.
Matematicky,
Definujeme:
Cn = celkový počet odpovídajících párů.
NCn = celkový počet nesouhlasných (nesouhlasných) párů.
Postup a praktický příklad
Abychom získali Kendallovo Tau, musíme nejprve vědět, jak identifikovat shodné a nesouhlasné páry dvou proměnných.
Využijeme preference lyžařů. V tomto příkladu předpokládáme, že chceme vyhodnotit, zda lyžaři klasifikují své preference pro alpské lyžování nebo severské lyžování ve stejném pořadí na stanici i. Jejich hodnocení se může pohybovat od 1 (velmi výhodné) do 7 (velmi málo výhodné).
Naše otázka by byla: existuje závislost mezi preferencemi sjezdových lyžařů a severských lyžařů v daných lyžařských střediscích?
Definujeme:
X = hodnocení lyžařů pro sjezd na lyžích ve stanici i.
Y = hodnocení lyžařů pro severské lyžování na stanici i.
C = shodné páry.
NC = neshodné / nesouhlasné páry.
Ai = lyžařské středisko i.
Proces
- Vycházíme ze vzorku n = 7 pozorování lyžařských středisek. Každý řádek tabulky jsou klasifikace dané lyžaři. Každá dvojice stanic může být shodná nebo nesouhlasná. Ve sloupcích C a NC počítáme páry pouze v jednom směru. Například pár AB a BA se počítá jako jeden pár, aby se zabránilo opakování.
Získaná pozorování jsou:
Lyžařský areál (i) | X | Z |
NA | 1 | 1 |
B | 2 | 3 |
C | 3 | 4 |
D | 4 | 2 |
A | 5 | 7 |
F | 6 | 6 |
G | 7 | 5 |
- Seřadili jsme prvky sloupce X ve vzestupném pořadí, abychom je mohli porovnat s prvky sloupce Z
- Najdeme shodné páry a nesouhlasné páry.
Lyžařský areál (i) | X | Z | C | NC | |
NA | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
A | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | Celkový |
- Nejprve se podíváme na sloupec Z, protože sloupec X je již seřazen vzestupně. V důsledku toho budou všechny klasifikace ve sloupci Z, které nejsou vzestupné, nesouhlasnými dvojicemi stanic.
- Když hledáme páry stanic (shodné a nesouhlasné), vždy budeme mít poslední řadu pozorování, protože hledáme páry (sady dvou pozorování).
- Všichni, kteří jsou pod referenční klasifikací, budou shodnými páry. V prvním případě oba lyžaři stanoví referenční klasifikaci na 1. Všechny klasifikace pod 1 budou páry shodné s A. Celkově máme ke klasifikaci 7 stanic. Bude tedy 6 shodných párů A. Protože nemáme žádné nesouhlasné páry spojené s A, dáme nulu.
Přečtěte si druhou část Kendall's Tau (II)