Kovariance je hodnota, která odráží to, jak moc se dvě náhodné proměnné společně liší podle jejich průměrů.
Umožňuje nám zjistit, jak se proměnná chová na základě toho, co dělá jiná proměnná. To znamená, že když X stoupá, jak se chová Y? Kovariance tedy může nabývat následujících hodnot:
Kovariance (X, Y) je menší než nula, když „X“ stoupá a „Y“ klesá. Existuje negativní vztah.
Kovariance (X, Y) je větší než nula, když „X“ stoupá a „Y“ stoupá. Existuje pozitivní vztah.
Kovariance (X, Y) se rovná nule, pokud neexistuje žádný vztah mezi proměnnými „X“ a „Y“.
Výpočet kovariance
Kovarianční vzorec je vyjádřen takto:
Kde y s akcentem je průměr proměnné Y a x s akcentem je průměr proměnné X. „i“ je poloha pozorování a „n“ celkový počet pozorování.
Alternativně, pokud absolutní frekvence nejsou jednotné (tj. Páry i, j se opakují alespoň jednou), je použitelný vzorec následující:
Vlastnosti kovariance
Při práci s ním je třeba vzít v úvahu vlastnosti, které má a které jsou odvozeny z definice kovariance:
- Cov (X, b) = 0, kde b je v tomto případě konstanta.
- Cov (X, X) = Var (X), tj. Kovariance proměnné a sama o sobě se rovná rozptylu proměnné.
- Cov (X, Y) = Cov (Y, X) kovariance je stejná, bez ohledu na pořadí, ve kterém jsme je umístili.
- Cov (bX, cY) = c · b · Cov (X, Y), kde bac jsou dvě konstanty. Kovariance dvou proměnných vynásobených libovolnými dvěma konstantami se rovná kovarianci dvou proměnných vynásobené násobením konstant.
- Cov (b + X, c + Y) = Cov (X, Y) přidání libovolných dvou konstant do každé proměnné neovlivní kovarianci.
- Cov (X, Y) = E (X · Y) - E (X) · E (Y) nebo co je stejné, kovariance se rovná očekávání součinu dvou proměnných minus součin dvou očekávání samostatně.
Rozšíření předchozích vlastností v případě, že jsou dvě proměnné nezávislé. To znamená, že nemají žádný statistický vztah, je pravda, že:
E (X · Y) = E (X) · E (Y)
Jinými slovy, očekávání součinu dvou proměnných se rovná součinu dvou samostatných očekávání uvedených proměnných.
HodnostPříklad kovariance
Předpokládejme, že máme následující data pro X a Y.
Jak interpretujeme tento výsledek?
Toto číslo 4 nám říká, že je větší než nula, že tyto dvě proměnné mají pozitivní vztah. Abychom poznali upravený vztah mezi těmito dvěma proměnnými, měli bychom vypočítat lineární korelaci. Dvě kovariance různých proměnných nejsou srovnatelné, protože hodnota kovariance je absolutní hodnota, která závisí na měrné jednotce proměnných.
Lineární korelační koeficientMatematická naděje