Upravený R na druhou (Upravený koeficient stanovení)

Obsah:

Upravený R na druhou (Upravený koeficient stanovení)
Upravený R na druhou (Upravený koeficient stanovení)
Anonim

Upravený R na druhou (nebo upravený koeficient determinace) se používá při vícenásobné regresi k zobrazení stupně intenzity nebo účinnosti nezávislých proměnných při vysvětlování závislé proměnné.

Jednoduše řečeno, upravený R-kvadrát nám říká, jaké procento variace závislé proměnné je souhrnně vysvětleno všemi nezávislými proměnnými.

Použití tohoto koeficientu je odůvodněno tím, že když přidáváme proměnné k regresi, má neupravený koeficient determinace tendenci se zvyšovat. I když mezní příspěvek každé z nových přidaných proměnných nemá statistickou relevanci.

Přidáním proměnných do modelu by se tedy koeficient stanovení mohl zvýšit a mylně jsme si mohli myslet, že vybraná sada proměnných je schopna vysvětlit větší část variace nezávislé proměnné. Tento problém se běžně nazývá „nadhodnocení modelu“.

Variační koeficientRegresní analýza

Upravený koeficient determinačního vzorce

Abychom vyřešili výše popsaný problém, mnoho vědců navrhuje upravit koeficient determinace pomocí následujícího vzorce:

R2 na → Upravený R na druhou nebo upravený koeficient stanovení

R2 → R na druhou nebo koeficient determinace

n → Počet pozorování ve vzorku

k → Počet nezávislých proměnných

Vzhledem k tomu, že 1-R2 je konstantní číslo a protože n je větší než k, protože do modelu přidáváme proměnné, kvocient v závorkách se zvětší. Tudíž. také výsledek vynásobení 1-R2 . Díky tomu vidíme, že vzorec je vytvořen tak, aby upravoval a penalizoval zahrnutí koeficientů do modelu.

Kromě předchozí výhody nám úprava použitá v předchozím vzorci také umožňuje porovnat modely s různým počtem nezávislých proměnných. Vzorec opět upravuje počet proměnných mezi jedním modelem a druhým a umožňuje nám provést homogenní srovnání.

Vrátíme-li se k předchozímu vzorci, můžeme odvodit, že upravený koeficient stanovení bude vždy roven nebo menší než koeficient R2. Na rozdíl od koeficientu stanovení, který se pohybuje mezi 0 a 1, může být upravený koeficient stanovení záporný ze 2 důvodů:

  • Čím blíže k se blíží n.
  • Čím nižší je koeficient stanovení.
Lineární korelační koeficient