Relevantní proměnná vynechána

Obsah:

Anonim

Vynecháním relevantní proměnné je nezahrnutí důležité vysvětlující proměnné do regrese. Vzhledem k Gauss-Markovovým předpokladům by toto opomenutí způsobilo zkreslení a nekonzistenci našich odhadů.

Jinými slovy, opomenutí relevantní proměnné nastane, když ji začleníme do chybového výrazu u, protože ji nezohledňujeme. To způsobí korelaci mezi závislou proměnnou a chybovým členem u.

Matematicky předpokládáme, že:

Cov (x, u) = 0

Pokud do chybového výrazu zahrneme příslušnou proměnnou nebo, pak:

Cov (x, u) ≠ 0

Vzhledem k Gauss-Markovovým předpokladům tato korelace:

(ρ (x, u) ≠ 0)

Nesplnilo by to:

E (u | x) = E (u) = 0

To znamená, že očekávání chyb podmíněných vysvětlujícími se rovná očekávání chyby a že je také nulové. Toto jsou předpoklady nezaujatosti (přísná exogenita + nulový průměr)

V případě vynechání příslušné proměnné je odhad OLS zkreslený a stává se nekonzistentní. Porušuje tedy dvě vlastnosti odhadce a způsobuje, že náš odhad je špatný.

Teoretický příklad

Předpokládáme, že chceme studovat počet sezónních lyžařů (t) s přihlédnutím k několika faktorům: cena skipasů (skipasy) a počet otevřených sjezdovek (sjezdovek) a kvalita sněhu (sníh).

Model 0

Předpokládáme, že vysvětlující proměnné (lyžařské pasy, svahy a sníh) jsou relevantní proměnné pro model 0, protože patří k populačnímu modelu. Jinými slovy, vysvětlující proměnné našeho modelu 0 mají částečný účinek na závislé lyžaře proměnných v populačním modelu. Pak jak v populačním, tak v ukázkovém modelu (model 0) budou mít jiné koeficienty než nula.

Výklad

Zvýšení kvality sněhu (sněhu) a počtu otevřených sjezdovek (tratí) způsobuje zvýšení odhadů β2 a β3. To se následně odráží v počtu lyžařů (lyžařů).

Procentní nárůst cen skipasů způsobuje pokles β1/ 100 v počtu lyžařů (lyžařů)

Proces

S proměnnou sněhu zacházíme jako s vynechanou proměnnou z modelu. Pak:

Model 1

Chybový termín u odlišujeme od modelu 0 a chybový termín v od modelu 1, protože jeden neobsahuje příslušnou proměnnou sníh a druhý ano.

V modelu 1 jsme z modelu vynechali příslušnou proměnnou a zavedli ji do chybového výrazu u. Tohle znamená tamto:

  • Cov (sníh, v) ≠ 0 → ρ (sníh, v) ≠ 0
  • E (v | sníh) ≠ 0

Pokud v našem modelu 1 vynecháme příslušnou proměnnou sníh, způsobíme, že odhad OLS předloží zkreslení a nekonzistenci. Náš odhad počtu sezónních lyžařů tedy bude chybný. Pokud vezmete v úvahu náš odhad Modelu 1, může mít lyžařské středisko vážné finanční potíže.