Model lineární pravděpodobnosti je model binární volby. V tomto je podmíněné očekávání závislé proměnné lineární funkcí, to znamená, že vztah závislé proměnné s vysvětlující proměnnou je konstantní.
Abychom to viděli jiným způsobem, model lineární pravděpodobnosti je model, kde máme závislou proměnnou a nezávislou proměnnou (proměnné) vynásobenou permanentním koeficientem (koeficienty).
Musíme zdůraznit, že model lineární pravděpodobnosti je model binární volby, tj. Kde závislá proměnná může nabývat dvou hodnot. Tyto hodnoty jsou 1 nebo 0, což označuje úspěch, respektive selhání.
Model lineární pravděpodobnosti je vyjádřen následovně:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x
V zobrazené rovnici je podmíněné očekávání Y dané X interpretováno jako rovno β0 + β1x.
V tomto případě vezmeme podmíněné očekávání, protože nás zajímá pravděpodobnost, že se jednotlivec rozhodne například na základě svých charakteristik (nebo lze jako referenci brát jinou nezávislou proměnnou).
Nevýhody modelu lineární pravděpodobnosti
Některé nevýhody modelu lineární pravděpodobnosti jsou následující:
- Model lineární pravděpodobnosti může vykazovat heteroskedasticitu. A to, rozptyl chyb není ve všech provedených pozorováních stejný. V takovém případě se použijí standardní chyby.
- Nelze předpokládat, že chyby jsou normálně distribuovány.
- Závislá proměnná může nabývat pouze dvou hodnot.
- Předpokládá se, že nezávislé a závislé proměnné mají lineární vztah, to znamená, že rychlost změny je vždy stejná. Může však být přesnější vytvořit model, kde se rychlost změny zvyšuje, když Y dosáhne vyšší hodnoty, a opak se stane, když Y poklesne.
Vzhledem k těmto nevýhodám existují modely logit a probit.
Příklad modelu lineární pravděpodobnosti
Lze sestavit například model lineární pravděpodobnosti, kde závislou proměnnou je to, zda daná osoba má či nemá formální zaměstnání, které zastávala rok nebo déle. Nezávislými proměnnými by mohla být úroveň studia nebo úroveň vzdělání, pohlaví a věk.
V zobrazeném příkladu bude závislá proměnná 1 nebo 0, ale musí být interpretována kvalitativně bez ohledu na její číselnou hodnotu. 1 tedy znamená, že daná osoba má formální zaměstnání, které je udržováno déle než 1 rok, a 0 by byla situace, kdy k tomu nedojde.