Chyba typu I - co to je, definice a pojem

Obsah:

Chyba typu I - co to je, definice a pojem
Chyba typu I - co to je, definice a pojem
Anonim

Chyba typu 1 ve statistice je definována jako odmítnutí nulové hypotézy, když je ve skutečnosti pravdivá. Chyba typu 1 se také nazývá falešně pozitivní nebo chyba typu alfa.

Udělat chybu typu 1 v zásadě něco popírá, když je to skutečně pravda. Zvažte například situaci testování, zda marketingová kampaň prováděná na sociálních sítích zvyšuje prodej zmrzliny pro společnost v letním týdnu. Hypotézy by byly následující:

H0: Prodej se kvůli letní kampani nezvyšuje

H1: Zvýšení prodeje díky marketingové kampani

Po vyhodnocení provozu na webových stránkách společnosti a na stránkách navštívených po kampani je detekováno následující:

  • Zvýšení, i když v provozu a návštěvách o 50%.
  • 200% nárůst prodeje zmrzliny.

S ohledem na tyto výsledky lze dojít k závěru, že reklamní kampaň byla plodná a měla přímý účinek na zvýšení prodeje. Pojďme si však myslet, že v tomto týdnu došlo k vlně veder, která vedla k teplotám nad 40 stupňů.

Pokud budeme znát druhou možnost, budeme muset vzít v úvahu faktor vysoké teploty jako příčinu zvýšení prodeje. Pokud to nezohledníme, mohli bychom odmítnout naši nulovou hypotézu, když je to pravda, to znamená, že bychom si mysleli, že naše kampaň měla obrovský úspěch, když ve skutečnosti byla příčinou zvýšení prodeje silná vlna. Pokud bychom dospěli k tomuto závěru, odmítli bychom nulovou hypotézu, když je ve skutečnosti pravdivá, a proto bychom se dopustili chyby typu 1.

Příčiny chyby typu 1

Chyba typu 1 souvisí s významností kontrastu nebo alfa, s chybou odhadu koeficientů a může nastat v důsledku 2 typických porušení počátečních předpokladů regrese. Tyto jsou:

  • Podmíněná heteroscedasticita.
  • Sériová korelace.

Regrese, která představovala kterékoli z předchozích porušení, by podcenila chybu koeficientů. Pokud k tomu dojde, náš odhad t statistiky by byl větší než skutečná t statistika. Tyto větší hodnoty t statistiky by zvýšily pravděpodobnost, že hodnota spadne do oblasti odmítnutí.

Představme si 2 situace.

Situace 1 (nesprávný odhad chyby)

  • Význam: 5%
  • Velikost vzorku: 300 lidí.
  • Kritická hodnota: 1,96
  • B1: 1,5
  • Chyba odhadu koeficientu: 0,5

T = 1,5 / 0,5 = 3

Tímto způsobem by hodnota padla do zóny odmítnutí a my bychom odmítli nulovou hypotézu.

Situace 2 (správný odhad chyby)

  • Význam: 5%
  • Velikost vzorku: 300 lidí.
  • Kritická hodnota: 1,96
  • B1: 1,5
  • Chyba odhadu koeficientu: 1

T = 1,5 / 1 = 1,5

Tímto způsobem by hodnota klesla v zóně neodmítnutí a my bychom hypotézu nezavrhovali.

Na základě předchozích příkladů by nás situace 1, ve které je chyba podceňována, vedla k odmítnutí nulové hypotézy, i když ve skutečnosti je to pravda, protože jak vidíme v situaci 2 se správně odhadnutou chybou, hypotézu bychom nezamietli být pravdivý.