Interval spolehlivosti - co to je, definice a koncept

Obsah:

Anonim

Interval spolehlivosti je technika odhadu používaná při statistickém odvození, která umožňuje omezit pár nebo několik párů hodnot, ve kterých bude nalezen požadovaný bodový odhad (s určitou pravděpodobností).

Interval spolehlivosti nám umožní vypočítat dvě hodnoty kolem střední hodnoty vzorku (jedna horní a jedna dolní). Tyto hodnoty omezí rozsah, ve kterém bude s určitou pravděpodobností umístěn parametr populace.

Interval spolehlivosti = průměr + - hranice chyby

Znát skutečnou populaci je obecně něco velmi komplikovaného. Zvažte populaci 4 milionů lidí. Mohli bychom znát průměrné spotřební výdaje na domácnost této populace? V zásadě ano. Prostě bychom museli prozkoumat všechny domácnosti a vypočítat průměr. Sledování tohoto procesu by však bylo nesmírně pracné a studium by bylo docela komplikované.

V takových situacích je reálnější vybrat statistický vzorek. Například 500 lidí. A na uvedeném vzorku vypočítejte průměr. I když bychom stále neznali skutečnou hodnotu populace, mohli bychom předpokládat, že se bude blížit hodnotě vzorku. To znamená, že přidáme hranici chyby a máme hodnotu intervalu spolehlivosti. Na druhou stranu odečteme toto rozpětí chyby od průměru a budeme mít další hodnotu. Mezi těmito dvěma hodnotami bude střední hodnota populace.

Závěrem lze říci, že interval spolehlivosti neslouží k bodovému odhadu populačního parametru, pokud nám má pomoci získat přibližnou představu o tom, který by mohl být ten pravý. Umožňuje nám omezit mezi dvěma hodnotami, kde bude nalezen průměr populace.

variační koeficientKumulativní frekvence

Faktory, na kterých závisí interval spolehlivosti

Výpočet intervalu spolehlivosti závisí hlavně na následujících faktorech:

  • Vybraná velikost vzorku: V závislosti na množství dat, která byla použita k výpočtu hodnoty vzorku, bude více či méně blízká skutečnému parametru populace.
  • Úroveň spolehlivosti: Bude nás informovat, v jakém procentu případů je náš odhad správný. Obvyklé úrovně jsou 95% a 99%.
  • Míra chyby našeho odhadu: Toto se nazývá alfa a informuje nás o pravděpodobnosti, že hodnota populace je mimo náš rozsah.
  • Odhad ve vzorku (průměr, rozptyl, rozdíl průměrů …): Na tom bude záviset pivotní statistika pro výpočet intervalu.

Příklad intervalu spolehlivosti pro průměr, za předpokladu normality a známé standardní odchylky

Statistika otáčení použitá pro výpočet by byla následující:

Výsledný interval by byl následující:

Vidíme, jak v intervalu vlevo a vpravo od nerovnosti máme dolní a horní hranici. Výraz nám tedy říká, že pravděpodobnost, že střední hodnota populace leží mezi těmito hodnotami, je 1-alfa (úroveň spolehlivosti).

Podívejme se na výše uvedené lépe s příkladem vyřešeným cvičením.

Chcete odhadnout průměrný čas, který běžec potřebuje na absolvování maratonu. Za tímto účelem bylo načasováno 10 maratonů a byly získány průměrně 4 hodiny se standardní odchylkou 33 minut (0,55 hodiny). Chcete získat 95% interval spolehlivosti.

Abychom získali interval, museli bychom pouze nahradit data ve vzorci intervalu.

Interval spolehlivosti by byla část distribuce, která je zastíněna modře. Tím jsou ohraničeny 2 hodnoty odpovídající 2 červeným čarám. Centrální čára, která rozděluje distribuci na 2, by byla skutečná hodnota populace.

Je důležité si uvědomit, že v tomto případě, vzhledem k tomu, že hustotní funkce distribuce N (0,1) nám dává kumulativní pravděpodobnost (zleva po kritickou hodnotu), musíme najít hodnotu, která nám ponechá 0,975 na levé% (to je 1,96).