Jednoduchý náhodný vzorek - co to je, definice a koncept

Vzhledem k náhodné proměnné X je jednoduchý náhodný vzorek sada náhodných proměnných, nezávislých a identicky distribuovaných, získaných z náhodné proměnné X a které jsou distribuovány stejně jako ona.

Formálně je předchozí definice definicí jednoduchého náhodného vzorku. Nyní lze koncept definovat jednodušeji. Abychom správně pochopili koncept jednoduchého náhodného vzorku, je samozřejmě důležité jej přesně definovat.

Vzhledem k tomu, že formální definice je složitá, budeme postupně odvíjet jednotlivé části definice.

Jednoduchý náhodný ukázkový koncept krok za krokem

Takže na prvním místě musíme vzít v úvahu, že jednoduchý náhodný vzorek je vzorek. Jako vzorek se získává z náhodné proměnné. Tuto náhodnou proměnnou jsme nazvali X. Příkladem náhodné proměnné může být známka z matematiky středoškoláků. První část definice je tedy jasná. Jednoduchý náhodný vzorek je vzorek získaný z libovolné náhodné proměnné.

Druhá část definice je složitější. Především konceptem „nezávislého a identicky distribuovaného náhodného“. Pojem náhoda znamená náhoda. Protože vzorek byl získán náhodně, proměnné jsou následně náhodné. Koncept nezávislosti odkazuje na skutečnost, že získané údaje spolu nesouvisejí. To znamená, že výběr určitých údajů nezávisí na dříve zvolených datech nebo na těch, které budou vybrány později. A konečně, identicky distribuované se týká statistického rozdělení, které je stejné.

Stručně řečeno, máme, že jednoduchý náhodný vzorek je vzorek, který byl získán zcela náhodným způsobem. Data, která tvoří vzorek, tedy spolu nesouvisí a dědí charakteristiky populační náhodné proměnné X.

Proč je koncept jednoduchého náhodného vzorku tak důležitý?

Chceme-li provést výzkum určitých charakteristik souboru dat, je kvalita vzorku zásadní. Aby byly vypočtené metriky a tedy i závěry výzkumu spolehlivé, musíme mít tzv. Reprezentativní vzorek. To znamená vzorek, který adekvátně reprezentuje charakteristiky celkové populace.

Jednou z hlavních charakteristik reprezentativního vzorku je, že je náhodný. Znalost pojmu jednoduchý náhodný vzorek má proto zásadní význam pro to, aby naše studie platila ve vědecké komunitě.

Jednoduchý náhodný ukázkový příklad

Předpokládejme, že chceme provést studii o měsíčních platech občanů dané země. Naší náhodnou proměnnou bude měsíční plat občanů.

Ukázkový koncept vzniká kvůli nemožnosti požádat každého občana země. To by trvalo dlouho nebo hodně finančních zdrojů. Takže místo toho, abychom žádali 50 milionů lidí, rozhodli jsme se požádat 50 000 lidí.

Jakmile jsme definovali proměnnou, na které budeme pracovat, a datovou populaci, musíme přistoupit k získání vzorku. O získání správného vzorku existuje rozsáhlá literatura. Jelikož cílem této definice je přistupovat k tomuto konceptu jednoduchým způsobem, nebudeme se touto záležitostí zabývat.

Zjednodušení bude obecně mít dvě možnosti. Nebo se zeptejte občanů zcela náhodně nebo si vyberte výběrové řízení. Aby vzorek splnil kritérium „náhodného“, musíme to udělat zcela náhodně. Nemůžeme si vybrat města, zóny, sousedství nebo cokoli jiného.

Pokud zvolíme proces výběru vědomě, bude náš vzorek pravděpodobně zkreslený. Správnou věcí by bylo použít nástroj, který náhodně extrahuje jména občanů.

Jakmile máme náš jednoduchý náhodný vzorek, musíme s daty pracovat. To znamená provést statistickou inferenci. Tato statistická inference nám umožní vyvodit závěry ze studie. Například prohlášení jako: „průměrný měsíční plat ve Španělsku je 1 200 eur“ nebo „pouze 5% občanů s nejvyššími platy vydělává ekvivalent nejchudších 30%.“

To vše s jasnou chybou. O to se však již stará statistická inference.