Statistika je jakákoli skutečná měřitelná funkce vzorku náhodné proměnné.
Pojem statistik je pojem pokročilé statistiky. Definice je krátká a rozhodně abstraktní. Jedná se o velmi široký koncept, ale, jak uvidíme níže, velmi jednoduchý.
Vzhledem k obtížnosti termínu budeme popis provádět po částech. Na prvním místě tedy bude nutné popsat, co máme na mysli pod skutečnou měřitelnou funkcí. A v druhém případě definujte, co chápeme jako vzorek náhodné proměnné.
Statistika je měřitelná skutečná funkce
Když mluvíme o funkci, mluvíme o matematické funkci. Například:
Y = 2X
Podle hodnot, které X vezme, pak Y bude mít jednu nebo jinou hodnotu. Předpokládejme, že X má hodnotu 2. Pak Y bude mít hodnotu 4, výsledek vynásobení 2 číslem 2. Pokud X má hodnotu 3, pak Y bude mít hodnotu 6. Výsledek vynásobení 2 3.
Statistik samozřejmě není jen tak nějaká funkce. Je to skutečná a měřitelná funkce. Tento matematický koncept je upřímně jednoduchý. Skutečný, protože vede k reálným číslům a měřitelný, protože jej lze měřit.
Statistiky mají nespočet aplikací v každodenním životě. Dává tedy smysl, že hodnoty, které může statistika vyprodukovat, jsou skutečné a měřitelné.
Ukázka náhodné proměnné
Koncept vzorku jsme slyšeli mnohokrát. Nebo koncept reprezentativního vzorku. V tomto případě nebudeme rozlišovat mezi různými typy vzorků. Pojem vzorek tedy použijeme v širším slova smyslu.
Představme si, že chceme znát průměrné výdaje mexických rodin na nákup oblečení. Je zřejmé, že nemáme dostatek zdrojů, abychom se zeptali celé mexické populace. Co děláme? Odhadujeme to pomocí vzorku. Ukázka například 50 000 rodin.
Tento vzorek, vše je řečeno, bude muset splňovat konkrétní vlastnosti. To znamená, že musí být reprezentativní a obsahovat mnoho rodin z různých zeměpisných oblastí, různých chutí, náboženství nebo kupní síly. Pokud ne, nedostaneme spolehlivou hodnotu.
Náhodná proměnná
Nyní je to vzorek, ale vzorek náhodné proměnné. Co máme na mysli pod náhodnou proměnnou? Náhodná proměnná, jednoduše řečeno, je obtížně předvídatelná. To znamená, že za podobných podmínek nabývá různých hodnot.
Například číslo, které se hodí, když hodíte kostkou, je náhodná proměnná. Přestože jej vždy spouštíme ve velmi podobných podmínkách, získáme různé výsledky.
Nyní, když rozumíme technické definici pojmu, musíme dát dohromady vše, co jsme se naučili. Víme, co je skutečná a měřitelná funkce. A také víme, jaký je vzorek náhodné proměnné.
Jak navzdory všemu zůstává koncept abstraktní, nejlepší způsob, jak tomu porozumět, bude na příkladu.
Statistický příklad
Předpokládejme, že ve škole je 100 studentů. Učitel nás navrhuje jako aktivitu, abychom se pokusili odhadnout, jaká je průměrná známka studentů dané školy z předmětu matematika.
Protože nemáme čas ani prostředky se zeptat 100 studentů, rozhodli jsme se zeptat 10 studentů. Odtud se pokusíme odhadnout průměrný stupeň. Máme následující údaje:
Student | Poznámka | Student | Poznámka |
1 | 4 | 6 | 9 |
2 | 8 | 7 | 7 |
3 | 6 | 8 | 2 |
4 | 7 | 9 | 5 |
5 | 9 | 10 | 3 |
Před výpočtem průměrného hodnocení podle účelu tohoto článku použijeme to, co jsme se o statistice v tomto příkladu dozvěděli.
Víme, že statistika je skutečná a měřitelná funkce vzorku náhodné proměnné. Máme vzorek náhodné proměnné (tabulka výše). S jakoukoli skutečnou a měřitelnou funkcí uvedeného vzorku bude statistika. Například:
Statistika 1: Student 1 + Student 2 + Student 3 +…. + Student 10 = 60
Statistika 2: Student 1 - Student 2 + Student 3 - Student 4 +… - Student 10 = 2
Statistika 3: -Student 1 - Student 2 - Student 3 -… .- Student 10 = -60
Tyto tři statistiky jsou skutečné, měřitelné funkce vzorku. S čím jsou statistické. Na teoretické úrovni to všechno dává smysl. Smysl je v tom, že ne všechny statistiky budou platné k odhadu podle toho, jaké parametry.
V tomto bodě vstupuje pojem odhadce. Odhadce je statistika, ke které budou vyžadovány určité podmínky, aby mohl spolehlivě vypočítat požadovaný parametr.
Například k odhadu parametru, který známe jako „průměrný stupeň“ nebo „průměrný stupeň“, potřebujeme odhad. Známe tohoto odhadce jako „průměrného“. Průměr je odhad. To znamená, že statistik, který vyžaduje určité podmínky, aby mohl vypočítat průměrnou známku s určitými zárukami.
Pokud chceme znát průměrnou známku, budeme muset přidat všechny známky a vydělit je celkovým počtem studentů. A to:
Průměrná známka = (4 + 8 + 6 + 7 + 9 + 9 + 7 + 2 + 5 + 3) / 10 = 6
Vzorec pro průměr je stejný bez ohledu na vzorek. Vždy používejte všechna data, která obsahuje vzorek. V tomto případě máme data od 10 studentů a průměrný vzorec používá všech 10 dat. Pokud bychom měli 20 dat od 20 studentů, použili bychom všech 20. Statistiky, které splňují tuto charakteristiku, se označují jako dostatečné statistiky.
Závěrem lze říci, že statistika je jakákoli skutečná a měřitelná funkce vzorku. Jakmile máte několik možných statistik, jsou nutné určité podmínky, abyste je mohli považovat za odhady. A díky odhadům se můžeme pokusit „předpovědět“ určité hodnoty z menších vzorků.