Bootstrap - co to je, definice a koncept
Bootstrap je mechanismus statistiky a ekonometrie, který se zaměřuje na převzorkování dat v náhodném nebo náhodném vzorku. Jeho hlavním použitím je najít aproximaci distribuce analyzované proměnné.
Tento proces je také známý ve statistickém žargonu jako bootstrapping a je výsledkem studií v oblasti statistického vzorkování, které provedl matematik Bradley Efron na konci 70. let.
Nástroj Bootstrap
Hlavním nástrojem použití bootstrapu je snížit zkreslení v rámci analýzy nebo jinými slovy aproximovat rozptyl provedením náhodného převzorkování počátečního vzorku, nikoli populace. Tímto způsobem je konstrukce statistických modelů usnadněna vytvářením intervalů spolehlivosti a testů hypotéz.
I když se to a priori může zdát jako velmi složitá praxe, postup, na kterém je založen bootstrapping, je jednoduše vytvoření velkého počtu vzorků, které přemístí data, přičemž jako referenční počáteční vzorek populace.
Tato technika je obzvláště užitečná v situacích, kdy jsou dostupné vzorky malé, nebo jak je uvedeno výše, pokud je distribuce velmi zkosená. V tomto smyslu pomáhají řešit řadu problémů pravděpodobnosti a aplikovaných statistik.
Funkce bootstrapu
Jednou z hlavních charakteristik této praxe je, že zahrnuje následné převzorkování za účelem získání uzavřených výrazů a řešení matematické složitosti těchto operací. S vývojem počítačů a technologických nástrojů v posledních letech je snazší počítat s využitím bootstrappingu pro komplexní převzorkování.
Technika převzorkování nám umožňuje jít dále, když studujeme vzorky dat z určité populace. Jinými slovy vám umožňuje vytvářet nebo vytvářet nové předpoklady nahrazením dalších hodnot ze vzorku.
Výhody bootstrapu
Pozitivním aspektem převzorkování bootstrapu je to, že zjednodušilo statistické metody v tom smyslu, že nahradilo konstrukci klasických a vysoce komplexních matematických modelů výpočty pomocí konkrétního softwaru, což zlepšilo jejich použitelnost nebo přístup k jiným oborům nebo studiím.
V návaznosti na tuto linii se obvykle má za to, že tento mechanismus je mnohem otevřenější nebo přístupnější ve srovnání s klasickými modely a předpoklady, což z něj činí užitečný nástroj pro velké množství matematických problémů.
Interval spolehlivosti