Datová věda - co to je, definice a koncept

Obsah:

Anonim

Datová věda je obor, který studuje, odkud pochází určitá informační základna. Diskutuje také o tom, jak lze tyto zdroje interpretovat a reprezentovat pro produktivní použití.

To znamená, že věda o datech souvisí se správou databází uložených v digitálních souborech, ze kterých lze získat mnoho užitečných informací jako statistické ukazatele. Mohou například pomoci společnosti při obchodních rozhodnutích.

Podobně datová věda poskytuje nástroje, které umožňují nejen interpretovat, ale také reprezentovat, například v obrazech, dostupná data. Máme tedy mimo jiné histogram, sloupcový diagram, koláčový graf.

Jak lze odvodit, tato věda je interdisciplinární, protože zahrnuje hlavně znalosti z matematiky, statistiky a informatiky.

Věda o datech a datové typy

Je třeba také poznamenat, že datová věda může pracovat se dvěma typy dat:

  • Strukturované: Jsou to ty, které jsou organizovány, například tabulky s různými sloupci, každá s jinou kategorií, například: jméno, příjmení, věk, číslo dokladu totožnosti atd.
  • Nestrukturované: Ty, které neodpovídají určitému formátu, například volně psaný text. V takovém případě musíte interpretovat obsah a extrahovat data, která lze spravovat.

Vezmeme-li v úvahu vše, co bylo vysvětleno, odborníci specializující se na datovou vědu musí mít nejen analytické dovednosti, ale musí být schopni sdělit obsah informací, které zpracovali.

Důležitost vědy o datech

Věda o datech je důležitá pro společnosti nebo instituce, které musí pracovat s velkým množstvím dat. Tak se z nich mohou stát cenné informace.

Můžeme dát vědu dat do souvislosti s Big Data, která se skládá z vývoje mechanismů schopných zpracovávat a spravovat masivní data pocházející z různých zdrojů. Cílem je převést je na informace, které může lidská bytost interpretovat a které jí pomáhají při rozhodování.

Tato data ke zpracování mohou pocházet z transakcí mezi jednotlivci a organizacemi (jako jsou bankovní operace), každodenních akcí lidí (jako jsou vyhledávání na internetu), strojů (jako je GPS mobilního telefonu, které zaznamenává, kde byl uživatel) nebo informací biometrické (například otisk prstu).

Historie datové vědy

Dá se říci, že americký statistik John Wilder Tukey byl průkopníkem datové vědy v 60. letech a zdůraznil důležitost analýzy dat namísto testování statistických modelů.

Avšak teprve v roce 1996 byl termín datová věda poprvé použit v názvu přednášky v přednášce s názvem: „Datová věda, klasifikace a související metody“. To v rámci setkání členů „Mezinárodní federace klasifikačních společností“ (IFCS) konaného v japonském Kóbe.

Další důležitý milník nastal v roce 2005, kdy The National Science Board vydal „Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century“. V tomto dokumentu jsou datoví vědci definováni jako počítačoví odborníci, programátoři databází a softwaru a profesionálové z jiných oborů (jako jsou knihovníci a archiváři), kteří jsou pro úspěšnou správu digitálního sběru dat zásadní.

Toto je však stále studovaný obor, který se stále vyvíjí.