Statistiky t-testu studenta

Studentův t-test, ve statistice, metoda testování hypotéz o průměru malého vzorku odebraného z normálně distribuované populace, když není známa standardní odchylka populace.

V roce 1908 vyvinul William Sealy Gosset, Angličan vydavatelství pod pseudonymem Student, t-test at distribuci. Rozložení t je rodina křivek, ve kterých počet stupňů volnosti (počet nezávislých pozorování ve vzorku mínus jeden) určuje konkrétní křivku. Jak se velikost vzorku (a tím i stupně volnosti) zvětšuje, distribuce t se blíží ke tvaru zvonku standardního normálního rozdělení. V praxi se pro zkoušky zahrnující průměr vzorku o velikosti větší než 30 obvykle používá normální rozdělení.

Obvykle je nejprve formulovat nulovou hypotézu, která uvádí, že neexistuje žádný efektivní rozdíl mezi pozorovaným průměrem vzorku a předpokládaným nebo stanoveným průměrem populace - tj. Že jakýkoli změřený rozdíl je způsoben pouze náhodou. Například v zemědělské studii by nulovou hypotézou mohlo být to, že aplikace hnojiva nemá žádný vliv na výtěžek plodiny, a bude proveden experiment, aby se otestovalo, zda zvýšila sklizeň. Obecně platí, že t-test může být buď oboustranný (nazývaný také oboustranný), který jednoduše uvádí, že prostředky nejsou ekvivalentní, nebo jednostranné, přičemž se uvádí, zda je pozorovaný průměr větší nebo menší než předpokládaný průměr. Poté se vypočítá statistika zkoušky t. Pokud je pozorovaná t-statistika extrémnější než kritická hodnota stanovená vhodným referenčním rozdělením, je nulová hypotéza odmítnuta. Vhodným referenčním rozdělením pro t-statistiku je rozložení t. Kritická hodnota závisí na úrovni významnosti testu (pravděpodobnost chybného odmítnutí nulové hypotézy).

Předpokládejme například, že výzkumný pracovník chce testovat hypotézu, že vzorek o velikosti n = 25 se střední hodnotou x = 79 a standardní odchylkou s = 10 byl náhodně odebrán z populace se střední hodnotou μ = 75 a neznámou standardní odchylkou. Při použití vzorce pro t-statistiku se vypočtené t rovná 2. Pro dvoustranný test na společné úrovni významnosti α = 0,05 jsou kritické hodnoty z distribuce t při 24 stupních volnosti -2,064 a 2,064. Vypočítané t nepřekračuje tyto hodnoty, a proto nelze nulovou hypotézu s 95% jistotou odmítnout. (Úroveň spolehlivosti je 1 - α.)

Druhá aplikace distribuce t testuje hypotézu, že dva nezávislé náhodné vzorky mají stejný průměr. Rozložení t může být také použito pro konstrukci intervalů spolehlivosti pro skutečný průměr populace (první aplikace) nebo pro rozdíl mezi dvěma prostředky vzorku (druhá aplikace). Viz také odhad intervalu.