Što je središnji granični teorem?

Što je središnji granični teorem?
Anonim

Odgovor:

Središnji teorem ograničenja čini strogu intuitivnu ideju da se procjene srednje vrijednosti (procijenjene iz nekog uzorka) nekih mjerenja povezanih s nekim stanovništvom poboljšavaju kako se veličina uzorka povećava.

Obrazloženje:

Zamislite šumu koja sadrži 100 stabala.

Sada zamislite da (prilično nerealno) da, mjereno u metrima, jedna četvrtina njih ima visinu od 2, četvrtina njih ima visinu od 3, jedna četvrtina njih ima visinu od 4, a jedna četvrtina njih ima visina od 5.

Zamislite mjerenje visine svakog stabla u šumi i pomoću informacija konstruirajte histogram s prikladno odabranim veličinama spremnika (npr. 1,5 do 2,5, 2,5 do 3,5, 3,5 do 4,5 i 5,5 do 6,5; shvaćam da nisam naveo bin kojem pripadaju granice, ali ovdje nije bitno).

Možete koristiti histogram za procjenu razdiobe vjerojatnosti stabala. Jasno, to ne bi bilo normalno.Zapravo, pod uvjetom da su krajnje točke odabrane na odgovarajući način, to bi bila jedinstvena jer bi postojao jednak broj stabala koji odgovaraju jednoj od specificiranih visina u svakoj posudi.

Sada zamislite ulazak u šumu i mjerenje visine samo dva stabla; izračunajte srednju visinu ova dva stabla i zabilježite je. Ponovite taj postupak nekoliko puta, tako da imate zbirku srednjih vrijednosti za uzorke veličine 2. Ako biste iscrtali histogram procjene srednje vrijednosti, to više ne bi bilo ujednačeno. Umjesto toga, vjerojatno će biti više mjerenja (procjena srednje vrijednosti na temelju uzoraka veličine 2) u blizini ukupne srednje visine svih stabala u šumi (u ovom slučaju,

#(2 + 3 + 4 + 5)/4 = 3.5# m).

Kao što bi bilo i više procjene srednje vrijednosti u blizini stvarna populacija znači (što je poznato u ovom nerealnom primjeru), nego daleko od srednje vrijednosti, oblik ovog novog histograma bio bi bliži normalnoj distribuciji (s vrhom u blizini srednje vrijednosti).

Sada zamislite da idete u šumu i ponavljate vježbu, osim što mjerite visinu 3 stabla, izračunavajući srednju vrijednost u svakom slučaju i zabilježite je. Histogram koji biste izgradili imao bi još više procjena srednje vrijednosti u blizini prave srednje vrijednosti, s manje širenja (mogućnost odabira tri stabla u bilo kojem uzorku tako da svi dolaze iz bilo koje od krajnjih skupina - bilo same visok ili vrlo kratak --- manje je od odabira tri stabla s izborom visina). Oblik vašeg histograma koji sadrži procjenu srednje veličine (svaka srednja vrijednost temeljena na tri mjerenja) bi bila bliža onoj normalne distribucije i odgovarajuća standardna devijacija (procjena srednje, a ne matične populacije) bila bi manji.

Ponovite ovo za 4, 5, 6, itd., Drveće po značaju, a histogram koji biste izgradili izgledao bi sve više kao normalna distribucija (s progresivno većim veličinama uzorka), sa srednjom vrijednosti distribucija procjene srednje vrijednosti bliže istinitoj srednjoj vrijednosti, a standardna devijacija procjena srednje vrijednosti postaje uža i uža.

Ako ponovite vježbu za (degenerirani) slučaj u kojem se mjere sva stabla (u nekoliko navrata, bilježeći srednju vrijednost u svakom slučaju), histogram će imati procjene srednje vrijednosti samo u jednoj od njih (onaj koji odgovara pravoj srednjoj vrijednosti), bez ikakve varijacije, tako da bi standardna devijacija (raspodjela vjerojatnosti procijenjena od) da je "histogram" jednaka nuli.

Dakle, središnji granični teorem primjećuje da se srednja vrijednost neke procjene srednje vrijednosti neke populacije asimptotski približava pravoj srednjoj vrijednosti, a standardna devijacija procjene srednje vrijednosti (umjesto standardne devijacije raspodjele roditeljske populacije) postaje sve manje za veće veličine uzoraka.