Kaj je Gaussova distribucija?

Posted on
Avtor: Louise Ward
Datum Ustvarjanja: 11 Februarjem 2021
Datum Posodobitve: 19 November 2024
Anonim
What is a Gaussian Distribution?
Video.: What is a Gaussian Distribution?

Vsebina

V statistiki se Gaussova ali običajna distribucija uporablja za karakterizacijo zapletenih sistemov z mnogimi dejavniki. Kot je opisano v Zgodovini statistike Stephena Stiglerja, je Abraham De Moivre izumil distribucijo, ki nosi ime Karla Fredricka Gausa. Gausov prispevek je bil v njegovi uporabi razdelitve na najmanjši kvadrat kvadrata za zmanjšanje napak pri prilagajanju podatkov s črto, ki se najbolje prilega. Tako je naredil najpomembnejšo porazdelitev napak v statistiki.

Motivacija

Kakšna je porazdelitev vzorca podatkov? Kaj pa, če ne poznate osnovne podatkovne distribucije? Ali je mogoče preizkusiti hipoteze o podatkih, ne da bi vedeli osnovno distribucijo? Zahvaljujoč teoremu o osrednji meji je odgovor pritrdilen.

Izjava teorema

Navaja, da je povprečna vrednost vzorca iz neskončne populacije približno normalna ali Gaussova, s srednjo vrednostjo kot osnovna populacija in odstopanje, enako odstopanju populacije, deljenem z velikostjo vzorca. Približevanje se izboljša, ko se velikost vzorca poveča.

Približni stavek je včasih napačno naveden kot sklep o konvergenci k normalni porazdelitvi. Ker se približna normalna porazdelitev spreminja, ko se velikost vzorca povečuje, je takšna izjava zavajajoča.

Teorem je razvil Pierre Simon Laplace.

Zakaj je povsod

Normalne porazdelitve so vseprisotne. Razlog izvira iz teoreme o centralni meji. Pogosto, ko se meri vrednost, je učinek vsote mnogih neodvisnih spremenljivk. Zato ima vrednost, ki se meri sama, zanjo kakovost vzorca. Na primer, razporeditev športnih nastopov je lahko zvonasta, kar je posledica razlik v prehrani, treningu, genetiki, trenerstvu in psihologiji. Tudi moška višina ima normalno porazdelitev, saj je odvisna od številnih bioloških dejavnikov.

Gausov Copulas

To, kar se imenuje "funkcija kopule" z Gaussovo distribucijo, je bilo leta 2009 novost zaradi njene uporabe pri ocenjevanju tveganja naložb v zavarovane obveznice. Zloraba funkcije je bila pomembna za finančno krizo 2008–2009. Čeprav je bilo veliko vzrokov za krizo, Gaussove distribucije v zadnjem času verjetno ne bi smeli uporabljati. Funkcija z debelejšim repom bi pripisovala večjo verjetnost neželenim dogodkom.

Izpeljava

Teorem o osrednji meji je mogoče dokazati v številnih vrsticah, če analiziramo funkcijo generiranja trenutka (mgf) (vzorečna srednja - populacijska sredina) /? (Varianta populacije / velikost vzorca) kot funkcija mgf osnovne populacije. Približni del teorema je predstavljen s širitvijo mgf osnovne osnovne populacije kot niz moči, nato pa je prikazano, da je večina izrazov nepomembna, saj se velikost vzorca poveča.

To je mogoče dokazati v veliko manj vrsticah, če uporabimo Taylorjevo razširitev na značilni enačbi iste funkcije in povečamo velikost vzorca.

Računalniška praktičnost

Nekateri statistični modeli domnevajo, da so napake Gaussove. To omogoča distribucijo funkcij normalnih spremenljivk, kot je razdelitev hi-kvadrat in F, pri testiranju hipotez. V F-testu je statistika F sestavljena iz razmerja hi-kvadratnih porazdelitev, ki so same funkcije parametra normalne variance. Razmerje obeh povzroči odstopanje odstopanja, kar omogoča preizkušanje hipotez brez poznavanja odstopanj poleg njihove normalnosti in stalnosti.