Sturgsien sääntö, selitys, sovellukset ja esimerkit



Sturges-sääntö on kriteeri, jota käytetään määrittämään sellaisten luokkien tai aikavälien lukumäärä, jotka ovat välttämättömiä tilastotietojen joukon graafiselle esittämiselle. Tämän säännön esitti vuonna 1926 saksalainen matemaatikko Herbert Sturges.

Sturges ehdotti yksinkertaista menetelmää, joka perustuu näytteiden lukumäärään x, joka sallii luokkien lukumäärän ja niiden kantaman amplitudin. Sturges-sääntöä käytetään laajasti erityisesti tilastojen alalla, erityisesti taajuushistogrammien rakentamiseen.

indeksi

  • 1 Selitys
  • 2 Sovellukset
  • 3 Esimerkki
  • 4 Viitteet

selitys

Sturges sääntö on empiirinen menetelmä laajalti käytetty kuvailevia tilastoja määrittämiseksi luokkien määrä, joka on olemassa histogrammin taajuuksia, jotta luokitella joukko dataa, joka edustaa näytteen tai populaatio.

Periaatteessa tämä sääntö määrittää graafisten konttien leveyden, taajuushistogrammit.

Vahvistaa sen säännön Herbert Sturges pitää kaavio ihanteellinen taajuusalueilla, joka koostuu K, jossa i: nnen aikavälin sisältää tietyn määrän näytteitä (i = 0, ... k - 1) esittää seuraavasti:

Tämä näytteiden lukumäärä saadaan niiden tapojen lukumäärästä, joilla joukon alaryhmä voidaan purkaa; eli binomikertoimella ilmaistuna seuraavasti:

Lausekkeen yksinkertaistamiseksi hän sovelsi logaritmien ominaisuuksia yhtälön molemmissa osissa:

Siten Sturges totesi, että aikavälin k optimaalinen määrä ilmaistaan ​​ilmaisulla:

Se voidaan ilmaista myös seuraavasti:

Tässä lausekkeessa:

- k on luokkien lukumäärä.

- N on näytteen havaintojen kokonaismäärä.

- Loki on pohjan 10 yleinen logaritmi.

Jos haluat esimerkiksi tehdä taajuushistogrammin, joka ilmaisee satunnaisnäytteen, jonka korkeus on 142 lasta, jaksojen tai luokkien määrä, joita jakelulla on:

k = 1 + 3,322 * loki10 (N)

k = 1 + 3,322* loki (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Siten jakauma on kahdeksan välein.

Aikavälien lukumäärää tulisi aina esittää kokonaisluvuina. Tapauksissa, joissa arvo on desimaalinen, on tehtävä likiarvo lähimpään kokonaislukuun.

sovellukset

Sturges sääntöä sovelletaan pääasiassa tilastoista, koska tämä mahdollistaa frekvenssijakaumaa laskemalla luokkien määrä (k) ja pituus kunkin näistä, joka tunnetaan myös nimellä amplitudi.

Amplitudi on luokan ylä- ja alarajojen välinen ero jaettuna luokkien lukumäärällä ja ilmaistaan:

On monia empiirisiä sääntöjä, jotka mahdollistavat taajuusjakauman. Sturges-sääntöä käytetään kuitenkin yleisesti, koska se on lähellä luokkien lukumäärää, joka on yleensä 5 - 15.

Tarkastellaan näin arvoa, joka edustaa riittävästi näytettä tai populaatiota; toisin sanoen, lähentäminen ei ole äärimmäisiä ryhmittymiä, eikä se toimi liian suurella määrällä luokkia, jotka eivät salli näytteen tiivistämistä.

esimerkki

Sinun täytyy tehdä taajuus histogrammin tietojen mukaan annettu, vastaten ikäiset saivat kyselytutkimuksella miehiä, jotka käyttävät kuntosali kaupunkia.

Välitietojen määrittämiseksi sinun on tiedettävä, mikä on näytteen koko tai havaintojen määrä; tässä tapauksessa sinulla on 30.

Sitten sovelletaan Sturges-sääntöä:

k = 1 + 3,322 * loki10 (N)

k = 1 + 3,322* loki (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 välein.

Aikaväleistä voidaan laskea amplitudi, joka näillä on; eli jokaisen taajuushistogrammissa esitetyn palkin leveys:

Alarajaa pidetään datan pienimpänä arvona, ja yläraja on korkein arvo. Ylemmän ja alemman rajan välistä eroa kutsutaan muuttujan (R) alueeksi tai reitiksi..

Taulukosta löytyy, että yläraja on 46 ja alaraja 13; siten kunkin luokan amplitudi on:

Aikavälit koostuvat ylä- ja alarajasta. Voit määrittää nämä aikaväliä laskemalla alarajasta lisäämällä siihen säännön (6) määrittämän amplitudin seuraavasti:

Sitten absoluuttinen taajuus lasketaan määrittämään kullekin aikavälille vastaava miesten määrä; tässä tapauksessa se on:

- Intervalli 1: 13 - 18 = 9

- Intervalli 2: 19 - 24 = 9

- Intervalli 3: 25 - 30 = 5

- Intervalli 4: 31 - 36 = 2

- Intervalli 5: 37 - 42 = 2

- Aikaväli 6: 43 - 48 = 3

Kun lisätään kunkin luokan absoluuttinen taajuus, sen on oltava sama kuin näytteen kokonaismäärä; tässä tapauksessa 30.

Seuraavaksi lasketaan kunkin aikavälin suhteellinen taajuus, jakamalla tämän aikavälin absoluuttinen taajuus havaintojen kokonaismäärällä:

- Intervalli 1: fi = 9 ÷ 30 = 0,30

- Intervalli 2: fi = 9 ÷ 30 = 0,30

- Intervalli 3: fi = 5 ÷ 30 = 0,1666

- Intervalli 4: fi = 2 ÷ 30 = 0,0666

- Intervalli 5: fi = 2 ÷ 30 = 0,0666

- Intervalli 4: fi = 3 ÷ 30 = 0,10

Sitten voit tehdä taulukon, joka heijastaa tietoja, ja myös kaavion suhteellisesta taajuudesta suhteessa saatuihin aikaväleihin, kuten seuraavista kuvista näkyy:

Näin ollen sääntö Sturges voi määrittää luokkien määrä tai alueita, joissa näyte voidaan jakaa, jotta tiivistää datanäyte kehittämällä kaavioita.

viittaukset

  1. Alfonso Urquía, M. V. (2013). Erillisten tapahtumien mallinnus ja simulointi. UNED,.
  2. Altman Naomi, M. K. (2015). "Yksinkertainen lineaarinen regressio". Luontomenetelmät .
  3. Antúnez, R. J. (2014). Tilastot koulutuksessa. Digitaalinen UNID.
  4. Fox, J. (1997). Sovellettu regressioanalyysi, lineaariset mallit ja niihin liittyvät menetelmät. SAGE-julkaisut.
  5. Humberto Llinás Solano, C. R. (2005). Kuvaavat tilastot ja todennäköisyysjakaumat. Pohjoisen yliopisto.
  6. Panteleeva, O. V. (2005). Todennäköisyyden ja tilastojen perusteet.
  7. O. Kuehl, M. O. (2001). Kokeiden suunnittelu: Suunnittelun ja tutkimuksen analyysin tilastolliset periaatteet. Thomsonin toimittajat.