tilastotiede

tilastotiede

osaamistavoitteet

  • Tunnistaa, kuvailla ja laskea toimenpiteet leviämisen tiedot: varianssi, keskihajonta ja vaihteluväli.

tärkeä ominaisuus tahansa joukko tietoja on vaihtelu tietoja. Joissakin tietokokonaisuuksissa tietoarvot keskittyvät lähelle keskiarvoa; muissa tietokokonaisuuksissa tietoarvot jakautuvat laajemmin keskiarvosta. Yleisin variaation eli hajonnan mitta on keskihajonta., Keskihajonta on luku, joka mittaa, kuinka kaukana arvot ovat niiden keskiarvo.

keskihajonta tarjoaa numeerinen mitta kokonaismäärän vaihtelu tietojen joukko, ja voidaan käyttää määrittämään, onko tietty data-arvo on lähellä tai kaukana siis.

keskihajonta mittaa kokonaisvaihtelua tietojoukossa.

keskihajonta on aina positiivinen tai nolla. Keskihajonta on pieni, kun kaikki tiedot keskitetään lähelle keskiarvoa, jolloin vaihtelu tai leviäminen on vähäistä., Keskihajonta on suurempi, kun tietoarvot jakautuvat keskiarvosta enemmän ja niissä on enemmän vaihtelua.

Oletetaan, että meillä on opiskelun aikaa, asiakkaat jonottaa kassalla supermarket ja supermarket B. keskimääräinen odotusaika sekä supermarketit on viisi minuuttia. At supermarket, keskihajonta odottaa aikaa on kaksi minuuttia; supermarketissa B keskihajonta odottaa aika on neljä minuuttia.

Koska supermarket B on suurempi keskihajonta, me tiedämme, että siellä on enemmän vaihtelua odota kertaa supermarket B., Yleisesti ottaen odota kertaa supermarket B ovat levittäytyneet keskimäärin; odota kertaa supermarket ovat keskittyneet lähelle keskimääräistä.

keskihajonnan avulla voidaan määrittää, onko tietoarvo lähellä keskiarvoa vai kaukana keskiarvosta.

Oletetaan, että Rosa ja Binh sekä ostoksia supermarket A. Rosa odottaa kassalla seitsemän minuuttia ja Bình odottaa yhden minuutin. At supermarket, keskimääräinen odotusaika on viisi minuuttia ja keskihajonta on kaksi minuuttia., Keskihajonnan avulla voidaan määrittää, onko tietoarvo lähellä keskiarvoa vai kaukana siitä.

Rosa odottaa seitsemän minuuttia:

  • Seitsemän on kaksi minuuttia pidempi kuin keskimäärin viisi; kaksi minuuttia on yhtä suuri kuin yksi keskihajonta.
  • Rosan seitsemän minuutin odotusaika on kaksi minuuttia pidempi kuin keskimäärin viisi minuuttia.
  • Rosan seitsemän minuutin odotusaika on yksi keskihajonta yli viiden minuutin keskiarvon.

Binh odottaa minuutin.,

  • Yksi on neljä minuuttia vähemmän kuin keskimäärin viisi; neljä minuuttia on yhtä suuri kuin kaksi standardipoikkeamaa.
  • Binhin yhden minuutin odotusaika on neljä minuuttia alle viiden minuutin keskiarvon.
  • Binhin yhden minuutin odotusaika on kaksi keskihajontaa alle viiden minuutin keskiarvon.

data-arvo, joka on kahden keskihajonnan päässä keskiarvosta on vain rajatapaus, mitä monet tilastotieteilijät pitäisivät olla kaukana keskiarvosta., Ottaen huomioon tietojen kaukana jos se on enemmän kuin kahden keskihajonnan päässä on enemmän arvioitu ”nyrkkisääntö” kuin jäykkä sääntö. Yleensä tietojen jakautumisen muoto vaikuttaa siihen, kuinka suuri osa tiedoista on kauempana kuin kaksi standardipoikkeamaa. (Saat lisätietoja tästä myöhemmissä luvuissa.)

lukurivi voi auttaa ymmärtämään keskihajontaa. Jos pistäisimme viisi ja seitsemän lukulinjalle, seitsemän on oikealla viidellä. Sanomme siis, että seitsemän on
yksi keskihajonta viiden oikealle, koska 5 + (1)(2) = 7.,

Jos yksi kuului myös tietojoukkoon, niin yksi on kaksi standardipoikkeamaa vasemmalle viidestä, koska 5 + (-2)(2) = 1.

yhtälö arvo = keskiarvo + (#ofSTDEVs)(keskihajonta) voidaan ilmaista otos ja populaatio.

kirjainta s edustaa otoksen keskihajonta ja kreikan kirjaimella σ (sigma, alempi tapaus) edustaa perusjoukon keskihajonta.,

Laskettaessa Keskihajonta

– menettely laskea keskihajonta riippuu siitä, onko luvut ovat koko väestön tai tietoja näyte. Laskelmat ovat samanlaisia, mutta eivät identtisiä. Näin ollen keskihajonnan kuvaamiseen käytetty tunnus riippuu siitä, lasketaanko se populaatiosta vai otoksesta. Alempi kirjain s edustaa otoksen keskihajontaa ja kreikkalainen kirjain σ (Sigma, alempi tapaus) populaation keskihajontaa., Jos näytteellä on samat ominaisuudet kuin populaatiolla, S: n pitäisi olla hyvä σ-estimaatti.

Jos numerot tulevat väestönlaskennan mukaan koko perusjoukko ja otos, kun me laskea keskimääräinen potenssiin korotettu löytää varianssi, jaamme N, kohteiden määrä väestöstä. Jos tiedot ovat peräisin näytteen sijasta väestöstä, kun me laskea keskimääräinen neliöllinen poikkeama, me jakaa n – 1, yksi vähemmän kuin määrä kohteita näytteessä.,

seuraavassa videossa esitetään esimerkki tietoryhmän varianssin ja keskihajonnan laskemisesta.

Kaavat Otoksen Keskihajonta

\displaystyle{s}=\sqrt{{\frac{{\sum{({x}-\overline{{x}})}^{{2}}}}{{{n}-{1}}}}}{\quad\text{or}\quad}{s}=\sqrt{{\frac{{\sum{f{{({x}-\overline{{x}})}}}^{{2}}}}{{{n}-{1}}}}}

otoksen keskihajonta, nimittäjä on n – 1, joka on otoksen koko MIINUS 1.,

Kaavat Populaation Keskihajonta

\displaystyle\sigma=\sqrt{{\frac{{\sum{({x}-\mu)}^{{2}}}}{{{N}}}}}{\quad\text{or}\quad}\sigma=\sqrt{{\frac{{\sum{f{{({x}-\mu)}}}^{{2}}}}{{{N}}}}}

väestön standardi poikkeama, nimittäjä on N, kohteiden määrä väestöstä.

Näytteenotto Vaihtelu Tilasto

Kuinka paljon tilastotieto vaihtelee otoksesta toiseen tunnetaan näytteenoton vaihtelevuus tilasto. Yleensä mitata näytteenoton vaihtelevuus tilastotieto sen keskivirhe., Keskiarvon standardivirhe on esimerkki vakiovirheestä. Se on erityinen keskihajonta ja on tunnettu keskihajonta näytteenotto jakelu tarkoittaa. Voit kattaa standardin virhe keskiarvo, kun opit Central Limit lause (ei nyt). Merkintätapa keskivirhe keskiarvo on \displaystyle\frac{{\sigma}}{{\sqrt{n}}}, missä σ on keskihajonta väestöstä ja n on otoksen koko.

Huomautus

käytännössä keskihajonnan laskemiseen käytetään laskinta tai tietokoneohjelmistoa., Jos käytät TI-83, 83+, 84+ laskin, sinun täytyy valita sopiva keskihajonta σ_x tai s_x päässä yhteenveto tilastoihin. Keskitymme käyttämään ja tulkitsemaan standardipoikkeaman meille antamia tietoja. Sinun tulee kuitenkin tutkia seuraavaa askel askeleelta esimerkkiä, jotta ymmärrät, miten keskihajonta mittaa vaihtelua keskiarvosta. (Laskimen ohjeet näkyvät tämän esimerkin lopussa.,)

Selitys keskihajonnan laskenta on esitetty taulukossa

poikkeamat osoittavat, miten levittää tietoja siitä. Data-arvo 11.5 on kauempana keskiarvosta kuin on data-arvo 11, joka on merkitty poikkeamat 0.97 ja 0,47. Positiivinen poikkeama tapahtuu, kun tietoarvo on keskiarvoa suurempi, kun taas negatiivinen poikkeama tapahtuu, kun tietoarvo on keskiarvoa pienempi. Poikkeama on -1,525, kun tietoarvo on yhdeksän. Jos lisätään poikkeamat, summa on aina nolla. (Esimerkiksi 1 on n = 20 poikkeamaa.,) Joten et voi vain lisätä poikkeamat saada levittää tietoja. Neliöimällä poikkeamat teet niistä positiivisia lukuja, ja summa on myös positiivinen. Varianssi on siis keskimääräinen neliöpoikkeama.

varianssi on neliömitta, eikä sillä ole samoja yksiköitä kuin tiedolla. Neliöjuuren ottaminen ratkaisee ongelman. Keskihajonta mittaa hajontaa samoissa yksiköissä kuin tiedot.

Huomaa, että sen sijaan, jakamalla n= 20, laskenta jaetaan n – 1 = 20 – 1 = 19 koska tiedot on näyte., Näytteen varianssi jaetaan otoskoolla miinus yksi (n – 1). Miksi ei jakaa n? Vastaus liittyy väestövaihteluun. Otosvarianssi on arvio populaatiovarianssista. Perustuu teoreettisen matematiikan että taustalla nämä laskelmat, jakamalla (n – 1) antaa paremman arvion populaation varianssi.

Huom!

keskittymiskykyä pitäisi olla, mitä keskihajonta kertoo tiedot. Keskihajonta on luku, joka mittaa, kuinka pitkälle tiedot jakautuvat keskiarvosta., Anna laskimen tai tietokoneen tehdä aritmeettinen.

keskihajonta, s tai σ, on joko nolla tai suurempi kuin nolla. Kun keskihajonta on nolla, ei ole hajontaa, eli kaikki data-arvot ovat yhtä suuret keskenään. Keskihajonta on pieni, kun kaikki tiedot keskitetään lähelle keskiarvoa ja on suurempi, kun tietoarvot osoittavat enemmän vaihtelua keskiarvosta. Kun keskihajonta on paljon suurempi kuin nolla, tiedot arvot ovat hyvin levittää siitä; harha voi tehdä s tai σ erittäin suuri.,

standardipoikkeama, kun se esitetään ensimmäisen kerran, voi tuntua epäselvältä. Kuvaamalla tietosi, voit saada paremman ”tuntea” poikkeamat ja keskihajonta. Tulet huomaamaan, että symmetrinen jakaumat, keskihajonta voi olla erittäin hyödyllistä, mutta vinossa jakaumat, keskihajonta voi olla paljon apua. Syynä on se, että vinon jakauman molemmilla puolilla on erilaisia levitteitä. Vinossa jakaumassa on parempi tarkastella ensimmäistä kvartiilia, mediaania, kolmatta kvartiilia, pienintä arvoa ja suurinta arvoa., Koska numerot voivat olla hämmentäviä, aina graafata tietosi. Näytä tietosi histogrammissa tai ruudussa.

Keskihajonta Ryhmitelty Taajuus Taulukot

Muista, että ryhmitettyjen tietojen emme tiedä yksittäisten tietojen arvoja, joten emme voi kuvata tyypillinen arvo tiedot tarkasti. Toisin sanoen emme löydä tarkkaa keskiarvoa, mediaania tai moodia., Voimme kuitenkin määrittää paras arvio toimenpiteiden center löytää keskiarvo ryhmitelty tiedot kaava:

Keskiarvo Taajuus Taulukko =\displaystyle\frac{{\sum(fm)}}{{\sum(f)}}

missä f = väli taajuudet ja m = väli midpoints.

aivan kuten emme löytäneet tarkkaa keskiarvoa, emme myöskään löydä tarkkaa keskihajontaa. Muista, että keskihajonta kuvaa numeerisesti odotettua poikkeamaa, joka data-arvolla on keskiarvosta. Yksinkertaisessa englannin kielessä keskihajonnan avulla voidaan vertailla, miten” epätavallisia ” yksittäisiä tietoja verrataan keskiarvoon.,

vertailemalla eri tietokokonaisuuksien arvoja

keskihajonta on hyödyllinen vertailtaessa eri tietokokonaisuuksista tulevia tietoarvoja. Jos tietoaineistoissa on erilaisia keinoja ja standardipoikkeamia, tietojen arvojen suora vertailu voi olla harhaanjohtavaa.

#ofSTDEVs on usein nimeltään ”z-score”; Voimme käyttää symbolia z., Symbolit, kaavat tullut:

Näyte x=\overline{x}+zs z = \frac{x – \overline{x}}{s}
Väestöstä x = μ + zσ z = \frac{x – μ}{σ}

seuraavat luettelot antaa muutamia tosiasioita, jotka tarjoavat hieman enemmän tietoa siitä, mitä keskihajonta kertoo jakelu tiedot.,

Saat KAIKKI tiedot, asettaa, ei ole väliä mitä jakelu tiedot:

tietojen joilla on jakelu, joka on BELL-MUOTOINEN ja SYMMETRINEN:

  • Noin 68% tiedoista on majoitusliike, yksi keskihajonta keskiarvon.
  • noin 95% tiedoista on kahden keskihajonnan sisällä keskiarvosta.
  • yli 99% tiedoista on kolmen keskihajonnan sisällä keskiarvosta.
  • Tämä tunnetaan empiirisenä sääntönä.
  • on tärkeää huomata, että tätä sääntöä sovelletaan vain silloin, kun datan jakauman muoto on kellomainen ja symmetrinen., Opimme tästä lisää tutkiessamme” normaalia ”tai” Gaussin ” todennäköisyysjakaumaa myöhemmissä luvuissa.

Konseptiarvio

keskihajonta voi auttaa laskemaan tiedon leviämistä. On olemassa erilaisia yhtälöitä, joita käytetään, jos lasketaan näytteen tai populaation keskihajontaa.

Formula Arvostelu

\displaystyle{s}_{x}=\sqrt{{\frac{{\sum{fm}^{2}}}{{n}} – {x}^{2}}}

missä \displaystyle{s}_{x} = otoksen keskihajonta, \displaystyle\overline{x} = otoksen keskiarvo

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *