Introducere în statistici

Introducere în statistici

rezultatele învățării

  • recunoașteți, descrieți și calculați măsurile de răspândire a datelor: varianța, abaterea standard și intervalul.o caracteristică importantă a oricărui set de date este variația datelor. În unele seturi de date, valorile datelor sunt concentrate strâns în apropierea mediei; în alte seturi de date, valorile datelor sunt mai răspândite din medie. Cea mai obișnuită măsură de variație sau răspândire este abaterea standard., Abaterea standard este un număr care măsoară cât de departe sunt valorile datelor de media lor.deviația standard oferă o măsură numerică a cantității totale de variație într-un set de date și poate fi utilizată pentru a determina dacă o anumită valoare a datelor este apropiată sau departe de medie.

    abaterea standard oferă o măsură a variației globale într-un set de date.

    abaterea standard este întotdeauna pozitivă sau zero. Abaterea standard este mică atunci când datele sunt concentrate aproape de medie, prezentând o mică variație sau răspândire., Abaterea standard este mai mare atunci când valorile datelor sunt mai răspândite din medie, prezentând mai multe variații.să presupunem că studiem timpul în care clienții așteaptă la coadă la checkout la supermarketul A și supermarketul B. timpul mediu de așteptare la ambele supermarketuri este de cinci minute. La supermarketul A, abaterea standard pentru timpul de așteptare este de două minute; la supermarketul B abaterea standard pentru timpul de așteptare este de patru minute.deoarece supermarketul B are o abatere standard mai mare, știm că există mai multe variații în timpul de așteptare la supermarketul B., În general, Timpii de așteptare la supermarketul B sunt mai răspândiți față de media; timpii de așteptare la supermarketul A sunt mai concentrați în apropierea mediei.

    abaterea standard poate fi utilizată pentru a determina dacă o valoare a datelor este apropiată sau departe de medie.să presupunem că Rosa și Binh fac cumpărături la supermarketul A. Rosa așteaptă la ghișeul de checkout timp de șapte minute, iar Binh așteaptă un minut. La supermarketul A, timpul mediu de așteptare este de cinci minute, iar abaterea standard este de două minute., Abaterea standard poate fi utilizată pentru a determina dacă o valoare a datelor este apropiată sau departe de medie.Rosa așteaptă șapte minute:

    • șapte este cu două minute mai lungă decât media de cinci; două minute este egală cu o abatere standard.
    • timpul de așteptare al lui Rosa de șapte minute este cu două minute mai lung decât media de cinci minute.
    • timpul de așteptare al lui Rosa de șapte minute este o abatere standard peste media de cinci minute.Binh așteaptă un minut.,

      • unul este cu patru minute mai mic decât media de cinci; patru minute este egal cu două abateri standard.timpul de așteptare al lui Binh de un minut este cu patru minute mai mic decât media de cinci minute.timpul de așteptare al lui Binh de un minut este de două abateri standard sub media de cinci minute.

      o valoare a datelor care reprezintă două deviații standard față de medie este doar la limită pentru ceea ce mulți statisticieni ar considera a fi departe de medie., Considerând că datele sunt departe de medie dacă sunt mai mult de două abateri standard, este mai mult o „regulă de degetul mare” decât o regulă rigidă. În general, forma distribuției datelor afectează cât de mult din date este mai departe decât două abateri standard. (Veți afla mai multe despre acest lucru în capitolele ulterioare.)

      linia numerică vă poate ajuta să înțelegeți abaterea standard. Dacă ar fi să punem cinci și șapte pe o linie numerică, șapte este la dreapta a cinci. Spunem, atunci, că șapte este
      o abatere standard la dreapta a cinci, deoarece 5 + (1)(2) = 7.,dacă unul a făcut parte și din setul de date, atunci unul este de două abateri standard la stânga a cinci, deoarece 5 + (-2)(2) = 1.

      ecuația valoare = media + (#ofSTDEVs)(abaterea standard) poate fi exprimat pentru un eșantion și pentru o populație.

      litera minusculă s reprezintă abaterea standard a eșantionului, iar litera greacă σ (sigma, minusculă) reprezintă abaterea standard a populației.,

      calcularea deviației Standard

      procedura de calculare a deviației standard depinde de faptul dacă numerele sunt întreaga populație sau sunt date dintr-un eșantion. Calculele sunt similare, dar nu identice. Prin urmare, simbolul utilizat pentru a reprezenta abaterea standard depinde de faptul dacă este calculat dintr-o populație sau dintr-un eșantion. Litera minusculă s reprezintă abaterea standard a eșantionului, iar litera greacă σ (sigma, minusculă) reprezintă abaterea standard a populației., Dacă eșantionul are aceleași caracteristici ca și populația, atunci s ar trebui să fie o estimare bună a σ.dacă numerele provin dintr-un recensământ al întregii populații și nu dintr-un eșantion, atunci când calculăm media abaterilor pătrate pentru a găsi varianța, împărțim cu N, numărul de articole din populație. Dacă datele provin dintr – un eșantion și nu dintr-o populație, atunci când calculăm media abaterilor pătrate, împărțim cu n-1, Unul mai mic decât numărul de elemente din eșantion.,

      în următorul videoclip este prezentat un exemplu de calcul al varianței și deviației standard a unui set de date.

      Formule pentru Eșantion, Abaterea Standard

      \displaystyle{s}=\sqrt{{\frac{{\sum{({x}-\overline{{x}})}^{{2}}}}{{{n}-{1}}}}}{\quad\text{or}\quad}{s}=\sqrt{{\frac{{\sum{f{{({x}-\overline{{x}})}}}^{{2}}}}{{{n}-{1}}}}}

      Pentru eșantion, abaterea standard, numitorul este n – 1, care este dimensiunea eșantionului MINUS 1.,

      Formule pentru Populație Abaterea Standard

      \displaystyle\sigma=\sqrt{{\frac{{\sum{({x}-\mu)}^{{2}}}}{{{N}}}}}{\quad\text{or}\quad}\sigma=\sqrt{{\frac{{\sum{f{{({x}-\mu)}}}^{{2}}}}{{{N}}}}}

      Pentru populație abaterea standard, numitorul este N, numărul de elemente din populație.

      variabilitatea eșantionării unei statistici

      cât de mult variază statistica de la o probă la alta este cunoscută sub numele de variabilitatea eșantionării unei statistici. De obicei, măsurați variabilitatea eșantionării unei statistici prin eroarea standard., Eroarea standard a mediei este un exemplu de eroare standard. Este o abatere standard specială și este cunoscută sub numele de abaterea standard a distribuției de eșantionare a mediei. Veți acoperi eroarea standard a mediei atunci când aflați despre teorema limitei centrale (nu acum). Notația pentru eroarea standard a mediei este \displaystyle\frac{{\sigma}}{{\sqrt{n}}} unde σ este abaterea standard a populației și n este mărimea eșantionului.

      notă

      în practică, utilizați un calculator sau un software de calculator pentru a calcula abaterea standard., Dacă utilizați un calculator TI-83, 83+, 84+, trebuie să selectați abaterea standard corespunzătoare σ_x sau s_x din Statisticile sumare. Ne vom concentra pe utilizarea și interpretarea informațiilor pe care ni le oferă abaterea standard. Cu toate acestea, ar trebui să studiați următorul exemplu pas cu pas pentru a vă ajuta să înțelegeți modul în care abaterea standard măsoară variația față de medie. (Instrucțiunile calculatorului apar la sfârșitul acestui exemplu.,)

      explicarea calculului deviației standard prezentat în tabelul

      abaterile arată cât de răspândite sunt datele despre medie. Valoarea datelor 11.5 este mai departe de medie decât este valoarea datelor 11, care este indicată de abaterile 0.97 și 0.47. O abatere pozitivă apare atunci când valoarea datelor este mai mare decât media, în timp ce o abatere negativă apare atunci când valoarea datelor este mai mică decât media. Abaterea este -1.525 pentru valoarea datelor nouă. Dacă adăugați abaterile, suma este întotdeauna zero. (De exemplu 1, Există n = 20 abateri.,) Deci nu puteți adăuga pur și simplu abaterile pentru a obține răspândirea datelor. Prin pătratul abaterilor, le faceți numere pozitive, iar suma va fi, de asemenea, pozitivă. Varianța, atunci, este deviația medie pătrată.varianța este o măsură pătrată și nu are aceleași unități ca datele. Luarea rădăcinii pătrate rezolvă problema. Abaterea standard măsoară răspândirea în aceleași unități ca și datele.observați că în loc să împărțiți cu n= 20, calculul împărțit la n – 1 = 20 – 1 = 19, deoarece datele sunt un eșantion., Pentru variația eșantionului, împărțim la dimensiunea eșantionului minus unu (n – 1). De ce nu împărțiți cu n? Răspunsul are legătură cu variația populației. Variația eșantionului este o estimare a varianței populației. Pe baza matematicii teoretice care se află în spatele acestor calcule, împărțirea cu (n – 1) oferă o estimare mai bună a varianței populației.

      notă

      concentrația dvs. ar trebui să fie pe ceea ce ne spune abaterea standard despre date. Abaterea standard este un număr care măsoară cât de departe sunt răspândite datele de la medie., Lăsați un calculator sau un computer să facă aritmetica.deviația standard, s sau σ, este fie zero, fie mai mare decât zero. Atunci când abaterea standard este zero, nu există nici o răspândire; adică, toate valorile de date sunt egale între ele. Abaterea standard este mică atunci când datele sunt concentrate aproape de medie și este mai mare atunci când valorile datelor arată o variație mai mare față de medie. Când abaterea standard este mult mai mare decât zero, valorile datelor sunt foarte răspândite în jurul mediei; valorile aberante pot face s sau σ foarte mari.,abaterea standard, atunci când este prezentată pentru prima dată, poate părea neclară. Prin graficul datelor dvs., puteți obține o mai bună „simt” pentru abaterile și abaterea standard. Veți găsi că în distribuțiile simetrice, abaterea standard poate fi foarte utilă, dar în distribuțiile înclinate, abaterea standard poate să nu fie de mare ajutor. Motivul este că cele două părți ale unei distribuții înclinate au spread-uri diferite. Într-o distribuție înclinată, este mai bine să privim prima quartilă, mediana, a treia quartilă, cea mai mică valoare și cea mai mare valoare., Deoarece numerele pot fi confuze, graficul întotdeauna datele. Afișați datele într-o histogramă sau într-o casetă.

      deviația Standard a tabelelor de frecvență grupate

      reamintim că pentru datele grupate nu cunoaștem valorile individuale ale datelor, deci nu putem descrie cu precizie valoarea tipică a datelor. Cu alte cuvinte, nu putem găsi media exactă, mediana sau modul., Putem, cu toate acestea, determina cea mai bună estimare a măsurilor de centrul de către găsirea de date grupate cu formula:

      de Frecvență Tabelul =\displaystyle\frac{{\sum(fm)}}{{\sum(f)}}

      în cazul în care f = interval de frecvențe și m = intervalul de mijloc.la fel cum nu am putut găsi media exactă, nici nu putem găsi abaterea standard exactă. Amintiți-vă că abaterea standard descrie numeric abaterea așteptată o valoare de date are de la medie. În limba engleză simplă, abaterea standard ne permite să comparăm modul în care datele individuale” neobișnuite ” sunt comparate cu media.,

      compararea valorilor din diferite seturi de date

      abaterea standard este utilă atunci când se compară valorile datelor care provin din diferite seturi de date. Dacă seturile de date au diferite mijloace și abateri standard, atunci compararea directă a valorilor datelor poate fi înșelătoare.

      #ofSTDEVs este adesea numit „scor z”; putem folosi simbolul z., În simbolurile, formulele devin:

      Proba x=\overline{x}+zs z = \frac{x \overline{x}}{s}
      Populație x = μ + zσ z = \frac{x – μ}{σ}

      listele De mai jos dă câteva fapte, care oferă un pic mai mult introspecție în ceea ce deviația standard ne spune despre distribuția datelor.,pentru orice set de date, indiferent de distribuția datelor:

      pentru datele care au o distribuție în formă de clopot și simetrică:

      • aproximativ 68% Din date se încadrează într-o abatere standard a mediei.
      • aproximativ 95% din date se încadrează în două abateri standard ale mediei.
      • mai mult de 99% din date se încadrează în trei abateri standard ale mediei.
      • aceasta este cunoscută sub numele de regula empirică.
      • este important să rețineți că această regulă se aplică numai atunci când forma distribuției datelor este în formă de clopot și simetrică., Vom afla mai multe despre acest lucru atunci când studiem distribuția de probabilitate „normală” sau „Gaussiană” în capitolele ulterioare.

      revizuirea conceptului

      abaterea standard vă poate ajuta să calculați răspândirea datelor. Există diferite ecuații de utilizat dacă se calculează abaterea standard a unui eșantion sau a unei populații.

      Formula de Revizuire

      \displaystyle{s}_{x}=\sqrt{{\frac{{\sum{fm}^{2}}}{{n}} – {x}^{2}}}

      în cazul în care \displaystyle{s}_{x} = eșantion, abaterea standard, \displaystyle\overline{x} = eșantion înseamnă

      Lasă un răspuns

      Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *