Úvod do Statistiky

Úvod do Statistiky

Výsledky Učení

  • Rozpoznat, popsat a vypočítat opatření, šíření dat: rozptyl, směrodatná odchylka a rozpětí.

důležitou charakteristikou jakékoli sady dat je změna dat. V některých datových sadách jsou datové hodnoty soustředěny těsně blízko průměru; v jiných datových sadách jsou datové hodnoty rozšířenější od průměru. Nejběžnějším měřítkem variace nebo šíření je směrodatná odchylka., Směrodatná odchylka je číslo, které měří, jak daleko jsou datové hodnoty od jejich průměru.

směrodatná odchylka poskytuje číselné měřítko celkového množství variací v datové sadě a může být použita k určení, zda je konkrétní datová hodnota blízká nebo daleko od průměru.

směrodatná odchylka poskytuje míru celkové odchylky v datové sadě.

směrodatná odchylka je vždy kladná nebo nulová. Směrodatná odchylka je malá, když jsou data soustředěna blízko průměru, vykazující malou změnu nebo šíření., Směrodatná odchylka je větší, když jsou datové hodnoty více rozloženy od průměru a vykazují větší variabilitu.

Předpokládejme, že studujeme množství času, který zákazníci čekat ve frontě u pokladny v supermarketu a supermarket. B. průměrná čekací doba na obou supermarketech je pět minut. V supermarketu a je směrodatná odchylka čekací doby dvě minuty; v supermarketu B je směrodatná odchylka čekací doby čtyři minuty.

protože supermarket B má vyšší směrodatnou odchylku, víme, že v době čekání v supermarketu B existuje více variací., Celkově jsou čekací doby v supermarketu B více rozloženy z průměru; čekací doby v supermarketu a jsou koncentrovanější v blízkosti průměru.

směrodatná odchylka může být použita k určení, zda je datová hodnota blízká nebo daleko od průměru.

Předpokládejme, že Rosa a Binh nakupují v supermarketu a. Rosa čeká u pokladny sedm minut a Binh čeká na jednu minutu. V supermarketu a je průměrná čekací doba pět minut a směrodatná odchylka je dvě minuty., Směrodatná odchylka může být použita k určení, zda je datová hodnota blízká nebo daleko od průměru.

Rosa čeká sedm minut:

  • sedm je o dvě minuty delší než průměr pěti; dvě minuty se rovná jedné standardní odchylce.
  • Rosina čekací doba sedmi minut je o dvě minuty delší, než je průměr pěti minut.
  • Rosina čekací doba sedmi minut je jedna směrodatná odchylka nad průměrem pěti minut.

Binh čeká jednu minutu.,

  • jedna je o čtyři minuty menší než průměr pěti; čtyři minuty se rovnají dvěma standardním odchylkám.
  • Binhova čekací doba jedné minuty je o čtyři minuty kratší než průměr pěti minut.
  • Binhova čekací doba jedné minuty je dvě standardní odchylky pod průměrem pěti minut.

datová hodnota, která je dvě standardní odchylky od průměru, je právě na hranici toho, co by mnozí statistici považovali za daleko od průměru., Vzhledem k tomu, že data jsou daleko od průměru, pokud jsou vzdálena více než dvě standardní odchylky, je spíše přibližným „pravidlem“ než pevným pravidlem. Obecně platí, že tvar distribuce dat ovlivňuje, kolik dat je dále než dvě standardní odchylky. (Více se o tom dozvíte v pozdějších kapitolách.)

číselný řádek vám může pomoci pochopit směrodatnou odchylku. Pokud bychom měli dát pět a sedm na číslo, sedm je napravo od pěti. Říkáme tedy, že sedm je
jedna směrodatná odchylka napravo od pěti, protože 5 + (1)(2) = 7.,

Pokud jeden byl také součástí datové sady, pak jeden je dvě standardní odchylky vlevo od pěti, protože 5 + (-2)(2) = 1.

rovnice hodnota = průměr + (#ofSTDEVs)(směrodatná odchylka) může být vyjádřena pro vzorek a pro obyvatelstvo.

malá písmena S představují směrodatnou odchylku vzorku a řecké písmeno σ (sigma, malá písmena) představuje standardní odchylku populace.,

výpočet směrodatné odchylky

postup výpočtu směrodatné odchylky závisí na tom, zda jsou čísla celá populace nebo jsou údaje ze vzorku. Výpočty jsou podobné, ale nejsou totožné. Symbol používaný k reprezentaci směrodatné odchylky proto závisí na tom, zda je vypočítán z populace nebo vzorku. Malá písmena S představují směrodatnou odchylku vzorku a řecké písmeno σ (sigma, malá písmena) představuje směrodatnou odchylku populace., Pokud má vzorek stejné vlastnosti jako populace, pak by měl být dobrý odhad σ.

Pokud čísla pocházejí ze sčítání celé populace a ne vzorku, když vypočítáme průměr čtvercových odchylek, abychom našli rozptyl, vydělíme N, počet položek v populaci. Pokud jsou údaje spíše ze vzorku než z populace, když vypočítáme průměr čtvercových odchylek, vydělíme n – 1, o jeden méně než počet položek ve vzorku.,

v následujícím videu je uveden příklad výpočtu rozptylu a standardní odchylky sady dat.

Vzorce pro Vzorek Směrodatná Odchylka

\displaystyle{s}=\sqrt{{\frac{{\sum{({x}-\overline{{x}})}^{{2}}}}{{{n}-{1}}}}}{\quad\text{or}\quad}{s}=\sqrt{{\frac{{\sum{f{{({x}-\overline{{x}})}}}^{{2}}}}{{{n}-{1}}}}}

směrodatná odchylka vzorku, jmenovatel je n – 1, je velikost vzorku MÍNUS 1.,

Vzorce pro Populační směrodatnou Odchylku

\displaystyle\sigma=\sqrt{{\frac{{\sum{({x}-\mu)}^{{2}}}}{{{N}}}}}{\quad\text{or}\quad}\sigma=\sqrt{{\frac{{\sum{f{{({x}-\mu)}}}^{{2}}}}{{{N}}}}}

populační směrodatná odchylka, jmenovatel je N, počet položek v populaci.

variabilita vzorkování statistiky

kolik se statistika liší od jednoho vzorku k druhému, je známá jako variabilita vzorkování statistiky. Typicky změříte variabilitu vzorkování statistiky podle její standardní chyby., Standardní chyba průměru je příkladem standardní chyby. Jedná se o zvláštní směrodatnou odchylku a je známá jako směrodatná odchylka rozdělení vzorku průměru. Budete pokrývat standardní chybu střední hodnoty, když se dozvíte o centrální limitní větě (ne nyní). Zápis pro standardní chyba průměru je \displaystyle\frac{{\sigma}}{{\sqrt{n}}}, kde σ je směrodatná odchylka základního souboru a n je velikost vzorku.

Poznámka

v praxi použijte kalkulačku nebo počítačový software pro výpočet standardní odchylky., Pokud používáte kalkulačku TI-83, 83+, 84+, musíte ze souhrnných statistik vybrat příslušnou směrodatnou odchylku σ_x nebo s_x. Zaměříme se na použití a interpretaci informací, které nám standardní odchylka dává. Nicméně byste měli studovat následující krok-za-krokem, příklad, aby vám pomohl pochopit, jak se směrodatná odchylka opatření odchylky od průměru. (Pokyny kalkulačky se zobrazí na konci tohoto příkladu.,)

vysvětlení výpočtu směrodatné odchylky uvedené v tabulce

odchylky ukazují, jak jsou data rozložena o průměru. Datová hodnota 11,5 je dále od průměru, než je datová hodnota 11, která je indikována odchylkami 0,97 a 0,47. Pozitivní odchylka nastává, když je hodnota dat větší než průměr, zatímco záporná odchylka nastane, když je hodnota dat menší než průměr. Odchylka je -1.525 pro datovou hodnotu devět. Pokud přidáte odchylky, součet je vždy nulový. (Například 1, existují odchylky n = 20.,) Takže nemůžete jednoduše přidat odchylky, abyste získali šíření dat. Rozdělením odchylek z nich uděláte pozitivní čísla a součet bude také pozitivní. Rozptyl je tedy průměrná hranatá odchylka.

rozptyl je druhou opatření a nemá stejné jednotky jako data. Užívání druhé odmocniny řeší problém. Směrodatná odchylka měří rozpětí ve stejných jednotkách jako data.

Všimněte si, že namísto dělení n= 20 je výpočet dělen N – 1 = 20 – 1 = 19, protože data jsou vzorkem., Pro rozptyl vzorku vydělíme velikostí vzorku minus jedna (n – 1). Proč ne rozdělit n? Odpověď má co do činění s rozptylem populace. Rozptyl vzorku je odhad rozptylu populace. Na základě teoretické matematiky, která leží za těmito výpočty, dělení (n – 1) poskytuje lepší odhad rozptylu populace.

Poznámka

vaše koncentrace by měla být na tom, co nám standardní odchylka říká o datech. Směrodatná odchylka je číslo, které měří, jak daleko jsou data šířena od průměru., Nechte kalkulačku nebo počítač provést aritmetiku.

směrodatná odchylka, s nebo σ, je buď nulová nebo větší než nula. Když je směrodatná odchylka nulová, nedochází k šíření; to znamená, že všechny datové hodnoty jsou si navzájem rovny. Směrodatná odchylka je malá, když jsou data soustředěna blízko průměru a je větší, když datové hodnoty vykazují větší odchylku od průměru. Když je směrodatná odchylka mnohem větší než nula, datové hodnoty jsou velmi rozloženy o průměru; odlehlé hodnoty mohou způsobit, že s nebo σ jsou velmi velké.,

směrodatná odchylka se při prvním uvedení může zdát nejasná. Grafem dat můžete získat lepší „pocit“ pro odchylky a směrodatnou odchylku. Zjistíte, že v symetrických distribucích může být směrodatná odchylka velmi užitečná, ale v zkreslených distribucích nemusí být směrodatná odchylka příliš nápomocná. Důvodem je, že obě strany zkosené distribuce mají různé rozpětí. V zkreslené distribuci je lepší podívat se na první kvartil, medián, třetí kvartil, nejmenší hodnotu a největší hodnotu., Protože čísla mohou být matoucí, vždy graf vaše data. Zobrazte data v histogramu nebo v grafu políčka.

směrodatná odchylka skupinových frekvenčních tabulek

připomeňme, že u seskupených dat neznáme jednotlivé datové hodnoty,takže nemůžeme přesně popsat typickou hodnotu dat. Jinými slovy, nemůžeme najít přesný průměr, medián nebo režim., Můžeme však určit nejlepší odhad opatření z centra tím, že najde znamenat, ze seskupených dat pomocí vzorce:

průměr Frekvence Tabulka =\displaystyle\frac{{\sum(fm)}}{{\sum(f)}}

kde f = interval frekvencí a m = interval středy.

stejně jako jsme nemohli najít přesný průměr, ani nemůžeme najít přesnou směrodatnou odchylku. Nezapomeňte, že směrodatná odchylka číselně popisuje očekávanou odchylku, kterou má datová hodnota od průměru. V jednoduché angličtině nám směrodatná odchylka umožňuje porovnat, jak jsou“ neobvyklá “ jednotlivá data porovnávána s průměrem.,

porovnání hodnot z různých datových sad

standardní odchylka je užitečná při porovnávání datových hodnot, které pocházejí z různých datových sad. Pokud mají datové sady různé prostředky a standardní odchylky, může být přímé porovnání datových hodnot zavádějící.

# ofSTDEVs se často nazývá „z-skóre“; můžeme použít symbol z., V symboly, vzorce, stát:

Vzorek x=\overline{x}+zs z = \frac{x – \overline{x}}{s}
počet Obyvatel x = μ + zσ z = \frac{x – μ}{σ}

následující seznamy dát pár faktů, které poskytují trochu větší vhled do toho, co směrodatná odchylka nám říká, o distribuci dat.,

Pro každou sadu dat, bez ohledu na rozdělení dat, je:

Pro data s rozložením, které je ve TVARU ZVONU a SYMETRICKÉ:

  • Přibližně 68% dat je v rámci jedné směrodatné odchylky od průměru.
  • přibližně 95% údajů je ve dvou standardních odchylkách průměru.
  • více než 99% údajů je v rámci tří standardních odchylek průměru.
  • toto je známé jako empirické pravidlo.
  • je důležité si uvědomit, že toto pravidlo platí pouze tehdy, když je tvar distribuce dat zvonkovitý a symetrický., Více se o tom dozvíme při studiu“ normálního „nebo“ Gaussovského “ rozdělení pravděpodobnosti v pozdějších kapitolách.

Concept Review

směrodatná odchylka vám může pomoci vypočítat šíření dat. Existují různé rovnice použít, pokud jsou výpočet směrodatné odchylky vzorku nebo populace.

Vzorec, Recenze

\displaystyle{s}_{x}=\sqrt{{\frac{{\sum{fm}^{2}}}{{n}} – {x}^{2}}}

, kde \displaystyle{s}_{x} = směrodatná odchylka vzorku, \displaystyle\overline{x} = výběrový průměr

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *