Стандардна девијација

дисперзија вредности случајне променљиве око њене очекиване вредности
(преусмерено са Standard deviation)

Стандардна девијација је у статистици апсолутна мера дисперзије у основном скупу. Она говори, колико у просеку елементи скупа одступају од аритметичке средине скупа. Означава се грчким словом сигма, σ.[1] Ниска стандардна девијација указује на то да вредности имају тенденцију да буду близу средње вредности (која се назива и очекиваном вредношћу) скупа, док висока стандардна девијација указује да су вредности распоређене у ширем опсегу.

Графикон нормалне дистрибуције (или крива у облику звона) где свака трака има ширину од 1 стандардне девијације – погледајте такође: правило 68–95–99,7.
Кумулативна вероватноћа нормалне дистрибуције са очекиваном вредношћу 0 и стандардном девијацијом 1

Стандардна девијација може бити скраћено записана као СД, а најчешће је представљена у математичким текстовима и једначинама малим грчким словом сигма σ, за стандардну девијацију популације, или латиничним словом s, за стандардну девијацију узорка.

Стандардна девијација случајне променљиве, узорка, статистичке популације, скупа података или расподеле вероватноће је квадратни корен њене варијансе. Она је алгебарски једноставнија, иако у пракси мање робустна, од просечног апсолутног одступања.[2][3] Корисна особина стандардне девијације је да је, за разлику од варијансе, изражена у истој јединици као и подаци.

Формула за израчунавање стандардне девијације је: ;

где је:
N - број елемената у скупу
μ - аритметичка средина скупа
- i-ти члан скупа (i =1,2,...,N)

Стандардна девијација у узорку нам говори колико у просеку елементи узорка одступају од аритметичке средине узорка. Израчунава се по формули:

;

где је:
n - број елемената у узорку
(икс-бар) - аритметичка средина узорка

- i-ти члан узорка (i =1,2,...,n)

Правила за нормално расподељене податке

уреди
 
Тамно плаво је унутар интервала од плус-минус једне стандардне девијације од аритметичке средине. За нормалну расподелу, ово обухвата 68,27% скупа; плус-минус две стандардне девијације од аритметичке средине обухватају 95,45 скупа%; плус-минус три стандардне девијације обухватају 99,73% посто скупа.

У пракси, често се претпоставља да су подаци из приближно нормално расподељене популације. Ако је та претпоставка оправдана, онда се око 68% вредности налази у интервалу од плус-минус једне стандардне девијације од аритметичке средине, око 95% вредности се налази у интервалу од плус-минус две стандардне девијације, а око 99,7% се налази унутар плус-минус 3 стандардне девијације. Ово је познато као Правило 68-95-99,7, или емпиријско правило.

Интервали поверења су следећи:

σ 68,26894921371%
95,44997361036%
99,73002039367%
99,99366575163%
99,99994266969%
99,99999980268%
99,99999999974%

За нормалну расподелу, две тачке на кривој које су удаљене једну стандардну девијацију од криве су такође и превојне тачке.

Основни примери

уреди

Популациона стандардна девијација оцена осморо ученика

уреди

Претпоставимо да је целокупна популација од интереса осам ученика у одређеном одељењу. За коначан скуп бројева, стандардна девијација популације се налази узимањем квадратног корена просека квадрата одступања вредности одузетих од њихове просечне вредности. Оцене одељења од осам ученика (тј. статистичке популације) су следећих осам вредности:

 

Ових осам тачака података имају средњу вредност (просек) од 5:

 

Прво се израчуна одступања сваке тачке података од средње вредности и квадрирају се резултати:

 

Варијанса је средња вредност ових вредности:

 

а стандардна девијација популације је једнака квадратном корену варијансе:

 

Ова формула важи само ако осам вредности са којима је започето чине комплетну популацију. Ако су вредности уместо тога биле случајни узорак извучен из неке велике родитељске популације (на пример, било је 8 ученика насумично и независно изабраних из класе од 2 милиона), онда се дели са 7 (што је n − 1) уместо са 8 (што је n) у имениоцу последње формуле, а резултат је   У том случају, резултат оригиналне формуле би био називан стандардна девијација узорка и означава са s уместо са   Дељење са n − 1 уместо са n даје непристрасну процену варијансе веће родитељске популације. Ово је познато као Беселова корекција.[4][5] Грубо речено, разлог за то је да се формула за варијансу узорка ослања на израчунавање разлика запажања од средње вредности узорка, а сама средња вредност узорка је конструисана да буде што је могуће ближа запажањима, тако да би само дељење са n потценило варијабилност.

Стандардна девијација просечне висине за одрасле мушкарце

уреди

Ако је популација од интереса приближно нормално распоређена, стандардна девијација даје информације о пропорцији запажања изнад или испод одређених вредности. На пример, просечна висина одраслих мушкараца у Сједињеним Државама је око 70 инча (177,8 cm), са стандардном девијацијом од око 3 инча (7,62 cm). То значи да већина мушкараца (око 68%, под претпоставком нормалне дистрибуције) има висину унутар 3 инча (7,62 cm) од средње вредности (67–73 инча (170,18–185,42 cm)) – једна стандардна девијација – и скоро сви мушкарци (око 95%) има висину унутар 6 инча (15,24 cm) од средње вредности (64–76 инча (162,56–193,04 cm)) – две стандардне девијације. Ако је стандардна девијација нула, онда би сви мушкарци били високи тачно 70 инча (177,8 cm). Ако би стандардна девијација била 20 инча (50,8 cm), онда би мушкарци имали много варијабилнију висину, са типичним распоном од око 50–90 инча (127–228,6 cm). Три стандардне девијације чине 99,7% популације узорка која се проучава, под претпоставком да је дистрибуција нормална или у облику звона (погледајте правило 68-95-99,7 или емпиријско правило за више информација).

Дефиниција популационих вредности

уреди

Нека је μ очекивана вредност (просек) случајне променљиве X са густином f(x):  

Стандардна девијација σ од X је дефинисана као   што се може показати једнаким са  

Користећи речи, стандардна девијација је квадратни корен варијансе од X.

Стандардна девијација дистрибуције вероватноће је иста као и случајна променљива која има ту дистрибуцију.

Немају све случајне променљиве стандардну девијацију. Ако дистрибуција има велике репове који иду до бесконачности, могуће је да стандардна девијација не постоји, јер интеграл можда неће конвергирати. Нормална дистрибуција има репове који иду у бесконачност, али њена средња вредност и стандардна девијација постоје, јер се репови довољно брзо смањују. Парето расподела са параметром   има средњу вредност, али не и стандардну девијацију (слободно говорећи, стандардна девијација је бесконачна). Кошијева расподела нема средњу вредност, ни стандардну девијацију.

Дискретна случајна променљива

уреди

У случају када X поприма случајне вредности из коначног скупа података x1, x2, …, xN, при чему свака вредност има исту вероватноћу, стандардна девијација је

 

или, користећи запис сумирања,

 

Ако, уместо да имају једнаке вероватноће, вредности имају различите вероватноће, нека x1 има вероватноћу p1, x2 има вероватноћу p2, …, xN има вероватноћу pN. У овом случају, стандардна девијација ће бити

 

Континуирана случајна променљива

уреди

Стандардна девијација континуиране случајне променљиве X реалне вредности са функцијом густине вероватноће p(x) је  

и где су интеграли дефинитивни у односу на x у распону преко скупа могућих вредности случајне променљиве X.

У случају параметарске породице дистрибуција, стандардна девијација се може изразити у смислу параметара. На пример, у случају лог-нормалне дистрибуције са параметрима μ и σ2, стандардна девијација је

 

Види још

уреди

Референце

уреди
  1. ^ Bland, J.M.; Altman, D.G. (1996). „Statistics notes: measurement error”. BMJ. 312 (7047): 1654. PMC 2351401 . PMID 8664723. doi:10.1136/bmj.312.7047.1654. 
  2. ^ Gauss, Carl Friedrich (1816). „Bestimmung der Genauigkeit der Beobachtungen”. Zeitschrift für Astronomie und Verwandte Wissenschaften. 1: 187—197. 
  3. ^ Walker, Helen (1931). Studies in the History of the Statistical Method. Baltimore, MD: Williams & Wilkins Co. стр. 24—25. 
  4. ^ Weisstein, Eric W. „Bessel's Correction”. MathWorld. 
  5. ^ „Standard Deviation Formulas”. www.mathsisfun.com. Приступљено 21. 8. 2020. 

Литература

уреди

Спољашње везе

уреди