Devijimi standard. Devijimi standard, metoda e llogaritjes, aplikimi

Kryerja e ndonjë Analiza statistikore e paimagjinueshme pa llogaritje. Në këtë artikull do të shikojmë se si të llogarisim shpërndarjen, devijimin standard, koeficientin e variacionit dhe të tjera. tregues statistikor në Excel.

Vlera maksimale dhe minimale

Devijimi mesatar linear

Devijimi mesatar linear është mesatarja e devijimeve absolute (modulo) nga grupi i të dhënave të analizuara. Formula matematikore ka formën:

a- devijimi mesatar linear,

X- tregues i analizuar,

– vlera mesatare e treguesit,

n

Në Excel quhet ky funksion SROTCL.

Pas zgjedhjes së funksionit SROTCL, ne tregojmë gamën e të dhënave mbi të cilën duhet të kryhet llogaritja. Klikoni "OK".

Dispersion

(moduli 111)

Ndoshta jo të gjithë e dinë se çfarë, kështu që unë do të shpjegoj - kjo është një masë që karakterizon përhapjen e të dhënave përreth pritje matematikore. Megjithatë, zakonisht vetëm një mostër është në dispozicion, kështu që ata përdorin formulën e mëposhtme variancat:

s 2– varianca e mostrës e llogaritur nga të dhënat e vëzhgimit,

X- vlerat individuale,

- mesatarja aritmetike për kampionin,

n- numri i vlerave në grupin e të dhënave të analizuara.

Përkatëse Funksioni ExcelDISP.G. Kur analizoni mostra relativisht të vogla (deri në rreth 30 vëzhgime), duhet të përdorni , e cila llogaritet duke përdorur formulën e mëposhtme.

Dallimi, siç mund ta shihni, është vetëm në emërues. Excel ka një funksion për llogaritjen e variancës së paanshme të mostrës DISP.B.

Zgjidhni opsionin e dëshiruar (të përgjithshëm ose selektiv), tregoni diapazonin dhe klikoni butonin "OK". Vlera që rezulton mund të jetë shumë e madhe për shkak të kuadrimit paraprak të devijimeve. Dispersioni në statistika është një tregues shumë i rëndësishëm, por zakonisht nuk përdoret në formë e pastër, dhe për llogaritjet e mëtejshme.

Devijimi standard

Devijimi standard (RMS) është rrënja e variancës. Ky tregues quhet edhe devijimi standard dhe llogaritet duke përdorur formulën:

Nga popullatë

sipas mostrës

Ju thjesht mund të merrni rrënjën e variancës, por Excel ka funksione të gatshme për devijimin standard: STDEV.G Dhe STDEV.V(për popullatën e përgjithshme dhe të mostrës, respektivisht).

Devijimi standard dhe standard, e përsëris, janë sinonime.

Tjetra, si zakonisht, tregoni gamën e dëshiruar dhe klikoni "OK". Devijimi standard ka të njëjtat njësi matëse si treguesi i analizuar, dhe për këtë arsye është i krahasueshëm me të dhënat origjinale. Më shumë për këtë më poshtë.

Koeficienti i variacionit

Të gjithë treguesit e diskutuar më sipër janë të lidhur me shkallën e të dhënave burimore dhe nuk lejojnë që dikush të marrë një ide figurative të variacionit të popullsisë së analizuar. Për të marrë një masë relative të shpërndarjes së të dhënave, përdorni koeficienti i variacionit, e cila llogaritet duke pjestuar devijimi standardmesatare. Formula për koeficientin e variacionit është e thjeshtë:

Nuk ka asnjë funksion të gatshëm për llogaritjen e koeficientit të variacionit në Excel, gjë që nuk është një problem i madh. Llogaritja mund të bëhet thjesht duke e ndarë devijimin standard me mesataren. Për ta bërë këtë, shkruani në shiritin e formulave:

STANDARDDEVIATION.G()/AVERAGE()

Gama e të dhënave tregohet në kllapa. Nëse është e nevojshme, përdorni mostrën e devijimit standard (STDEV.V).

Koeficienti i variacionit zakonisht shprehet si përqindje, kështu që ju mund të kornizoni një qelizë me një formulë në një format përqindjeje. Butoni i kërkuar ndodhet në shiritin në skedën "Home":

Ju gjithashtu mund të ndryshoni formatin duke zgjedhur nga menyja e kontekstit pasi të keni theksuar qelizën e dëshiruar dhe duke klikuar me të djathtën.

Koeficienti i variacionit, ndryshe nga treguesit e tjerë të shpërndarjes së vlerave, përdoret si një tregues i pavarur dhe shumë informues i variacionit të të dhënave. Në statistika, përgjithësisht pranohet se nëse koeficienti i variacionit është më pak se 33%, atëherë grupi i të dhënave është homogjen, nëse më shumë se 33%, atëherë ai është heterogjen. Ky informacion mund të jetë i dobishëm për karakterizimin paraprak të të dhënave dhe për identifikimin e mundësive për analiza të mëtejshme. Për më tepër, koeficienti i variacionit, i matur si përqindje, ju lejon të krahasoni shkallën e shpërndarjes së të dhënave të ndryshme, pavarësisht nga shkalla e tyre dhe njësitë e matjes. Pronë e dobishme.

Koeficienti i lëkundjes

Një tregues tjetër i shpërndarjes së të dhënave sot është koeficienti i lëkundjes. Ky është raporti i diapazonit të variacionit (diferenca midis vlerave maksimale dhe minimale) me mesataren. Nuk ka asnjë formulë të gatshme Excel, kështu që do t'ju duhet të kombinoni tre funksione: MAX, MIN, AVERAGE.

Koeficienti i lëkundjes tregon shkallën e ndryshimit në raport me mesataren, i cili gjithashtu mund të përdoret për të krahasuar grupe të ndryshme të dhënash.

Në përgjithësi, duke përdorur Excel, shumë tregues statistikorë llogariten shumë thjesht. Nëse diçka nuk është e qartë, gjithmonë mund të përdorni kutinë e kërkimit në insertin e funksionit. Epo, Google është këtu për të ndihmuar.

Vlen të përmendet se kjo llogaritje e variancës ka një pengesë - rezulton të jetë e njëanshme, d.m.th. pritshmëria e tij matematikore nuk është e barabartë me vlerën e vërtetë të variancës. Lexoni më shumë për këtë. Në të njëjtën kohë, jo gjithçka është aq e keqe. Ndërsa madhësia e kampionit rritet, ajo ende i afrohet analogut të saj teorik, d.m.th. është asimptotikisht i paanshëm. Prandaj, kur punoni me madhësi të mëdha mostrash, mund të përdorni formulën e mësipërme.

Është e dobishme të përkthehet gjuha e shenjave në gjuhën e fjalëve. Rezulton se varianca është katrori mesatar i devijimeve. Kjo do të thotë, së pari llogaritet vlera mesatare, pastaj merret diferenca midis secilës vlerë origjinale dhe mesatare, në katror, ​​shtohet dhe më pas ndahet me numrin e vlerave në popullatë. Dallimi midis një vlere individuale dhe mesatares pasqyron masën e devijimit. Ai është në katror në mënyrë që të gjitha devijimet të bëhen numra ekskluzivisht pozitivë dhe të shmanget shkatërrimi i ndërsjellë i devijimeve pozitive dhe negative gjatë përmbledhjes së tyre. Pastaj, duke pasur parasysh devijimet në katror, ​​ne thjesht llogarisim mesataren aritmetike. Devijimet mesatare - katrore. Devijimet janë në katror dhe llogaritet mesatarja. Zgjidhja qëndron në vetëm tre fjalë.

Sidoqoftë, në formën e tij të pastër, siç është mesatarja aritmetike ose indeksi, shpërndarja nuk përdoret. Është më tepër një tregues ndihmës dhe i ndërmjetëm që është i nevojshëm për llojet e tjera të analizave statistikore. Nuk ka as një njësi matëse normale. Duke gjykuar nga formula, ky është katrori i njësisë matëse të të dhënave origjinale. Pa një shishe, siç thonë ata, nuk mund ta kuptosh.

(moduli 111)

Për ta kthyer variancën në realitet, pra për ta përdorur atë për qëllime më të zakonshme, prej tij nxirret rrënja katrore. Rezulton e ashtuquajtura devijimi standard (RMS). Ka emra " devijimi standard"ose "sigma" (nga emri i shkronjës greke). Formula e devijimit standard është:

Për të marrë këtë tregues për mostrën, përdorni formulën:

Ashtu si me variancën, ekziston një opsion paksa i ndryshëm llogaritjeje. Por ndërsa mostra rritet, ndryshimi zhduket.

Devijimi standard, padyshim, karakterizon gjithashtu masën e shpërndarjes së të dhënave, por tani (ndryshe nga dispersioni) mund të krahasohet me të dhënat origjinale, pasi ato kanë të njëjtat njësi matëse (kjo është e qartë nga formula e llogaritjes). Por ky tregues në formën e tij të pastër nuk është shumë informues, pasi përmban shumë llogaritje të ndërmjetme që janë konfuze (devijimi, katrori, shuma, mesatare, rrënjë). Sidoqoftë, tashmë është e mundur të punohet drejtpërdrejt me devijimin standard, sepse vetitë e këtij treguesi janë studiuar mirë dhe të njohura. Për shembull, ekziston kjo rregulli tre sigma, i cili thotë se të dhënat kanë 997 vlera nga 1000 brenda ±3 sigma të mesatares aritmetike. Devijimi standard, si masë e pasigurisë, është gjithashtu i përfshirë në shumë llogaritje statistikore. Me ndihmën e tij, përcaktohet shkalla e saktësisë së vlerësimeve dhe parashikimeve të ndryshme. Nëse ndryshimi është shumë i madh, atëherë devijimi standard do të jetë gjithashtu i madh, prandaj parashikimi do të jetë i pasaktë, i cili do të shprehet, për shembull, në shumë të gjerë intervalet e besimit.

Koeficienti i variacionit

Devijimi standard jep një vlerësim absolut të masës së dispersionit. Prandaj, për të kuptuar se sa e madhe është shpërndarja në raport me vetë vlerat (d.m.th., pavarësisht nga shkalla e tyre), kërkohet tregues relativ. Ky tregues quhet koeficienti i variacionit dhe llogaritet duke përdorur formulën e mëposhtme:

Koeficienti i variacionit matet si përqindje (nëse shumëzohet me 100%). Bazuar në këtë tregues, mund të krahasohet më së shumti dukuri të ndryshme pavarësisht nga shkalla e tyre dhe njësitë matëse. Ky fakt dhe e bën koeficientin e variacionit kaq popullor.

Në statistikë, pranohet se nëse vlera e koeficientit të variacionit është më e vogël se 33%, atëherë popullsia konsiderohet homogjene nëse është më shumë se 33%, atëherë ajo është heterogjene. Është e vështirë për mua të komentoj diçka këtu. Nuk e di kush e përcaktoi këtë dhe pse, por konsiderohet një aksiomë.

Ndjej se jam rrëmbyer nga teoria e thatë dhe kam nevojë të sjell diçka vizuale dhe figurative. Nga ana tjetër, të gjithë treguesit e variacionit përshkruajnë afërsisht të njëjtën gjë, vetëm se ato llogariten ndryshe. Prandaj, është e vështirë të tregosh një shumëllojshmëri shembujsh. Vetëm vlerat e treguesve mund të ndryshojnë, por jo thelbi i tyre. Pra, le të krahasojmë se si ndryshojnë vlerat e treguesve të ndryshëm të variacionit për të njëjtin grup të dhënash. Le të marrim shembullin e llogaritjes së devijimit mesatar linear (nga ). Këtu janë të dhënat burimore:

Dhe një orar për t'ju kujtuar.

Duke përdorur këto të dhëna ne llogarisim tregues të ndryshëm variacionet.

Vlera mesatare është mesatarja e zakonshme aritmetike.

Gama e variacionit është diferenca midis maksimumit dhe minimumit:

Devijimi mesatar linear llogaritet duke përdorur formulën:

Devijimi standard:

Le të përmbledhim llogaritjet në një tabelë.

Siç mund të shihet, mesatarja lineare dhe devijimi standard japin vlera të ngjashme për shkallën e ndryshimit të të dhënave. Varianca është sigma në katror, ​​kështu që gjithmonë do të jetë një numër relativisht i madh, i cili, në fakt, nuk do të thotë asgjë. Gama e variacionit është ndryshimi midis vlerave ekstreme dhe mund të flasë shumë.

Le të përmbledhim disa rezultate.

Variacioni i një treguesi pasqyron ndryshueshmërinë e një procesi ose fenomeni. Shkalla e saj mund të matet duke përdorur disa tregues.

1. Gama e variacionit - diferenca midis maksimumit dhe minimumit. Pasqyron gamën e vlerave të mundshme.
2. Devijimi mesatar linear - pasqyron mesataren e devijimeve absolute (module) të të gjitha vlerave të popullsisë së analizuar nga vlera mesatare e tyre.
3. Dispersion - katrori mesatar i devijimeve.
4. Devijimi standard është rrënja e dispersionit (katrori mesatar i devijimeve).
5. Koeficienti i variacionit është treguesi më universal, që pasqyron shkallën e shpërndarjes së vlerave, pavarësisht nga shkalla e tyre dhe njësitë matëse. Koeficienti i variacionit matet si përqindje dhe mund të përdoret për të krahasuar variacionin e proceseve dhe dukurive të ndryshme.

Kështu, në analizën statistikore ekziston një sistem treguesish që pasqyrojnë homogjenitetin e dukurive dhe qëndrueshmërinë e proceseve. Shpesh treguesit e variacionit nuk kanë kuptim të pavarur dhe përdoren për analiza të mëtejshme të të dhënave (llogaritja e intervaleve të besimit

X i - variabla të rastësishme (aktuale);

vlera mesatare e variablave të rastit për kampionin llogaritet duke përdorur formulën:

Kështu që, varianca është katrori mesatar i devijimeve . Kjo është, vlera mesatare fillimisht llogaritet, pastaj merret diferenca midis secilës vlerë origjinale dhe mesatare është në katror , shtohet dhe më pas pjesëtohet me numrin e vlerave në popullatë.

Dallimi midis një vlere individuale dhe mesatares pasqyron masën e devijimit. Ai është në katror në mënyrë që të gjitha devijimet të bëhen numra ekskluzivisht pozitivë dhe të shmanget shkatërrimi i ndërsjellë i devijimeve pozitive dhe negative gjatë përmbledhjes së tyre. Pastaj, duke pasur parasysh devijimet në katror, ​​ne thjesht llogarisim mesataren aritmetike.

Përgjigja për fjalën magjike "dispersion" qëndron vetëm në këto tre fjalë: mesatare - katror - devijime.

Devijimi standard (MSD)

Duke marrë rrënjën katrore të variancës, marrim të ashtuquajturën " devijimi standard”. Ka emra "devijimi standard" ose "sigma" (nga emri i shkronjës greke σ .). Formula për devijimin standard është:

Kështu që, dispersioni është sigma në katror, ​​ose devijimi standard është në katror.

Devijimi standard, padyshim, karakterizon gjithashtu masën e shpërndarjes së të dhënave, por tani (ndryshe nga dispersioni) mund të krahasohet me të dhënat origjinale, pasi ato kanë të njëjtat njësi matëse (kjo është e qartë nga formula e llogaritjes). Gama e variacionit është ndryshimi midis vlerave ekstreme. Devijimi standard, si masë e pasigurisë, është gjithashtu i përfshirë në shumë llogaritje statistikore. Me ndihmën e tij, përcaktohet shkalla e saktësisë së vlerësimeve dhe parashikimeve të ndryshme. Nëse ndryshimi është shumë i madh, atëherë devijimi standard do të jetë gjithashtu i madh, dhe për këtë arsye parashikimi do të jetë i pasaktë, i cili do të shprehet, për shembull, në intervale shumë të gjera besimi.

Prandaj, në metodat përpunimi statistikor të dhënat në vlerësimet e pasurive të paluajtshme, në varësi të saktësisë së kërkuar të detyrës, përdoret rregulli dy ose tre sigma.

Për të krahasuar rregullin e dy sigmës dhe rregullin e tre sigmës, ne përdorim formulën e Laplace:

F - F ,

ku Ф(x) është funksioni Laplace;



Vlera minimale

β = vlera maksimale

s = vlera sigma (devijimi standard)

a = mesatare

Në këtë rast, një formë e veçantë e formulës së Laplace përdoret kur kufijtë e vlerave α dhe β ndryshore e rastësishme X janë të barabarta nga qendra e shpërndarjes a = M(X) me një sasi të caktuar d: a = a-d, b = a+d. Ose (1) Formula (1) përcakton probabilitetin e një devijimi të caktuar d të një ndryshoreje të rastësishme X me një ligj të shpërndarjes normale nga pritshmëria e saj matematikore M(X) = a. Nëse në formulën (1) marrim në mënyrë sekuenciale d = 2s dhe d = 3s, fitojmë: (2), (3).

Rregulli dy sigma

Mund të jetë pothuajse e besueshme (me një probabilitet besimi prej 0,954) që të gjitha vlerat e një ndryshoreje të rastësishme X me një ligj të shpërndarjes normale devijojnë nga pritshmëria e saj matematikore M(X) = a me një shumë jo më të madhe se 2s (dy devijime standarde ). Probabiliteti i besimit (Pd) është probabiliteti i ngjarjeve që pranohen në mënyrë konvencionale si të besueshme (probabiliteti i tyre është afër 1).

Le të ilustrojmë gjeometrikisht rregullin e dy sigmave. Në Fig. Figura 6 tregon një kurbë Gaussian me qendrën e shpërndarjes a. Zona e kufizuar nga e gjithë kurba dhe boshti Ox është 1 (100%), dhe sipërfaqja trapezoid i lakuar ndërmjet abshisave a–2s dhe a+2s, sipas rregullit dy-sigma, është e barabartë me 0,954 (95,4% e sipërfaqes totale). Sipërfaqja e zonave me hije është 1-0,954 = 0,046 (»5% e sipërfaqes totale). Këto zona quhen rajoni kritik i ndryshores së rastit. Vlerat e një ndryshoreje të rastësishme që bien në rajonin kritik nuk kanë gjasa dhe në praktikë pranohen konvencionalisht si të pamundura.

Probabiliteti i vlerave të pamundura me kusht quhet niveli i rëndësisë së një ndryshoreje të rastësishme. Niveli i rëndësisë lidhet me probabilitetin e besimit me formulën:

ku q është niveli i rëndësisë i shprehur në përqindje.

Rregulli tre sigma

Kur zgjidhen çështje që kërkojnë besueshmëri më të madhe, kur probabiliteti i besimit (Pd) merret i barabartë me 0,997 (më saktë, 0,9973), në vend të rregullit dy-sigma, sipas formulës (3), përdoret rregulli. tre sigma



Sipas rregulli tre sigmaprobabiliteti i besimit 0.9973 zona kritike do të jetë zona e vlerave të atributeve jashtë intervalit (a-3s, a+3s). Niveli i rëndësisë është 0.27%.

Me fjalë të tjera, probabiliteti që vlere absolute devijimet do të tejkalojnë trefishin e devijimit standard, shumë i vogël, përkatësisht i barabartë me 0,0027 = 1-0,9973. Kjo do të thotë se vetëm 0.27% e rasteve do të ndodhë kjo. Ngjarje të tilla, bazuar në parimin e pamundësisë së ngjarjeve të pamundura, mund të konsiderohen praktikisht të pamundura. Ato. kampionimi është shumë i saktë.

Ky është thelbi i rregullit tre sigma:

Nëse një ndryshore e rastësishme shpërndahet normalisht, atëherë vlera absolute e devijimit të saj nga pritshmëria matematikore nuk e kalon trefishin e devijimit standard (MSD).

Në praktikë, rregulli tre-sigma zbatohet si më poshtë: nëse shpërndarja e ndryshores së rastësishme që studiohet është e panjohur, por kushti i specifikuar në rregullin e mësipërm është plotësuar, atëherë ka arsye të supozohet se ndryshorja që studiohet është e shpërndarë normalisht. ; përndryshe nuk shpërndahet normalisht.

Niveli i rëndësisë merret në varësi të shkallës së lejuar të rrezikut dhe detyrës në fjalë. Për vlerësimin e pasurive të paluajtshme, zakonisht miratohet një mostër më pak e saktë, duke ndjekur rregullin dy-sigma.

Një nga mjetet kryesore të analizës statistikore është llogaritja e devijimit standard. Ky tregues ju lejon të vlerësoni devijimin standard për një mostër ose për një popullsi. Le të mësojmë se si të përdorim formulën e devijimit standard në Excel.

Le të përcaktojmë menjëherë se çfarë është devijimi standard dhe si duket formula e tij. Kjo sasi është rrënja katrore e mesatares aritmetike të katrorëve të diferencës midis të gjitha sasive në seri dhe mesatares aritmetike të tyre. Ekziston një emër identik për këtë tregues - devijimi standard. Të dy emrat janë plotësisht të barabartë.

Por, natyrisht, në Excel përdoruesi nuk duhet ta llogarisë këtë, pasi programi bën gjithçka për të. Le të mësojmë se si të llogarisim devijimin standard në Excel.

Llogaritja në Excel

Ju mund të llogarisni vlerën e specifikuar në Excel duke përdorur dy funksione të veçanta STDEV.V(bazuar në popullatën e mostrës) dhe STDEV.G(bazuar në popullatën e përgjithshme). Parimi i funksionimit të tyre është absolutisht i njëjtë, por ato mund të quhen në tre mënyra, të cilat do t'i diskutojmë më poshtë.

Metoda 1: Funksioni Wizard


Metoda 2: Tab


Metoda 3: Futja manuale e formulës

Ekziston gjithashtu një mënyrë në të cilën nuk do të keni nevojë të thërrisni fare dritaren e argumenteve. Për ta bërë këtë, duhet të futni formulën me dorë.


Siç mund ta shihni, mekanizmi për llogaritjen e devijimit standard në Excel është shumë i thjeshtë. Përdoruesi duhet vetëm të fusë numra nga popullata ose referenca për qelizat që i përmbajnë ato. Të gjitha llogaritjet kryhen nga vetë programi. Është shumë më e vështirë të kuptohet se cili është treguesi i llogaritur dhe si mund të zbatohen rezultatet e llogaritjes në praktikë. Por të kuptuarit e kësaj tashmë lidhet më shumë me fushën e statistikave sesa me të mësuarit për të punuar me softuer.

Në këtë artikull do të flas për si të gjeni devijimin standard. Ky material është jashtëzakonisht i rëndësishëm për një kuptim të plotë të matematikës, kështu që një mësues matematike duhet t'i kushtojë një mësim të veçantë ose edhe disa për studimin e tij. Në këtë artikull do të gjeni një lidhje me një video tutorial të detajuar dhe të kuptueshëm që shpjegon se çfarë është devijimi standard dhe si ta gjeni atë.

Devijimi standard bën të mundur vlerësimin e përhapjes së vlerave të marra si rezultat i matjes së një parametri të caktuar. Tregohet me simbolin (gërma greke "sigma").

Formula për llogaritjen është mjaft e thjeshtë. Për të gjetur devijimin standard, duhet të merrni rrënjën katrore të variancës. Pra, tani ju duhet të pyesni, "Çfarë është varianca?"

Çfarë është varianca

Përkufizimi i variancës shkon kështu. Dispersioni është mesatarja aritmetike e devijimeve në katror të vlerave nga mesatarja.

Për të gjetur variancën, kryeni llogaritjet e mëposhtme në mënyrë sekuenciale:

  • Përcaktoni mesataren (mesatarja e thjeshtë aritmetike e një serie vlerash).
  • Pastaj zbritni mesataren nga çdo vlerë dhe katrore diferencën që rezulton (ju merrni dallimi në katror).
  • Hapi tjetër është llogaritja e mesatares aritmetike të diferencave në katror që rezultojnë (Mund të zbuloni pse saktësisht katrorët më poshtë).

Le të shohim një shembull. Le të themi se ju dhe miqtë tuaj vendosni të matni lartësinë e qenve tuaj (në milimetra). Si rezultat i matjeve, keni marrë matjet e mëposhtme të lartësisë (në tharje): 600 mm, 470 mm, 170 mm, 430 mm dhe 300 mm.

Le të llogarisim mesataren, variancën dhe devijimin standard.

Së pari le të gjejmë vlerën mesatare. Siç e dini tashmë, për ta bërë këtë ju duhet të shtoni të gjitha vlerat e matura dhe të ndani me numrin e matjeve. Ecuria e llogaritjes:

Mesatare mm.

Pra, mesatarja (mesatarja aritmetike) është 394 mm.

Tani duhet të përcaktojmë devijimi i lartësisë së çdo qeni nga mesatarja:

Së fundi, për të llogaritur variancën, ne katrore secilin nga ndryshimet që rezultojnë, dhe më pas gjejmë mesataren aritmetike të rezultateve të marra:

Dispersion mm 2 .

Kështu, shpërndarja është 21704 mm 2.

Si të gjeni devijimin standard

Pra, si mund ta llogarisim tani devijimin standard, duke ditur variancën? Siç e kujtojmë, merrni rrënjën katrore të saj. Kjo do të thotë, devijimi standard është i barabartë me:

Mm (i rrumbullakosur në numrin e plotë më të afërt në mm).

Duke përdorur këtë metodë, ne zbuluam se disa qen (për shembull, Rottweilers) janë shumë qentë e mëdhenj. Por ka edhe qen shumë të vegjël (për shembull, dachshunds, por ju nuk duhet t'u thoni atyre këtë).

Gjëja më interesante është se devijimi standard mbart me vete informacione të dobishme. Tani mund të tregojmë se cilat nga rezultatet e marra të matjes së lartësisë janë brenda intervalit që marrim nëse vizatojmë devijimin standard nga mesatarja (në të dy anët e saj).

Kjo do të thotë, duke përdorur devijimin standard, marrim një metodë "standarde" që na lejon të zbulojmë se cila nga vlerat është normale (statistikisht mesatare), dhe cila është jashtëzakonisht e madhe ose, anasjelltas, e vogël.

Çfarë është devijimi standard

Por... çdo gjë do të jetë pak më ndryshe nëse analizojmë mostër të dhëna. Në shembullin tonë kemi konsideruar popullata e përgjithshme. Domethënë, 5 qentë tanë ishin qentë e vetëm në botë që na interesuan.

Por nëse të dhënat janë një mostër (vlerat e zgjedhura nga një popullsi e madhe), atëherë llogaritjet duhet të bëhen ndryshe.

Nëse ka vlera, atëherë:

Të gjitha llogaritjet e tjera kryhen në mënyrë të ngjashme, duke përfshirë përcaktimin e mesatares.

Për shembull, nëse pesë qentë tanë janë vetëm një mostër e popullsisë së qenve (të gjithë qentë në planet), ne duhet të ndajmë me 4, jo 5, gjegjësisht:

Varianca e mostrës = mm 2.

Në këtë rast, devijimi standard për mostrën është i barabartë me mm (i rrumbullakosur në numrin e plotë më të afërt).

Mund të themi se kemi bërë një “korrigjim” në rastin kur vlerat tona janë vetëm një mostër e vogël.

Shënim. Pse saktësisht diferencat në katror?

Por pse marrim saktësisht diferencat në katror kur llogaritim variancën? Le të themi kur matni disa parametra, keni marrë grupin e mëposhtëm të vlerave: 4; 4; -4; -4. Nëse thjesht shtojmë devijimet absolute nga mesatarja (ndryshimet) së bashku... vlerat negative do të anulohet reciprokisht me ato pozitive:

.

Rezulton se ky opsion është i padobishëm. Atëherë ndoshta ia vlen të provoni vlerat absolute të devijimeve (d.m.th., modulet e këtyre vlerave)?

Në shikim të parë, rezulton mirë (vlera që rezulton, nga rruga, quhet devijimi mesatar absolut), por jo në të gjitha rastet. Le të provojmë një shembull tjetër. Lëreni që matja të rezultojë në grupin e vlerave të mëposhtme: 7; 1; -6; -2. Atëherë devijimi mesatar absolut është:

Uau! Përsëri morëm rezultatin 4, megjithëse diferencat kanë një përhapje shumë më të madhe.

Tani le të shohim se çfarë ndodh nëse i vendosim në katror dallimet (dhe më pas marrim rrënjën katrore të shumës së tyre).

Për shembullin e parë do të jetë:

.

Për shembullin e dytë do të jetë:

Tani është një çështje krejtësisht tjetër! Sa më i madh të jetë përhapja e diferencave, aq më i madh është devijimi standard... atë që ne synonim.

Në fakt, në këtë metodë E njëjta ide përdoret si për llogaritjen e distancës midis pikave, e aplikuar vetëm në një mënyrë tjetër.

Dhe nga pikëpamja matematikore, përdorimi i katrorëve dhe rrënjë katrore siguron më shumë përfitime sesa mund të merrnim nga vlerat absolute të devijimeve, duke e bërë devijimin standard të zbatueshëm për probleme të tjera matematikore.

Sergej Valerievich ju tha se si të gjeni devijimin standard