Seritë e grupuara të variacioneve me intervale të barabarta. Studentët dhe nxënësit e shkollës - ndihmë në studim

Nëse ndryshorja e rastësishme në studim është e vazhdueshme, atëherë renditja dhe grupimi i vlerave të vëzhguara shpesh nuk lejon identifikimin e tipareve karakteristike të variacionit në vlerat e tij. Kjo shpjegohet me faktin se vlerat individuale ndryshore e rastësishme mund të ndryshojnë nga njëri-tjetri aq pak sa të dëshirohet, dhe për këtë arsye, në tërësinë e të dhënave të vëzhguara, vlerat identike të madhësisë mund të ndodhin rrallë, dhe frekuencat e varianteve ndryshojnë pak nga njëra-tjetra.

Është gjithashtu e papërshtatshme për t'u ndërtuar seri diskrete për një ndryshore të rastësishme diskrete, numri i vlerave të mundshme të së cilës është i madh. Në raste të tilla, ju duhet të ndërtoni seritë e variacionit të intervalit shpërndarjet.

Për të ndërtuar një seri të tillë, i gjithë intervali i ndryshimit të vlerave të vëzhguara të një ndryshoreje të rastësishme ndahet në një seri. intervale të pjesshme dhe duke numëruar shpeshtësinë e shfaqjes së vlerave të vlerave në çdo interval të pjesshëm.

Intervali seri variacionesh thirrni një grup të renditur intervalesh me vlera të ndryshme të një ndryshoreje të rastësishme me frekuencat përkatëse ose frekuencat relative të vlerave të ndryshores që bien në secilën prej tyre.

Për të ndërtuar një seri intervali ju nevojiten:

  1. përcaktojnë madhësia intervale të pjesshme;
  2. përcaktojnë gjerësia intervale;
  3. vendoseni për çdo interval krye Dhe kufiri i poshtëm ;
  4. gruponi rezultatet e vëzhgimit.

1 . Çështja e zgjedhjes së numrit dhe gjerësisë së intervaleve të grupimit duhet të vendoset në secilin rast specifik bazuar në qëllimet kërkime, vëllimi mostrat dhe shkalla e variacionit karakteristike në mostër.

Numri i përafërt i intervaleve k mund të vlerësohet bazuar vetëm në madhësinë e kampionit n në një nga mënyrat e mëposhtme:

  • sipas formulës Sturges : k = 1 + 3,32 log n ;
  • duke përdorur tabelën 1.

Tabela 1

2 . Në përgjithësi preferohen hapësira me gjerësi të barabartë. Për të përcaktuar gjerësinë e intervaleve h llogarit:

  • diapazoni i variacionit R - vlerat e mostrës: R = x max - x min ,

Ku xmax Dhe xmin - Opsionet maksimale dhe minimale të kampionimit;

3 . Fundi intervali i parë x h1 zgjidhet në mënyrë që opsioni minimal i mostrës xmin ra përafërsisht në mes të këtij intervali: x h1 = x min - 0,5 h .

Intervalet e ndërmjetme fitohet duke shtuar gjatësinë e intervalit të pjesshëm në fund të intervalit të mëparshëm h :

x hi = x hi-1 +h.

Ndërtimi i një shkalle intervali bazuar në llogaritjen e kufijve të intervalit vazhdon deri në vlerë x përshëndetje plotëson relacionin:

x përshëndetje< x max + 0,5·h .

4 . Në përputhje me shkallën e intervalit, vlerat karakteristike grupohen - për çdo interval të pjesshëm llogaritet shuma e frekuencave n i opsion i përfshirë në i intervali i th. Në këtë rast, intervali përfshin vlerat e ndryshores së rastësishme që janë më të mëdha ose të barabarta me kufirin e poshtëm dhe më të vogël se kufiri i sipërm i intervalit.

Shumëkëndëshi dhe histogrami

Për qartësi, ndërtohen grafikët e ndryshëm të shpërndarjes statistikore.

Bazuar në të dhënat e një serie variacionesh diskrete, ato ndërtojnë shumëkëndëshi frekuenca ose frekuenca relative.

Shumëkëndëshi i frekuencës x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Për të ndërtuar një poligon të frekuencës, opsionet vizatohen në boshtin e abshisave. x i , dhe në ordinatë - frekuencat përkatëse n i . Pikat ( x i ; n i ) lidhen me segmente të drejta dhe fitohet një poligon i frekuencës (Fig. 1).

Shumëkëndëshi i frekuencave relative quhet një vijë e thyer, segmentet e së cilës lidhin pikat ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Vk ). Për të ndërtuar një poligon të frekuencave relative, opsionet vizatohen në boshtin e abshisës x i , dhe në ordinatë - frekuencat përkatëse relative W i . Pikat ( x i ; W i ) lidhen me segmente të drejta dhe fitohet një shumëkëndësh me frekuenca relative.

Kur shenjë e vazhdueshme këshillohet të ndërtohet histogrami .

Histogrami i frekuencës quhet një figurë me shkallë të përbërë nga drejtkëndësha, bazat e të cilave janë intervale të pjesshme të gjatësisë h , dhe lartësitë janë të barabarta me raportin NIH (dendësia e frekuencës).

Për të ndërtuar një histogram të frekuencës, në boshtin e abshisave vendosen intervale të pjesshme dhe sipër tyre vizatohen segmente paralele me boshtin e abshisave në një distancë. NIH .

Grupimi- kjo është ndarja e një popullsie në grupe që janë homogjene sipas disa karakteristikave.

Qëllimi i shërbimit. Duke përdorur kalkulatorin online mund të:

  • ndërtoni një seri variacionesh, të ndërtojë një histogram dhe shumëkëndësh;
  • gjeni tregues të variacionit (mesatar, modalitet (përfshirë grafikisht), mediana, diapazoni i variacionit, kuartilët, decilat, koeficienti i diferencimit të kuartilit, koeficienti i variacionit dhe tregues të tjerë);

Udhëzimet. Për të grupuar një seri, duhet të zgjidhni llojin e serisë së variacionit të marrë (diskrete ose interval) dhe të tregoni sasinë e të dhënave (numrin e rreshtave). Zgjidhja që rezulton ruhet në një skedar Word (shih shembullin e grupimit të të dhënave statistikore).

Numri i të dhënave hyrëse
",0);">

Nëse grupimi tashmë është kryer dhe seri variacione diskrete ose seri intervali, atëherë duhet të përdorni kalkulatorin online Indekset e variacionit. Testimi i hipotezës për llojin e shpërndarjes kryhet duke përdorur shërbimin Studimi i formularit të shpërndarjes.

Llojet e grupimeve statistikore

Seritë e variacioneve . Në rastin e vëzhgimeve të një ndryshoreje të rastësishme diskrete, e njëjta vlerë mund të haset disa herë. Vlerat e tilla x i të një ndryshoreje të rastësishme regjistrohen duke treguar n i numrin e herëve që shfaqet në n vëzhgime, kjo është frekuenca e kësaj vlere.
Në rastin e një ndryshoreje të rastësishme të vazhdueshme, grupimi përdoret në praktikë.
  1. Grupimi tipologjik- kjo është ndarja e popullsisë heterogjene cilësore në studim në klasa, lloje socio-ekonomike, grupe homogjene të njësive. Për të ndërtuar këtë grupim, përdorni parametrin e serisë së variacionit diskret.
  2. Një grupim quhet strukturor, në të cilën një popullsi homogjene ndahet në grupe që karakterizojnë strukturën e saj sipas disa karakteristikave të ndryshme. Për të ndërtuar këtë grupim, përdorni parametrin e serisë Interval.
  3. Një grupim që zbulon marrëdhëniet midis dukurive që studiohen dhe karakteristikave të tyre quhet grup analitik(shih grupimin analitik të serive).

Parimet për ndërtimin e grupimeve statistikore

Një seri vëzhgimesh të renditura në rend rritës quhet seri variacionesh. Karakteristika e grupimitështë një karakteristikë me të cilën një popullsi ndahet në grupe të veçanta. Ajo quhet baza e grupit. Grupimi mund të bazohet në karakteristikat sasiore dhe cilësore.
Pas përcaktimit të bazës së grupimit, duhet vendosur çështja e numrit të grupeve në të cilat duhet të ndahet popullsia në studim.

Duke përdorur kompjuterët personalë Për të përpunuar të dhënat statistikore, grupimi i njësive të objektit kryhet duke përdorur procedura standarde.
Një procedurë e tillë bazohet në përdorimin e formulës Sturgess për të përcaktuar numrin optimal të grupeve:

k = 1+3,322*log(N)

Ku k është numri i grupeve, N është numri i njësive të popullsisë.

Gjatësia e intervaleve të pjesshme llogaritet si h=(x max -x min)/k

Më pas numërohen numrat e vëzhgimeve që bien në këto intervale, të cilat merren si frekuenca n i. Pak frekuenca, vlerat e të cilave janë më pak se 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Vlerat e mesme të intervaleve x i =(c i-1 +c i)/2 merren si vlera të reja.

Puna laboratorike nr.1. Përpunimi parësor të dhëna statistikore

Ndërtimi i serive të shpërndarjes

Shpërndarja e renditur e njësive të popullsisë në grupe sipas ndonjë karakteristike quhet afër shpërndarjes . Në këtë rast, karakteristika mund të jetë ose sasiore, atëherë seria quhet variacionale , dhe cilësore, atëherë quhet seria atributiv . Kështu, për shembull, popullsia e një qyteti mund të shpërndahet sipas grupmoshat në serinë e variacioneve, ose sipas përkatësisë profesionale në serinë e atributeve (natyrisht, shumë më tepër karakteristika cilësore dhe sasiore mund të propozohen për ndërtimin e serive të shpërndarjes; zgjedhja e karakteristikës përcaktohet nga detyra hulumtim statistikor).

Çdo seri e shpërndarjes karakterizohet nga dy elementë:

- opsion(x i) - këto janë vlera individuale të karakteristikave të njësive në popullatën e mostrës. Për serinë e variacionit, opsioni merr vlera numerike, për seritë atributive - cilësore (për shembull, x = "nëpunës civil");

- frekuenca(n i) – një numër që tregon se sa herë ndodh një vlerë e caktuar e atributit. Nëse frekuenca shprehet numri relativ(d.m.th. pjesët e elementeve të popullsisë që korrespondojnë vlerën e dhënë opsionet, në vëllimin e përgjithshëm të popullsisë), atëherë quhet frekuencë relative ose frekuenca.

Seritë e variacioneve mund të jenë:

- diskrete, kur karakteristika që studiohet karakterizohet nga një numër i caktuar (zakonisht një numër i plotë).

- intervali, kur kufijtë "nga" dhe "deri" janë përcaktuar për një karakteristikë që ndryshon vazhdimisht. Një seri intervali ndërtohet gjithashtu nëse grupi i vlerave të një karakteristike të ndryshueshme diskrete është i madh.

Një seri intervali mund të ndërtohet ose me intervale gjatësi të barabartë(seritë e intervaleve të barabarta) dhe me intervale të pabarabarta, nëse kjo diktohet nga kushtet e studimit statistikor. Për shembull, mund të merren parasysh një sërë shpërndarjesh të ardhurash me intervalet e mëposhtme:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



ku k është numri i intervaleve, n është madhësia e kampionit. (Sigurisht, formula zakonisht jep një numër thyesor, dhe numri i plotë më i afërt me numrin që rezulton zgjidhet si numri i intervaleve.) Gjatësia e intervalit në këtë rast përcaktohet nga formula

.

Grafikisht, seritë e variacioneve mund të paraqiten në formë histogramet(mbi çdo interval të serisë së intervalit ndërtohet një "kolona" e lartësisë që korrespondon me frekuencën në këtë interval), poligonin e shpërndarjes(vija e thyer që lidh pikat ( x i;n i) ose grumbullohet(ndërtuar mbi frekuencat e grumbulluara, d.m.th. për secilën vlerë të atributit, merret frekuenca e shfaqjes në një grup objektesh me një vlerë atributi më të vogël se ajo e dhënë).

Kur punoni në Excel, funksionet e mëposhtme mund të përdoren për të ndërtuar seri variacionesh:

KONTROLLO ( grupi i të dhënave) – për të përcaktuar madhësinë e kampionit. Argumenti është diapazoni i qelizave në të cilat ndodhen të dhënat e mostrës.

COUNTIF( varg; kriter) – mund të përdoret për të ndërtuar një atribut ose seri variacionale. Argumentet janë diapazoni i grupit të vlerave të mostrës së atributit dhe kriteri - vlera numerike ose tekstuale e atributit ose numri i qelizës në të cilën ndodhet. Rezultati është frekuenca e shfaqjes së asaj vlere në mostër.

FREKUENCA ( grupi i të dhënave; grup intervalesh) – për ndërtimin e një serie variacionesh. Argumentet janë diapazoni i grupit të të dhënave të mostrës dhe kolona e intervalit. Nëse keni nevojë të ndërtoni një seri diskrete, atëherë vlerat e opsioneve tregohen këtu nëse është një seri intervali, atëherë kufijtë e sipërm të intervaleve (ato quhen gjithashtu "xhepa"). Meqenëse rezultati është një kolonë frekuencash, duhet të plotësoni hyrjen e funksionit duke shtypur CTRL+SHIFT+ENTER. Vini re se kur specifikoni një grup intervalesh kur futni një funksion, nuk është e nevojshme të specifikoni vlerën e fundit në të - të gjitha vlerat që nuk janë përfshirë në "xhepat" e mëparshëm do të vendosen në "xhepin" përkatës. Kjo ndonjëherë mund të ndihmojë në shmangien e gabimit të mos vendosjes automatike të vlerës së mostrës më të madhe në xhepin e fundit.

Për më tepër, për grupime komplekse (bazuar në disa karakteristika), përdorni mjetin "tabelat kryesore". Ato mund të përdoren gjithashtu për të ndërtuar seri atributesh dhe variacionesh, por kjo e ndërlikon në mënyrë të panevojshme detyrën. Gjithashtu, për të ndërtuar një seri variacionesh dhe një histogram, ekziston një procedurë "histogram" nga shtesa "Analysis Package" (për të përdorur shtesat në Excel, fillimisht duhet t'i shkarkoni; ato nuk janë instaluar si parazgjedhje)

Le të ilustrojmë procesin e përpunimit të të dhënave parësore me shembujt e mëposhtëm.

Shembulli 1.1. Ka të dhëna për përbërjen sasiore të 60 familjeve.

Ndërtoni një seri variacionesh dhe poligonin e shpërndarjes

Zgjidhje.

Le të hapim tabelat në Excel. Le të fusim grupin e të dhënave në intervalin A1:L5. Nëse jeni duke studiuar një dokument në formë elektronike (në formatin Word, për shembull), për ta bërë këtë, thjesht zgjidhni tabelën me të dhënat dhe kopjoni atë në clipboard, pastaj zgjidhni qelizën A1 dhe ngjitni të dhënat - ato automatikisht do të zënë diapazoni i duhur. Le të llogarisim vëllimin e mostrës n - numrin e të dhënave të mostrës për ta bërë këtë, futni formulën =COUNT(A1:L5) në qelizën B7. Vini re se për të futur gamën e dëshiruar në formulë, nuk është e nevojshme të vendosni përcaktimin e tij nga tastiera; Le të përcaktojmë vlerat minimale dhe maksimale në mostër duke futur formulën =MIN(A1:L5) në qelizën B8 dhe në qelizën B9: =MAX(A1:L5).

Fig.1.1 Shembull 1. Përpunimi primar i të dhënave statistikore në tabelat Excel

Më pas, ne do të përgatisim një tabelë për ndërtimin e një serie variacionesh duke futur emra për kolonën e intervalit (vlerat e variantit) dhe kolonën e frekuencës. Në kolonën e intervalit, vendosni vlerat karakteristike nga minimumi (1) në maksimum (6), duke zënë diapazonin B12:B17. Zgjidhni kolonën e frekuencës, shkruani formulën =FREQUENCY(A1:L5,B12:B17) dhe shtypni kombinimin e tastit CTRL+SHIFT+ENTER

Fig. 1.2 Shembull 1. Ndërtimi i një serie variacionesh

Për të kontrolluar, le të llogarisim shumën e frekuencave duke përdorur funksionin SUM (ikona e funksionit S në grupin "Redaktimi" në skedën "Home"), shuma e llogaritur duhet të përkojë me vëllimin e llogaritur më parë të mostrës në qelizën B7.

Tani le të ndërtojmë një poligon: pasi të keni zgjedhur gamën e frekuencës që rezulton, zgjidhni komandën "Graph" në skedën "Fut". Si parazgjedhje, vlerat në boshtin horizontal do të jenë numra rendorë - në rastin tonë nga 1 në 6, që përkon me vlerat e opsioneve (numrat e kategorive tarifore).

Emri i serisë së grafikëve "seri 1" ose mund të ndryshohet duke përdorur të njëjtin opsion "përzgjedh të dhënat" të skedës "Dizajn", ose thjesht të fshihet.

Fig.1.3. Shembull 1. Ndërtimi i një shumëkëndëshi të frekuencës

Shembulli 1.2. Ekzistojnë të dhëna për emetimet e ndotësve nga 50 burime:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Hartoni një seri me interval të barabartë, ndërtoni një histogram

Zgjidhje

Le të fusim grupin e të dhënave në një fletë Excel, ai do të zërë diapazonin A1:J5 Ashtu si në detyrën e mëparshme, ne do të përcaktojmë madhësinë e mostrës n, vlerat minimale dhe maksimale në mostër. Meqenëse tani nuk kemi nevojë për një seri diskrete, por për një seri intervali, dhe numri i intervaleve në problem nuk është specifikuar, ne llogarisim numrin e intervaleve k duke përdorur formulën Sturgess. Për ta bërë këtë, futni formulën =1+3.322*LOG10(B7) në qelizën B10.

Fig.1.4. Shembulli 2. Ndërtimi i një serie me interval të barabartë

Vlera që rezulton nuk është një numër i plotë, është afërsisht 6.64. Meqenëse me k=7 gjatësia e intervaleve do të shprehet si numër i plotë (ndryshe nga rasti i k=6), zgjedhim k=7 duke e futur këtë vlerë në qelizën C10. Ne llogarisim gjatësinë e intervalit d në qelizën B11 duke futur formulën =(B9-B8)/C10.

Le të përcaktojmë një grup intervalesh, duke treguar kufirin e sipërm për secilin nga 7 intervalet. Për ta bërë këtë, në qelizën E8 llogarisim kufirin e sipërm të intervalit të parë duke futur formulën =B8+B11; në qelizën E9 kufiri i sipërm i intervalit të dytë duke futur formulën =E8+B11. Për të llogaritur vlerat e mbetura të kufijve të sipërm të intervaleve, ne rregullojmë numrin e qelizës B11 në formulën e futur duke përdorur shenjën $, në mënyrë që formula në qelizën E9 të marrë formën =E8+B$11 dhe kopjoni përmbajtja e qelizës E9 në qelizat E10-E14. Vlera e fundit e marrë është e barabartë me vlerën maksimale në kampionin e llogaritur më parë në qelizën B9.

Fig.1.5. Shembulli 2. Ndërtimi i një serie me interval të barabartë


Tani le të mbushim grupin e "xhepave" duke përdorur funksionin FREQUENCY, siç u bë në shembullin 1.

Fig.1.6. Shembulli 2. Ndërtimi i një serie me interval të barabartë

Duke përdorur serinë e variacionit që rezulton, ne do të ndërtojmë një histogram: zgjidhni kolonën e frekuencës dhe zgjidhni "Histogram" në skedën "Fut". Pasi të kemi marrë histogramin, le të ndryshojmë etiketat e boshtit horizontal në të në vlerat në intervalin e intervalit për ta bërë këtë, zgjidhni opsionin "Zgjidhni të dhënat" në skedën "Dizajner". Në dritaren që shfaqet, zgjidhni komandën "Ndrysho" për seksionin "Etiketat e boshtit horizontal" dhe futni gamën e vlerave për opsionet, duke e zgjedhur atë me miun.

Fig.1.7. Shembulli 2. Ndërtimi i një histogrami

Fig.1.8. Shembulli 2. Ndërtimi i një histogrami

Mënyra më e thjeshtë për të përmbledhur materialin statistikor është ndërtimi i serive. Rezultati përmbledhës i një studimi statistikor mund të jetë seri e shpërndarjes. Një seri shpërndarjeje në statistika është një shpërndarje e renditur e njësive të popullsisë në grupe sipas çdo karakteristike: cilësore ose sasiore. Nëse një seri ndërtohet në bazë cilësore, atëherë ajo quhet atributive, dhe nëse në bazë sasiore, atëherë quhet variacionale.

Një seri variacionesh karakterizohet nga dy elementë: varianti (X) dhe frekuenca (f). Një variant është një vlerë e veçantë e një karakteristike të një njësie individuale ose grupi të një popullsie. Një numër që tregon se sa herë ndodh një vlerë e caktuar e atributit quhet frekuencë. Nëse frekuenca shprehet si një numër relativ, atëherë quhet frekuencë. Një seri variacionesh mund të jetë intervalale, kur përcaktohen kufijtë "nga" dhe "deri", ose mund të jetë diskrete, kur karakteristika që studiohet karakterizohet nga një numër i caktuar.

Le të shohim ndërtimin e serive të variacioneve duke përdorur shembuj.

Shembull. dhe ka të dhëna për kategoritë tarifore të 60 punëtorëve në një nga punishtet e uzinës.

Shpërndani punëtorët sipas kategorisë së tarifave, ndërtoni një seri variacionesh.

Për ta bërë këtë, ne shkruajmë të gjitha vlerat e karakteristikës në rend rritës dhe numërojmë numrin e punëtorëve në secilin grup.

Tabela 1.4

Shpërndarja e punëtorëve sipas kategorive

Grada e punëtorëve (X)

Numri i punëtorëve

personi (f)

në % të totalit (veçanërisht)

Ne morëm një seri diskrete variacionale në të cilën karakteristika që studiohet (grada e punëtorit) përfaqësohet nga një numër i caktuar. Për qartësi, seritë e variacioneve përshkruhen në mënyrë grafike. Bazuar në këtë seri të shpërndarjes, u ndërtua një sipërfaqe shpërndarëse.

Oriz. 1.1. Poligoni për shpërndarjen e punëtorëve sipas kategorive tarifore

Ne do të shqyrtojmë ndërtimin e një serie intervali me intervale të barabarta duke përdorur shembullin e mëposhtëm.

Shembull. Dihen të dhëna për vlerën e kapitalit fiks të 50 kompanive në milion rubla. Kërkohet të tregohet shpërndarja e firmave sipas kostos së kapitalit fiks.

Për të treguar shpërndarjen e firmave sipas kostos së kapitalit fiks, fillimisht zgjidhim çështjen e numrit të grupeve që duam të theksojmë. Supozoni se kemi vendosur të identifikojmë 5 grupe ndërmarrjesh. Pastaj përcaktojmë madhësinë e intervalit në grup. Për ta bërë këtë, ne përdorim formulën

Sipas shembullit tonë.

Duke shtuar vlerën e intervalit në vlerën minimale të atributit, marrim grupe firmash sipas kostos së kapitalit fiks.

Një njësi me vlerë të dyfishtë i përket grupit ku vepron si kufi i sipërm (d.m.th., vlera e atributit 17 do të shkojë në grupin e parë, 24 në të dytin, etj.).

Le të numërojmë numrin e fabrikave në secilin grup.

Tabela 1.5

Shpërndarja e firmave sipas vlerës së kapitalit fiks (milion rubla)

Kostoja e kapitalit fiks
në milion rubla (X)

Numri i firmave
(frekuenca) (f)

Frekuencat e grumbulluara
(kumulative)

Sipas kësaj shpërndarjeje, u përftua një seri intervali variacion, nga e cila rezulton se 36 firma kanë kapital fiks me vlerë nga 10 në 24 milion rubla. etj.

Seritë e shpërndarjes së intervalit mund të paraqiten grafikisht në formën e një histogrami.

Rezultatet e përpunimit të të dhënave janë paraqitur në tabelat statistikore. Tabelat statistikore përmbajnë temën dhe kallëzuesin e tyre.

Subjekti është tërësia ose pjesë e tërësisë që karakterizohet.

Kallëzuesit janë tregues që karakterizojnë temën.

Dallohen tabelat: të thjeshta dhe grupore, të kombinuara, me zhvillim të thjeshtë dhe kompleks të kallëzuesit.

Një tabelë e thjeshtë në subjekt përmban një listë të njësive individuale.

Nëse lënda përmban një grupim njësish, atëherë një tabelë e tillë quhet tabelë grupore. Për shembull, një grup ndërmarrjesh sipas numrit të punëtorëve, grupet e popullsisë sipas gjinisë.

Lënda e tabelës së kombinimit përmban grupimin sipas dy ose më shumë karakteristikave. Për shembull, popullsia ndahet sipas gjinisë në grupe sipas arsimit, moshës, etj.

Tabelat e kombinimit përmbajnë informacione që ju lejojnë të identifikoni dhe karakterizoni marrëdhënien e një numri treguesish dhe modelin e ndryshimeve të tyre si në hapësirë ​​ashtu edhe në kohë. Për ta bërë të qartë tabelën kur zhvilloni temën e saj, kufizoni veten në dy ose tre karakteristika, duke formuar një numër të kufizuar grupesh për secilën prej tyre.

Kallëzuesi në tabela mund të zhvillohet në mënyra të ndryshme. Me një zhvillim të thjeshtë të kallëzuesit, të gjithë treguesit e tij janë të vendosur në mënyrë të pavarur nga njëri-tjetri.

Me zhvillimin kompleks të kallëzuesit, treguesit kombinohen me njëri-tjetrin.

Kur ndërtohet ndonjë tabelë, duhet të vazhdohet nga qëllimet e studimit dhe nga përmbajtja e materialit të përpunuar.

Përveç tabelave, statistikat përdorin edhe grafikët dhe diagramet. Diagrami - të dhënat statistikore përshkruhen duke përdorur forma gjeometrike. Grafikët ndahen në grafikët linearë dhe me shtylla, por mund të ketë grafikët e figuruar (vizatimet dhe simbolet), grafikët me byrek (një rreth merret si madhësia e të gjithë popullsisë dhe zonat e sektorëve individualë shfaqin peshën specifike ose përqindjen e tij. komponentët), diagramet radiale (të ndërtuara në bazë të ordinatave polare). Një kartogram është një kombinim i një harte skicë ose planit të vendndodhjes me një diagram.

Faza më e rëndësishme në studimin e fenomeneve dhe proceseve socio-ekonomike është sistemimi i të dhënave parësore dhe, mbi këtë bazë, marrja e një karakteristike përmbledhëse të të gjithë objektit duke përdorur tregues të përgjithshëm, e cila arrihet duke përmbledhur dhe grupuar materialin statistikor parësor.

Përmbledhje statistikore - ky është një kompleks operacionesh vijuese për të përgjithësuar fakte specifike individuale që formojnë një grup për të identifikuar tiparet dhe modelet tipike të qenësishme në fenomenin që studiohet në tërësi. Kryerja e një përmbledhjeje statistikore përfshin hapat e mëposhtëm :

  • përzgjedhja e karakteristikave të grupimit;
  • përcaktimi i radhës së formimit të grupit;
  • zhvillimi i një sistemi treguesish statistikorë për të karakterizuar grupet dhe objektin në tërësi;
  • zhvillimi i paraqitjeve të tabelave statistikore për të paraqitur rezultatet përmbledhëse.

Grupimi statistikor quhet ndarja e njësive të popullsisë në studim në grupe homogjene sipas disa karakteristikave thelbësore për to. Grupimet janë metoda më e rëndësishme statistikore për përmbledhjen e të dhënave statistikore, baza për llogaritjen e saktë të treguesve statistikorë.

Dallohen këto lloje të grupimeve: tipologjike, strukturore, analitike. Të gjitha këto grupime i bashkon fakti se njësitë e objektit ndahen në grupe sipas disa karakteristikave.

Karakteristika e grupimit është një karakteristikë me të cilën njësitë e një popullsie ndahen në grupe të veçanta. Përfundimet e një studimi statistikor varen nga zgjedhja e saktë e një karakteristike grupimi. Si bazë për grupim, është e nevojshme të përdoren karakteristika të rëndësishme, të bazuara teorikisht (sasiore ose cilësore).

Karakteristikat sasiore të grupimit kanë një shprehje numerike (vëllimi i tregtimit, mosha e personit, të ardhurat e familjes, etj.), dhe shenjat cilësore të grupimit pasqyrojnë gjendjen e njësisë së popullsisë (gjininë, statusin martesor, industrinë e ndërmarrjes, formën e saj të pronësisë, etj.).

Pasi të jetë përcaktuar baza e grupimit, duhet vendosur çështja e numrit të grupeve në të cilat duhet të ndahet popullsia në studim. Numri i grupeve varet nga objektivat e studimit dhe lloji i treguesit që qëndron në bazë të grupimit, vëllimi i popullsisë dhe shkalla e variacionit të karakteristikës.

Për shembull, grupimi i ndërmarrjeve sipas llojit të pronësisë merr parasysh pronën e subjektit komunal, federal dhe federal. Nëse grupimi kryhet sipas një kriteri sasior, atëherë është e nevojshme t'i kushtohet vëmendje e veçantë numrit të njësive të objektit në studim dhe shkallës së luhatjes së karakteristikës së grupimit.

Pasi të jetë përcaktuar numri i grupeve, duhet të përcaktohen intervalet e grupimit. Intervali - këto janë vlerat e një karakteristike të ndryshme që shtrihen brenda kufijve të caktuar. Çdo interval ka vlerën e vet, kufijtë e sipërm dhe të poshtëm, ose të paktën një prej tyre.

Kufiri i poshtëm i intervalit quhet vlera më e vogël e karakteristikës në interval, dhe kufiri i sipërm - vlera më e lartë e karakteristikës në interval. Vlera e intervalit është diferenca midis kufijve të sipërm dhe të poshtëm.

Intervalet e grupimit, në varësi të madhësisë së tyre, janë: të barabarta dhe të pabarabarta. Nëse ndryshimi i një karakteristike manifestohet brenda kufijve relativisht të ngushtë dhe shpërndarja është uniforme, atëherë një grup ndërtohet në intervale të barabarta. Vlera e intervalit të barabartë përcaktohet me formulën e mëposhtme :

ku Xmax, Xmin janë vlerat maksimale dhe minimale të karakteristikës në agregat; n - numri i grupeve.

Grupimi më i thjeshtë në të cilin secili grup i përzgjedhur karakterizohet nga një tregues përfaqëson një seri shpërndarjeje.

Seritë e shpërndarjes statistikore - kjo është një shpërndarje e renditur e njësive të popullsisë në grupe sipas një karakteristike të caktuar. Në varësi të karakteristikës që qëndron në themel të formimit të serive të shpërndarjes, dallohen seritë e shpërndarjes atributive dhe variacionale.

atributiv quhen seri shpërndarjeje të ndërtuara sipas karakteristikave cilësore, pra karakteristika që nuk kanë shprehje numerike (shpërndarja sipas llojit të punës, sipas gjinisë, profesionit etj.). Seritë e shpërndarjes atributive karakterizojnë përbërjen e popullsisë sipas disa karakteristikave thelbësore. Të marra në disa periudha, këto të dhëna bëjnë të mundur studimin e ndryshimeve në strukturë.

Seritë variacionale quhen seri të shpërndarjes të ndërtuara në bazë sasiore. Çdo seri variacionesh përbëhet nga dy elementë: opsionet dhe frekuencat. Opsione quhen vlerat individuale të karakteristikës që merr në serinë e variacionit, domethënë vlera specifike e karakteristikës së ndryshueshme.

Frekuencat quhen numrat e varianteve individuale ose secili grup i një serie variacionesh, domethënë, këta janë numra që tregojnë se sa shpesh ndodhin variante të caktuara në serinë e shpërndarjes. Shuma e të gjitha frekuencave përcakton madhësinë e të gjithë popullsisë, vëllimin e saj. Frekuencat quhen frekuenca të shprehura në fraksione të njësisë ose në përqindje të totalit. Prandaj, shuma e frekuencave është e barabartë me 1 ose 100%.

Në varësi të natyrës së variacionit të një karakteristike, dallohen tre forma të serive të variacionit: seritë e renditura, seritë diskrete dhe seritë intervale.

Seritë e variacioneve të renditura - kjo është shpërndarja e njësive individuale të popullsisë në rend rritës ose zbritës të karakteristikës që studiohet. Renditja ju lejon të ndani lehtësisht të dhënat sasiore në grupe, të zbuloni menjëherë vlerat më të vogla dhe më të mëdha të një karakteristike dhe të nënvizoni vlerat që përsëriten më shpesh.

Seritë e variacioneve diskrete karakterizon shpërndarjen e njësive të popullsisë sipas një karakteristike diskrete që merr vetëm vlera të plota. Për shembull, kategoria tarifore, numri i fëmijëve në familje, numri i punonjësve në ndërmarrje, etj.

Nëse një karakteristikë ka një ndryshim të vazhdueshëm, i cili brenda kufijve të caktuar mund të marrë çdo vlerë ("nga - në"), atëherë për këtë karakteristikë është e nevojshme të ndërtohet seritë e variacionit të intervalit . Për shembull, shuma e të ardhurave, kohëzgjatja e shërbimit, kostoja e aseteve fikse të ndërmarrjes, etj.

Shembuj të zgjidhjes së problemeve me temën "Përmbledhje statistikore dhe grupimi"

Problemi 1 . Ka informacion për numrin e librave që studentët kanë marrë përmes abonimeve gjatë vitit të kaluar akademik.

Ndërtoni seritë e shpërndarjes së variacioneve të renditura dhe diskrete, duke përcaktuar elementët e serisë.

Zgjidhje

Ky grup paraqet shumë opsione për numrin e librave që marrin studentët. Le të numërojmë numrin e opsioneve të tilla dhe t'i rregullojmë ato në formën e serive të shpërndarjes diskrete të renditura variacionale dhe variacionale.

Problemi 2 . Ka të dhëna për koston e aseteve fikse për 50 ndërmarrje, mijë rubla.

Ndërtoni një seri shpërndarjeje, duke theksuar 5 grupe ndërmarrjesh (në intervale të barabarta).

Zgjidhje

Për të zgjidhur, ne do të zgjedhim vlerat më të mëdha dhe më të vogla të vlerës së aktiveve fikse të ndërmarrjeve. Këto janë 30.0 dhe 10.2 mijë rubla.

Le të gjejmë madhësinë e intervalit: h = (30.0-10.2):5= 3.96 mijë rubla.

Pastaj grupi i parë do të përfshijë ndërmarrje, asetet fikse të të cilave arrijnë nga 10.2 mijë rubla. deri në 10.2+3.96=14.16 mijë rubla. Do të ketë 9 ndërmarrje të tilla Grupi i dytë do të përfshijë ndërmarrjet, asetet fikse të të cilave arrijnë nga 14.16 mijë rubla. deri në 14.16+3.96=18.12 mijë rubla. Do të jenë 16 ndërmarrje të tilla. Po kështu do të gjejmë numrin e ndërmarrjeve të përfshira në grupin e tretë, të katërt dhe të pestë.

Ne vendosim serinë e shpërndarjes që rezulton në tabelë.

Problemi 3 . Të dhënat e mëposhtme janë marrë për një numër ndërmarrjesh të industrisë së lehtë:

Grupimi i ndërmarrjeve sipas numrit të punëtorëve, duke formuar 6 grupe në intervale të barabarta. Llogaritni për secilin grup:

1. numri i ndërmarrjeve
2. numri i punëtorëve
3. vëllimi i produkteve të prodhuara në vit
4. prodhimi mesatar aktual për punëtor
5. vëllimi i mjeteve fikse
6. madhësia mesatare e aseteve fikse të një ndërmarrje
7. vlera mesatare e produkteve të prodhuara nga një ndërmarrje

Paraqisni rezultatet e llogaritjes në tabela. Nxirrni përfundime.

Zgjidhje

Për të zgjidhur, ne do të zgjedhim vlerat më të mëdha dhe më të vogla të numrit mesatar të punëtorëve në ndërmarrje. Këto janë 43 dhe 256.

Le të gjejmë madhësinë e intervalit: h = (256-43):6 = 35,5

Pastaj grupi i parë do të përfshijë ndërmarrjet, numri mesatar i punëtorëve të të cilave është nga 43 në 43 + 35.5 = 78.5 persona. Në grupin e dytë do të jenë 5 ndërmarrje të tilla, numri mesatar i punëtorëve të të cilave do të jetë nga 78,5 në 78,5+35,5=114 persona. Do të jenë 12 ndërmarrje të tilla. Po kështu do të gjejmë numrin e ndërmarrjeve të përfshira në grupin e tretë, të katërt, të pestë dhe të gjashtë.

Ne vendosim seritë e shpërndarjes që rezulton në një tabelë dhe llogarisim treguesit e nevojshëm për secilin grup:

konkluzioni : Siç shihet nga tabela, grupi i dytë i ndërmarrjeve është më i shumti. Ai përfshin 12 ndërmarrje. Grupet më të vogla janë grupi i pestë dhe i gjashtë (dy ndërmarrje secila). Këto janë ndërmarrjet më të mëdha (për nga numri i punëtorëve).

Meqenëse grupi i dytë është më i madhi, vëllimi i produkteve të prodhuara në vit nga ndërmarrjet e këtij grupi dhe vëllimi i aktiveve fikse janë dukshëm më të larta se të tjerët. Në të njëjtën kohë, prodhimi mesatar aktual për punëtor në ndërmarrjet e këtij grupi nuk është më i madhi. Këtu kryesojnë ndërmarrjet e grupit të katërt. Ky grup gjithashtu përbën një vëllim mjaft të madh të aktiveve fikse.

Si përfundim, vërejmë se madhësia mesatare e aseteve fikse dhe sasia mesatare e prodhimit të prodhuar nga një ndërmarrje janë drejtpërdrejt proporcionale me madhësinë e ndërmarrjes (për sa i përket numrit të punëtorëve).