Статистичні ряди розподілу, їх значення та застосування у статистиці. Поняття та види статистичних рядів

Зареєстровані в результаті спостереження індивідуальні значення варіюючої ознаки, що вивчається, утворюють так званий первинний ряд.

Першим кроком упорядкування первинного ряду є його ранжування. Маючи значення ознаки первинного ряду, наприклад, у зростаючому порядку, отримують ранжований ряд.

Розглянемо первинний ряд, отриманий під час реєстрації рівня кваліфікації робочих

Ранжований ряд матиме вигляд:

Розглядаючи цей ранжований ряд, бачимо, деякі значення ознаки повторюються в різних робочих (одиниць сукупності).

Оформимо результати спостережень компактніше, поставивши у відповідність кожному значенню ознаки підрахунок чисельності одиниць сукупності, мають однакові значення ознак. Для нашого прикладу маємо:

Отримаємо ранжований (упорядкований) ряд, що характеризує розподілдосліджуваного ознаки за одиницями сукупності. У статистиці такі ряди прийнято називати рядами розподілу.

При досить великому числі одиниць сукупності навіть для несплошного спостереження, наведене вище впорядкування даних спостереження може бути громіздким. Тому таке ранжування, як правило, супроводжується угрупуванням і зведенням. Досліджувана ознака в цьому випадку є групувальною.

Звідси загальне визначення:

Статистичні ряди розподілу – це впорядковане розташування одиниць сукупності, що вивчається, на групи за групувальною ознакою.

Будь-який статистичний ряд розподілу складається із двох елементів:

А) із упорядкованих значень ознаки чи варіантів;

Б) кількості одиниць сукупності, що мають дані значення, які називаються частотами. Частоти, виражені у частках одиниці або у відсотках до підсумку, називаються частостями.

Т.о., варіанта– це окреме значення (або варіант окремої групи) ознаки, що варіюється, які він приймає в ряду розподілу. Говорячи про частоти треба пам'ятати, що сума частот становить обсяг досліджуваної сукупності (чи, інакше, обсяг низки розподілу).

Літерою “X” прийнято позначати варіантом ознаки, а літерою f – частоту.

За своїм змістомознаки можуть бути атрибутивними чи кількісними.

Ряди розподілу побудовані за атрибутивною (або якісною) ознакою називаються атрибутивними рядами розподілу.

Наприклад, розподіл студентів за формою навчання, факультетами, спеціальностями тощо.

Ряди розподілу, побудовані за кількісною ознакою, називаються варіаційними рядами.

Наприклад, розподіл працівників за стажем роботи, за рівнем заробітної плати, За продуктивністю праці і т.д.

Досліджувані в статистиці ознаки змінюються.

За характером зміни (варіацій) значеньознаки розрізняють:

А) ознаки із перервною зміною;

Б) ознаки з безперервною зміною.

Ознаки з перервною зміноюможуть приймати лише кінцеве число певних значень (наприклад, тарифний розряд працівників, кількість верстатів тощо).

Ознаки з безперервною зміноюможуть приймати у певних межах будь-які значення (наприклад, стаж роботи, розмір зарплати, пробіг автотранспорту тощо)

За способом побудови розрізняютьдискретні (перервні) варіаційні ряди, засновані на перервній варіації ознаки, і інтервальними (безперервними), що базуються на значенні ознаки, що безперервно змінюється.

При побудові дискретного варіаційного рядуу першій графі (рядку) вказуються конкретні значення кожного індивідуального значення ознаки (тобто кожної варіанти), а в другій графі (рядку) – частоти чи частоти.

Наприклад, ряд, що характеризує розподіл працівників за тарифними розрядами.

При побудові інтервального варіаційного рядуокремі значення варіант зазначаються у значеннях "від - до".

Інтервали можна брати як рівні, і нерівні. Для кожного з них вказуються частоти та частоти, (тобто абсолютне або відносне числаодиниць сукупності, у яких значення варіанти знаходиться усередині даного інтервалу).

Перший і останній інтервали низки у часто беруться незакритими, тобто. для першого інтервалу вказується лише верхня межа (“до… ”) а, для останнього лише нижня (“від… і від”, “понад…”). Використання незакритих інтервалів зручно, коли в сукупності зустрічається незначна кількість одиниць, з дуже малими або дуже великими значеннямиознаки, різко відмінними від решти значень.

При побудові інтервальних варіаційних рядів виникає питання кількості груп, куди слід розділити матеріал статистичного спостереження і питання величині інтервалу кожної окремої групи.

Ці питання вже вивчалися під час розгляду методу угруповання (див. тему 3). Також були розглянуті питання, важливі для складання інтервального ряду, такі як:

1) Визначення початку відліків інтервалів;

2) Підрахунок частоти.

Слід пам'ятати, що інтервальні варіаційні ряди можна побудувати й у ознак з дискретної варіацією. Нерідко в статистичному дослідженнівказувати окреме значення дискретного ознаки недоцільно, т.к. це, як правило, ускладнює розгляд варіації ознаки. Тому можливі дискретні значення ознаки розподіляються за групами і підраховуються відповідні частоти (частини).

При побудові інтервального ряду за дискретною ознакою межі суміжних інтервалів не повторюють один одного: наступний інтервал починається з наступного по порядку (після верхнього значення попереднього інтервалу) дискретного значення ознаки.

Для розрахунку узагальнених характеристик рядів розподілу можна скористатися як частотами, і частотами.

Частини як частки одиниці: w1=f1/∑f, w2=f2/∑f тощо.

Частини як відсотки w1=(f1/∑f)*100, w2=(f2/∑f)*100 тощо.


Подібна інформація.


Результати зведення та угруповання, матеріали статистичного спостереження оформляють у вигляді рядів розподілу та статистичних таблиць.

Статистичні ряди розподілу – це впорядковане розташування одиниць сукупності, що вивчається, на групи за групувальною ознакою. Вони характеризують склад, дозволяють судити про однорідність сукупності, межі її зміни, закономірності розвитку об'єкта, що спостерігається.

Залежно від ознаки, покладеної в основу ряду розподілу, розрізняють атрибутивні та варіаційні ряди.

Варіантами називаються окремі значення ознаки, що він приймає у варіаційному ряду, тобто. конкретне значення ознаки, що варіює.

Частотами – називають чисельність окремих варіантів чи кожної групи варіаційного низки, тобто. це число, яке показує, як часто зустрічаються ті чи інші варіанти у розподілі.

Сума всіх частот визначає чисельність усієї сукупності або її обсяг. Варіаційні ряди складаються з двох елементів: варіантів та частот. Частоти виражені у частках одиниць чи у відсотках до результату (називаються частостями). Відповідно сума частостей дорівнює 1 чи 100%.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні ряди.

Дискретні ряди характеризують розподіл одиниць сукупності за дискретною ознакою, що приймає лише фіксоване значення, найчастіше ціле.

Інтервальні варіаційні ряди – це ряди, у яких значення варіанта дано у вигляді інтервалів.

Графічно дискретні ряди представляються як полігону розподілу. Інтервальні ряди – як гістограми розподілу.

Статистичні таблиці

Результати зведення та угруповання матеріалів спостереження, як правило, подаються у вигляді статистичних таблиць. Це найбільш раціональна форма уявлення результатів зведення. Значення статистичних таблиць у тому, що вони дозволяють охопити матеріали статистичної зведення загалом.

за зовнішньому виглядустатистичні таблиці є рядом вертикальних і горизонтальних ліній, що перетинаються. По вертикалі – рядки, по горизонталі – стовпці.

Складену, але не заповнену таблицю називають макет таблиці. Статистична таблиця і двох елементів: підлягає і присудка. Підлягає – об'єкт вивчення – одиниці сукупності, що характеризуються числовими показниками. Сказуемое – перелік числових показників, якими характеризується об'єкт вивчення, тобто. підлягає таблиці.

Найменування одиниць чи груп, утворюють підлягає, дається у лівій частині таблиці в заголовках рядків, а найменування показників, що вони характеризують, тобто. присудок, у верхній частині таблиці в заголовках граф.

Залежно від побудови підлягає статистичній таблиці поділяється на три види:

1. Прості

2. Групові

3. Комбінаційні

1) Прості – у підлягає яких немає угруповань. За характером представленого матеріалу прості таблицібувають:

· Перелікові;

· Територіальні;

· Хронологічні.

2) Групові – у яких об'єкт, що вивчається, розділений у підлягає на групи за тією чи іншою ознакою.

3) Комбінаційні - таблиці, в підлягає яких дана угруповання одиниць сукупності за двома або більше ознаками, взятими в комбінації.

Коли в присудку кілька показників, розробка присудка може бути простою і складною. Проста розробка присудка передбачає паралельне розташування показників, а складне комбіноване.

Статистичні графіки

Отриманий у результаті розробки статистичний матеріал, розташований у таблицях, часто потребує наочного зображення за допомогою побудови статистичних графіків.

Графіком у статистиці називають наочне зображення статистичних даних за допомогою геометричних ліній та фігур або географічних карт-схем (картограма).

У кожному графіку розрізняють такі елементи:

1. Графічний образ – основа графіка – геометричні знаки, сукупність точок, ліній, фігур, з допомогою яких зображується статистична информация.

2. Поліграфіка - те місце, де розташовується графічний образ.

3. Просторові орієнтири – складаються з допомогою системи координат.

4. Масштабні орієнтири – залежить від масштабу і масштабності графіка.

5. Експлуатація графіка – це назва та відповідні поля окремих його частин.

Залежно від застосування геометричних знаків, графіки різняться на точкові, лінійні, смугові, квадратні та кругові. Графіки бувають як негеометрических фігур, вони називаються фігурними.

Статистичні графіки за способом побудови та завданням поділяються:

1. Діаграми:

a) порівняння;

b) динаміки;

c) структурні.

2. Статистичні карти:

a) картограми;

b) картодіаграми.

Діаграма – найпоширеніший метод графічних зображень, застосовується для наочного зіставлення різних друг від друга величин.

Діаграма – це графік кількісних відносин.

Статистичні карти – це графіки кількісного розподілу на поверхні. За своєю основною метою вони близькі до діаграм, але відрізняються тим, що є умовними зображеннями статистичних даних на контурній географічній карті.

Статистичні карти показують просторове розміщення чи просторову поширеність статистичних даних.

1. До статистичних карт відносять картограми – це схематична карта чи план місцевості, де окремі території, залежно від величини зображуваного показника, позначаються з допомогою графічних символів.

2. Картодіаграми - поєднання картограми з діаграмою.

У спеціальних випадках, коли потрібно зобразити будь-який статистичний показник, який одержують шляхом перемноження двох інших величин, і вони мають бути зображені на графіку, використовують спеціальні графічні знаки, що їх називають знаками Варзаля.


Подібна інформація.


Вступ

З давніх-давен людство здійснювало облік багатьох супутніх його життєдіяльності явищ і предметів і пов'язані з ним обчислення. Люди отримували різнобічні, хоч і відрізняються повнотою різних етапах у суспільному розвиткові. Дані, що враховувалися повсякденно у процесі прийняття господарських рішень, а в узагальненому вигляді та на державному рівні при визначенні русла економічного та соціальної політикита характеру зовнішньополітичної діяльності.

Керуючись міркуваннями залежності добробуту нації від величини створюваного корисного продукту, інтересів стратегічної безпеки країн і народів від чисельності дорослого чоловічого населення, доходів скарбниці від обсягу оподатковуваних ресурсів тощо. буд., здавна чітко усвідомлювалася і реалізовувалася у вигляді різних облікових акций.

З урахуванням досягнень економічної наукистав можливий розрахунок показників, що узагальнено характеризують результати відтворювального процесу на рівні суспільства: сукупного суспільного продукту, національного доходу, валового національного продукту.

Всю перераховану інформацію в постійно зростаючих обсягах надає суспільству статистика, яка є необхідною приналежністю державного апарату. Статистичні дані, таким чином, здатні сказати мовою статистичних показниківбагато про що у дуже яскравій і переконливій формі.

Для статистичного аналізуданих у своїй роботі я використовувала програму Excel (розрахунок формул та побудова графіків).

Статистичні ряди розподілу, їх значення та застосування у статистиці

В результаті обробки та систематизації первинних даних статистичного спостереження отримують угруповання, які називаються рядами розподілу. Вони відома чисельність одиниць спостереження групах. Подана в абсолютному та відносному вираженні.

Статистичний ряд розподілу є упорядкованим розподілом одиниць досліджуваної сукупності на групи за певною ознакою, що варіює. Він характеризує склад (структуру) досліджуваного явища, дозволяє судити про однорідність сукупності, закономірності розподілу та межі варіювання одиниць сукупності.

Статистичні ряди поділяються на:

Атрибутивні - це ряди, побудовані за атрибутивними ознаками, в порядку зростання або зменшення знань, що спостерігаються.

Тобто якісним ознакам, які мають числового висловлювання і характеризує властивість, якість досліджуваного соціально-економічного явища.

Атрибутивні ряди розподілу характеризують склад сукупності за тими чи іншими суттєвими ознаками.

Взяті за кілька періодів ці дані дозволяють досліджувати зміну структури.

Число груп атрибутивного ряду розподілу адекватно числу градацій. Різновидів атрибутивної ознаки.

Приклад атрибутивного ряду розподілу наведено у таблиці 1.

Таблиця 1. Розподіл студентів 1-го курсу успішності

Елементами даного ряду розподілу є градації атрибутивної ознаки «Успішність» («встигають» - «не встигають») та чисельність кожної групи в абсолютному (людина) та відносному (%) виразі.

Студентів, які склали іспит з дисципліни, було 46 осіб. Їх питома вагастановив 92%.

Варіаційні – це ряди, побудовані за кількісною ознакою.

Варіаційні ряди розподілу складаються з двох елементів: варіантів та частот:

Варіанти – це числові значення кількісної ознаки у варіаційному ряду розподілу. Вони можуть бути позитивними та негативними, абсолютними та відносними. Так, під час угруповання підприємств за результатами господарської діяльностіваріанти позитивні - це прибуток, а негативні числа– це збиток.

Частоти - чисельності окремих варіантів чи кожної групи варіаційного ряду, тобто. це числа, що показують, як часто зустрічаються ті чи інші варіанти у розподілі. Сума всіх частот називається обсягом сукупності та визначається числом елементів усієї сукупності.

Частини - це частоти, виражені як відносних величин (частках одиниць чи відсотках). Сума частостей дорівнює одиниці або 100%. Заміна частот частостями дозволяє зіставляти варіаційні ряди з різним числомспостережень.

Варіаційні ряди в залежності від характеру варіації поділяються на дискретні та інтервальні.

Дискретний варіаційний ряд розподілу - це ряд, у якому групи складені за ознакою, що змінюється дискретно і приймає лише цілі значення.

Приклад дискретного варіаційного ряду розподілу наведено у таблиці 2.

Таблиця 2. Розподіл студентів за екзаменаційним балом

У гр. 1 таблиці 2 представлені варіанти дискретного варіаційного ряду. У гр. 2 - частоти, а гр. 3 – частоти. У разі безперервної варіації величина ознаки в одиниць сукупності може набувати певних межах будь-які значення. Відрізняються один від одного на скільки завгодно малу величину.

Інтервальний варіаційний ряд розподілу - це ряд, в якому групувальна ознака, що становить основу угруповання, може приймати певному інтервалібудь-які значення, у тому числі й дробові.

Інтервальний ряд розподілу доцільно будувати, передусім, при безперервній варіації ознаки, і навіть, якщо дискретна варіація проявляється у межах, тобто. Число варіантів дискретного ознаки досить велике.

Правила та принципи побудови інтервальних рядів розподілу аналогічні правилам та принципам побудови статистичних угруповань. У разі, якщо інтервальний варіаційний ряд розподілу побудований з рівними інтервалами, Частоти дозволяють судити про ступінь заповнення інтервалу одиницями сукупності. Під час побудови нерівних інтервалів не можна отримати інформацію про рівень заповнення кожного інтервалу. З метою проведення порівняльного аналізуЗаповненість інтервалів визначається показником, що характеризує щільність розподілу. Це відношення числа одиниць сукупності до ширини інтервалу.

Приклад інтервальної варіаційної ради розподілу наведено у таблиці 3.

Таблиця 3. Розподіл будівельних фірмрегіону з середньооблікової чисельностіпрацюючих*

* - Цифри умовні

Поданий ряд розподілу є інтервальним, на підставі утворення груп якого лежить безперервна ознака.

Аналіз рядів розподілу можна наочності проводити з урахуванням їх графічного зображення. Для цієї мети будують полігон, гістограму, огиву та кумуляту розподілу.

Розрахункова частина завдання №5

Є вибіркові дані (вибірка 5% механічна) про середньорічну вартість основних виробничих фондів і випуск продукції підприємств галузі економіки за звітний період.

Таблиця 4. Вихідні дані

Випуск продукції, млн. руб.

За вихідними даними:

1. Побудуйте статистичний ряд розподілу підприємств за середньорічною вартістю основних виробничих фондів, утворивши чотири групи підприємств з рівними інтервалами, охарактеризувавши їх числом підприємств та питомою вагою підприємств.

2. Розрахуйте узагальнюючі показники низки розподілу:

а) середньорічну вартість основних виробничих фондів, зважуючи значення ознаки щодо абсолютної чисельності підприємств та їх питомої ваги;

б) моду та медіану;

в) побудуйте графіки ряду розподілу та визначте на них значення моди та медіани.

Рішення:

1. Спочатку визначаємо довжину інтервалу за формулою:

е = (х max - x min) / k,

де k - число груп у групуванні (з умови k = 4),

х max і x min - максимальне та мінімальне значення ряду розподілу,

е = (60 - 20) / 4 = 10 млн. руб.

Потім визначимо нижню та верхню інтервальні межі для кожної групи:

Номер групи

Нижня границя

верхня межа

Складемо робочу таблицю 5, куди зведемо вихідні дані:

Таблиця 5. Робоча таблиця

Групи пред-ий за середньорічною вартістю ОПФ,

№ підприємства

Середньорічна вартість ОПФ, млн. руб.

Випуск продукції,

Розрахуємо характеристику ряду розподілу за питомою вагою підприємств за формулою:

де d - Питома вага підприємства;

f i - кількість підприємств у групі;

F i - загальна кількість підприємств.

Підставляємо дані у формули. Отримані результати заносимо до підсумкової таблиці 6.

Усі формули та розрахунки таблиці 6 введені у програмі Excel та наведені у Додатку 1.

Таблиця 6. Розподіл підприємств за середньорічною вартістю основних виробничих фондів

Дане угруповання показує, що з найбільшої частини даних підприємств (33,3%) середньорічна вартість основних виробничих фондів становить від 40 до 50 млн. крб.

2. а) Розрахуємо середньорічну вартість основних виробничих фондів за формулою середньої арифметичної зваженої, зважуючи значення абсолютної чисельності підприємств:

і за питомою вагою:

Для розрахунку середньої з інтервального ряду необхідно висловити варіанти одним (дискретним) числом, це середня арифметична проста з верхнього та нижнього значень інтервалу:

Підставляємо дані у формули. Отримані результати занесемо до таблиці 7.

Усі формули та розрахунки таблиці 7 введені у програмі Excel та наведені у Додатку 1.

Таблиця 7. Розрахунок середньорічної вартості ОПФ

Показники середніх рівні, що доводить правильність розрахунків. Середньорічна вартість ОПФ дорівнює 41,333 млн. руб.

б) Розрахуємо моду та медіану цього ряду.

Мода - це значення ознаки, що найчастіше зустрічається в сукупності, що вивчається. Для інтервальних варіаційних рядів розподілу мода розраховується за такою формулою:

де x Mo – нижня межа модального інтервалу;

i Mo – величина модального інтервалу;

f Mo – частота модального інтервалу;

f Mo-1 - частота інтервалу, що передує модальному;

f Mo+1 - частота інтервалу, наступного за модальним.

Спочатку за найбільшою частотою ознаки визначимо модальний інтервал. Найбільше підприємств - 10 - середньорічна вартість основних виробничих фондів в інтервалі 40 - 50 млн. крб., що і є модальним.

Підставляємо дані у формулу.

З розрахунку видно, що модальним значенням вартості ОПФ підприємств є ціна, що дорівнює 44 млн. руб.

Медіана - це варіант, розташований у середині впорядкованого варіаційного ряду, що ділить його на дві рівні частини. Для інтервальних варіаційних рядів медіана розраховується за такою формулою:

де x Mе - нижня межа медіанного інтервалу;

i Mе – величина медіанного інтервалу;

F – сума частот ряду;

S Mе-1 - сума накопичених частот ряду, що передують медіанному інтервалу;

f Mе – частота медіанного інтервалу.

Визначаємо медіанний інтервал, де знаходиться порядковий номер медіани. Для цього підрахуємо суму частот накопиченим підсумком до числа, що перевищує половину обсягу сукупності (30/2 = 15). Отримані дані заносимо до розрахункової таблиці 8.

Таблиця 8. Розрахунок медіани

У графі "Сума накопичених частот" значення 23 відповідає інтервалу 40 - 50. Це і є медіанний інтервал, в якому знаходиться медіана.

Підставляємо дані у формулу.

З розрахунку видно, що з половини підприємств середньорічна вартість основних виробничих фондів до 42 млн. крб., а й у половина - вище цієї суми.

в) Побудуємо графіки даного ряду розподілу за отриманими даними:

Мал. 1.

Медіана

Мал. 2. Кумулята розподілу підприємств за середньорічною вартістю ОПФ

Особливу форму угруповання даних представляють так звані статистичні ряди,або числові значення ознаки, розташованої у певному порядку. Залежно від цього, які ознаки вивчаються, статистичні ряди ділять на атрибутивні, варіаційні, ряди динаміки, регресії, ряди ранжованих значень ознак і ряди накопичених частот. Найчастіше у психології використовуються варіаційніряди, ряди регресіїта ряди ранжованих значень ознак.

Варіаційним рядомрозподілу називають подвійний ряд чисел, що показує, яким чином числові значення ознаки пов'язані з їхньою повторюваністю в даній вибірці. Наприклад, психолог провів тестування інтелекту з тесту Векслера у 25 школярів, і сирі бали за другим субтестом виявилися такими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Як бачимо, деякі цифри трапляються в даному рядукілька разів. Отже, враховуючи кількість повторень, ці ряд можна представити в більш зручній, компактній формі:

Це є варіаційний ряд. Числа, що показують, скільки разів окремі варіанти зустрічаються в даній сукупності, називаються частотами, або вагами, варіант. Вони позначаються малою літерою латинського алфавіту. f iта мають індекс “i”, що відповідає номеру змінної у варіаційному ряду.

Відсоткове уявлення частот корисно у випадках, коли доводиться порівнювати варіаційні ряди, сильно різняться за обсягами. Наприклад, при тестуванні шкільної готовності дітей міста, селища міського типу та села було обстежено вибірки дітей чисельністю 1000, 300 та 100 осіб відповідно. Відмінність обсягів вибірок очевидна. Тому порівняння результатів тестування краще проводити, використовуючи відсотки частот.

Наведений вище ряд (3.1) можна уявити інакше. Якщо елементи ряду розташувати в порядку, що в зростає, то вийде так званий ранжований варіаційний ряд:

Подібна форма подання (3.3) більш краща, ніж (3.1), оскільки краще ілюструє закономірність варіювання ознаки.

Частоти, що характеризують ранжований варіаційний ряд, можна складати або накопичувати. Накопичені частоти виходять послідовним підсумовуванням значень частот від першої до останньої.

Як приклад знову звернемося до ряду 3.3. Перетворимо його в ряд 3.4 в якому введемо додатковий рядок і назвемо її «кумуляти частот»:

Розглянемо докладно як вийшов останній рядок. На початку низки частот стоїть 1. У кумулятивному ряду другою місці стоїть 2 - це сума першої і другої частоти, тобто. 1 + 1, третьому місці стоїть 4 це сума другої (вже накопиченої частоти) і третьої частоти, тобто. 2+2, на четвертому 8 = 4+4 і т.д.


Розмах(іноді цю величину називають розкидом)вибірки позначається буквою R.Це найпростіший показник, який можна отримати для вибірки - різницю між максимальною та мінімальною величинами даного конкретного варіаційного ряду, тобто.

Зрозуміло, що чим сильніше варіює вимірювана ознака, тим більша величина R,і навпаки.

Однак може статися так, що у двох вибіркових рядів і середні, і розмах збігаються, проте характер варіювання цих рядів буде різним. Наприклад, дано дві вибірки:

При рівності середніх і розкидів цих двох вибіркових рядів характер їх варіювання різний. Для того, щоб більш чітко представляти характер варіювання вибірок, слід звернутися до їх розподілу.

Таблиці та графіки розподілу частот

Як правило, аналіз даних починається з вивчення того, як часто зустрічаються ті чи інші значення дослідника, що цікавить ознаки (змінної) в наявній безлічі спостережень. Для цього будуються таблиці та графіки розподілу частот.Нерідко є основою отримання цінних змістовних висновків дослідження.

Якщо ознака приймає всього лише кілька можливих значень (до 10-15), то таблиця розподілу частот показує частоту народження кожного значення ознаки. Якщо вказується, скільки разів зустрічається кожне значення ознаки, це - таблиця абсолютнихчастот розподілу, якщо вказується частка спостережень, що припадають на те чи інше значення ознаки, то говорять про відноснихчастоти розподілу.

У багатьох випадках ознака може приймати безліч різних значеньнаприклад, якщо ми вимірюємо час вирішення тестового завдання. У цьому випадку про розподіл ознак дозволяє судити таблиця згрупованих частот,у яких частоти групуються за розрядами чи інтервалами значень ознаки.

Ще одним різновидом таблиць розподілу є таблиці розподілу накопиченихчастот. Вони показують, як накопичуються частоти зі зростанням значень ознаки. Навпроти кожного значення (інтервалу) вказується сума частот народження всіх тих спостережень, величина ознаки у яких не перевищує даного значення(Менше верхньої межі даного інтервалу). Накопичені частоти містяться у правих стовпцях табл. 3.2 та 3.3.

Для наочного уявлення будується графік розподілу частот чи графік накопичених частот - гістограма чи згладжена крива розподілу.

Гістограма розподілу частот - це стовпчикова діаграма, кожен стовпець якої спирається на конкретне значення ознаки чи розрядний інтервал (для згрупованих частот). Висота стовпчика пропорційна частоті відповідності значення. На рис. 3.1 зображено гістограму розподілу частот для прикладу з табл. 3.2.

Гістограма накошених частотвідрізняється від гістограми розподілу тим, що висота кожного стовпчика пропорційна частоті, накопиченої до цього значення (інтервалу). На рис. 3.2 зображено гістограму накопичених частот для даних табл. 3.2.

Побудова полігону розподілу частотнагадує побудову гістограми. У гістограмі вершина кожного стовпця, що відповідає частоті народження даного значення (інтервалу) ознаки, - відрізок прямої. А для полігону відзначається точка, що відповідає середині цього відрізку. Далі всі точки з'єднуються ламаною лінією (рис. 3.3). Замість гістограми чи полігону часто зображують згладжену криву розподілу частот. На рис. 3.4 зображено гістограму розподілу для прикладу з табл. 3.3 (стовпчики) та згладжена крива того ж розподілу частот.

Таблиці та графіки розподілу частот дають важливу попередню інформацію про формі розподілу ознаки:про те, які значення трапляються рідше, а які частіше, наскільки виражена мінливість ознаки. Зазвичай виділяють такі типові форми розподілу. Рівномірний розподіл -коли всі значення трапляються однаково (або майже однаково) часто. Симетричний розподіл -коли однаково часто трапляються крайні значення. Нормальний розподіл- Симетричний розподіл, у якого крайні значення зустрічаються рідко і частота поступово підвищується від крайніх до серединних значень ознаки. Асиметричні розподіли- лівосторонні(з переважанням частот малих значень), правосторонні(З переважанням частот великих значень).

Вже самі собою таблиці і графіки розподілу ознаки дозволяють робити деякі змістовні висновки при порівнянні груп піддослідних між собою. Порівнюючи розподіли, ми можемо як судити у тому, які значення зустрічаються частіше у тій чи іншій групі, а й порівнювати групи за рівнем вираженості індивідуальних відмінностей - мінливостіза цією ознакою.

Таблиці та графіки накопичених частот дозволяють швидко отримати додаткову інформацію про те, скільки випробуваних (або яка їх частка) мають вираженість ознаки не вище за певне значення.

Розділ 4. Описові статистики
(Статистичне розподіленняі його числові характеристики)

Змінна може набувати багато значень. На початковому етапі обробки даних замість того, щоб розглядати всі значення змінної, рекомендується проаналізувати описові статистики. Вони дають загальне уявленняпро значення або розкид значень, які набуває змінна.

До первинних описових статистик ( Descriptive Statistics)зазвичай відносять числові характеристики розподілу виміряного на вибірці ознаки. Кожна така характеристика відображає в одному числовому значеннівластивість розподілу безлічі результатів вимірювання:з погляду їх розташуванняна числовій осі або з погляду їх мінливості.Основне призначення кожної з первинних описових статистик - заміна безлічі значень ознаки, виміряної на вибірці, одним числом (наприклад, середнім значенням як мірою центральної тенденції). Компактний опис групи за допомогою первинних статистик дозволяє інтерпретувати результати вимірювань, зокрема шляхом порівняння первинних статистик різних груп.

Ряд розподілуу статистиці - це найпростіше угруповання, що є впорядкованим розподілом одиниць сукупності на групи за досліджуваною ознакою, що варіює.

За характером досліджуваної ознаки ряди поділяються на атрибутивні(коли варіююча ознака якісна, тобто не має кількісного виразу) і варіаційні(якщо вивчається ознака вимірюється кількісно).

У кожному ряду розподілу виділяють два основні елементи:

Варіанти – конкретні значення ознаки;

Частоти - числа, що показують, як часто зустрічаються ці варіанти.

Якщо варіанти представлені цілими значеннями ознаки, такі варіаційні ряди розподілу називаються дискретними, а якщо варіанти представлені числовими інтервалами, такі ряди називаються інтервальними.

Ряди розподілу доповнюються частостями та накопиченими (кумулятивними) частотами.

Частина- відносна частота, що визначається ставленням числа одиниць груп до загального обсягу сукупності.

Накопичені частотипоказують, скільки одиниць сукупності мають значення ознаки не більше за дане значення. Визначається послідовним додатком до частоти першому інтервалі наступних частот ряду.

Розмір інтервалу угруповання інтервального варіаційного ряду визначається за формулою

де - максимальне значення ознаки, - мінімальне значення ознаки, - кількість груп, що виділяються.

При вирішенні питання про те, скільки слід утворити груп, потрібно брати до уваги розмах варіювання та чисельність одиниць сукупності, що вивчається. Чим більший розмах варіювання ознаки, покладеної в основу угруповання, тим, як правило, більше може бути утворено груп.

Залежність між числом груп та чисельністю одиниць сукупності n можна виразити формулою американського вченого Стерджесса:

Ця залежність може бути орієнтуванням щодо числа груп у разі, коли розподіл одиниць сукупності за даною ознакою наближається до нормальному.

Якщо, наприклад, потрібно провести угруповання з рівними інтервалами за даними вартості основних фондів підприємств, максимальне значення якої становить 7 млн. крб., мінімальна - 1 млн. крб. і необхідно виділити при цьому 4 групи, то величина інтервалу визначається наступним чином

У нашому прикладі угруповання з рівними інтервалами набуде такого вигляду

При такому записі слід пам'ятати правило, що ліва цифра включає зазначене значення, а права не включає. Отже, підприємства із основними фондами 2,5 млн. крб. має бути віднесено до другої групи.

Проілюструємо побудову низки розподілу на умовному прикладі.

Приклад 2.1. Є такі дані про виробничий стаж працівників малого підприємства, років.

9, 3, 7, 2, 5, 3, 11, 6, 5, 4, 7

Необхідно побудувати низку розподілу працівників за стажем, обробивши 3 групи з рівними інтервалами.

Розмір інтервалу угруповання працівників за стажем визначається за формулою

Тоді інтервали будуть такими:

2 - 5, 5 - 8, 8 - 11

Підрахуємо частоти та подаємо результати в таблиці, яку доповнимо частотами та кумулятивними частотами

Таблиця 2.1. Ряд розподілу працівників за виробничим стажем

Ряди розподілу для наочності та зручності аналізу можуть бути зображені графічно. Основні види графіків рядів розподілу: полігон частот (рис. 1), гістограма (рис. 2), кумулята (рис. 3).

Для зображення побудованого інтервального ряду працівників за виробничим стажем у вигляді полігону частот слід перетворити його на дискретний ряд. Для цього визначити середини (центри) інтервалів -

(3, 5; 6,5; 9,5). З цих середин відновити перпендикуляри рівні частот і з'єднати їх вершини відрізками.

При побудові гістограми ряду розподілу працівників за стажем роботи на осі абсцис відкладають інтервали ряду, висота яких дорівнює частотам відкладеним по осі ординат. Над віссю абсцис будуються прямокутники, площа яких відповідає величинам творів інтервалів з їхньої частоти.

Мал. 2.

При графічне зображеннякумуляти накопичені частоти наносять на поле графіка у вигляді перпендикулярів до осі абсцис у верхніх межах інтервалів, а саме 5, 8, 11. поки не досягне висоти, що дорівнює загальну сумучастот.


Мал. 3.

Аналіз низки та графіків показує, що розподіл працівників за стажем не є рівномірним, чим більше стаж працівників відрізняється від середнього стажу, тим рідше такі працівники зустрічаються.

Узагальнення первинних даних у вигляді ряду розподілу дозволяє бачити варіацію і склад сукупності за ознакою, що вивчається, порівнювати між собою групи, вивчати їх динаміку і встановлювати характер розподілу одиниць за тією чи іншою ознакою.

Однак ряди розподілу не дають всебічної характеристики виділених груп. Щоб вирішити низку конкретних завдань, виявити особливості розвитку явищ, виявити тенденції, встановити залежності, необхідно провести угруповання статистичних даних.

Як здійснюється конкретне угруповання розглянемо у наступному питанні.