Вторинне угруповання. Формула Стерджесу

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

гарну роботуна сайт">

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Московська академія ім. С.Ю. Вітте

Факультет "Економіка"

Контрольна робота

Роботу виконала:

студентка 1-го курсу,

дистанційної форми навчання

Вісляєва М.М.

м Москва

При виконанні контрольного завдання Ви повинні зробити вторинну перегрупування для не складного прикладу(Приклад обрати самостійно) і пояснити, як і при виконанні яких умов справедливий такий перерахунок. При використанні комп'ютерних програм і складнішого прикладу вказати також ефект та особливості застосування ІТ.

У письмовій відповіді на завдання Ви повинні:

1. Пояснити зв'язок між формулою складання дисперсій та кореляційним ставленням, роз'яснити його статистичний зміст.

2. Виконати порівняння варіації для двох різних розподілів із різними середніми, пояснити умови сумісності при відмінності середніх.

3. Дати найповніше пояснення сенсу граничної помилки, пов'язати з поняттям репрезентативності вибірки та її необхідним обсягом.

4. Пояснити співвідношення оцінювання невідомих параметрів МНК і перевірку значимості отриманих результатів за критеріями перевірки статистичних гіпотез.

Перегрупування раніше згрупованих статистичних даних називається вторинним угрупованням. До цього методу вдаються в тих випадках, коли в результаті початкового угруповання нечітко проявився характер розподілу сукупності, що вивчається.

У цьому випадку роблять укрупнення чи зменшення інтервалів. Також вторинне угруповання використовується для приведення до порівняльного виду угруповань з різними інтервалами з метою їхнього порівняння. Розглянемо прийоми вторинного угруповання з прикладу.

Здійснити укрупнення інтервалів на основі даних таблиці 1:

Таблиця 1

Число магазинів

Наведене угруповання недостатньо наочно, тому що не показує чіткої та суворої закономірності у зміні товарообігу за групами.

Ущільнимо ряди розподілу, утворивши шість груп. Нові групи утворені шляхом підсумовування початкових груп (табл. 2).

Таблиця 2

Групи магазинів за обсягом товарообігу за IV квартал, тис. крб.

Число магазинів

Товарообіг за IV квартал, тис. руб.

Товарообіг у середньому на 1 магазин, тис. руб.

Цілком чітко видно, чим крупніші магазини, Тим вище рівень товарообігу.

1. За аналітичним угрупуванням можна виміряти зв'язок за допомогою емпіричного кореляційного відношення. Цей показник позначається грецькою літерою з (ця). Він заснований на правилі розкладання дисперсії, згідно з яким загальна дисперсія s2 ​​дорівнює сумі внутрішньогрупової та міжгрупової дисперсій.

Дисперсія результативної ознаки всередині групи за відносної сталості ознаки-фактора виникає за рахунок інших факторів. Ця дисперсія називається залишковою. Вона визначається за такою формулою:

де у ij - значення ознаки у для i-ї одиниціу j-й групі;

J – середнє значення ознаки у j-й групі;

n j - число одиниць j-йгрупі;

j = 1, 2, 3, ..., т.е.

Внутрішньогрупові дисперсії, розраховані для окремих груп, поєднуються в середній величині внутрішньогрупової дисперсії:

Міжгрупова дисперсія відноситься на рахунок фактора, що вивчається (і факторів, пов'язаних з ним), тому ця дисперсія називається факторною. Вона визначається за формулою

Правило складання дисперсій може бути записано:

Емпіричне кореляційне відношення вимірює, яку частину загальної коливання результативної ознаки викликає фактор, що вивчається. Відповідно воно розраховується як відношення факторної дисперсії до загальної дисперсіїрезультативної ознаки:

Цей показник набуває значення в інтервалі: чим ближче до 1, тим тісніше зв'язок, і навпаки.

Таблиця 3. Вихідні дані

Таблиця 4. Робоча таблиця

Середній товарообіг = ? X * f / f = 17370/51 = 340,58 тис. руб.

Дисперсія дорівнює:

G 2 =? f * (X-Xср) 2 /? f = 38682,36/51 = 758,48

Середнє квадратичне відхилення:

Коефіцієнт варіації дорівнює:

V = G/Xср = 27,54/758,48 = 0,081; 8,1%.

Коефіцієнт варіації менше 33%, отже, сукупність однорідна.

Таблиця 5. Вихідні дані

1) середні витрати часу на проїзд до місця роботи у робітників = Х ср =? Xf / ?f = (25 * 70 + 35 * 80 + 45 * 200 + 55 * 55 + 65 * 15) / 420 = 41,8 хв.

2) розрахунок дисперсії

Дисперсія дорівнює:

G 2 =? f відхилення:

3) Коефіцієнт * (X-Xср) 2 / ? f = 43160,8/420 = 102,8

Середнє квадратичне варіації дорівнює:

V = G/Xср = 10,14/41,8 = 0,24; 24%

Коефіцієнт варіації менше 33%, отже, розглянута сукупність однорідна і середня для неї досить типова.

Вибіркову сукупність можна сформувати за кількісною ознакою статистичних величин, а також альтернативною або атрибутивною. У першому випадку узагальнюючою характеристикою вибірки служить вибіркова середня величина, що позначається, а у другому - вибіркова частка величин, що позначається w. У генеральної сукупностівідповідно: генеральна середня та генеральна частка нар.

Різниці - і W - р називаються помилкою вибірки, яка поділяється на помилку реєстрації та помилку репрезентативності. Перша частина помилки вибірки виникає через неправильні або неточні відомості з причин нерозуміння суті питання, неуважності реєстратора при заповненні анкет, формулярів і т.п. Вона досить легко виявляється та усувається. Друга частина помилки виникає через постійне або спонтанне недотримання принципу випадковості відбору. Її важко виявити і усунути, вона набагато більша за першу і тому їй приділяється основна увага.

Винятково важливу рольдля обґрунтування та застосування вибіркового спостереження грає закон великих чисел. Використання законів великих чисел полягає в тому, що за певних умов і за досить великого обсягу спостережень зведені характеристики, отримані на основі вибіркового спостереження, мало відрізнятимуться від відповідних характеристик генеральної довіреності. На основі цього можна, збільшуючи обсяг вибіркової сукупності, зменшити межі можливих помилок репрезентативності, довести їх до найменших розмірів. З іншого боку, знаючи межі помилок репрезентативності, можна визначити необхідну чисельність вибіркової сукупності.

Однією з найважливіших і відповідальних завдань щодо організації та проведення вибіркового спостереження є встановлення необхідної чисельності вибіркової сукупності, тобто. такої її чисельності, яка забезпечувала б отримання даних, що достатньо правильно відображають досліджувані властивості генеральної сукупності.

У цьому має бути враховано: 1) з яким ступенем точності слід отримати граничну помилку вибірки; 2) якою має бути ймовірність того, що буде забезпечена обумовлена ​​точність результатів вибіркового спостереження; 3) ступінь коливання досліджуваних якостей досліджуваної генеральної сукупності.

Це означає, що необхідна чисельність вибірки встановлюється залежно від розмірів граничної помилки вибірки, величини коефіцієнта довіри (t) і розмірів величини дисперсії.

Метод оцінювання параметрів лінійної регресії, що мінімізує суму квадратів відхилень спостережень залежної змінної від шуканої лінійної функціїназивається методом найменших квадратів.

Суть методу у тому, що критерієм якості розглянутого рішення є сума квадратів помилок, яку прагнуть звести до мінімуму. Для застосування цього методу вимагає провести якомога більше вимірів невідомої випадкової величини (що більше - тим вище точність рішення) і деяка безліч гаданих рішень, з якого потрібно вибрати найкраще. Якщо безліч рішень параметризовано, потрібно знайти оптимальне значенняпараметрів.

МНК використовується в математиці, зокрема - в теорії ймовірностей та математичної статистики. Найбільше застосування цей метод має завдання фільтрації, коли необхідно відокремити корисний сигнал від накладеного на нього шуму. Його застосовують і в математичному аналізі для наближеного уявлення заданої функціїбільше простими функціями. Ще одна з областей застосування МНК - розв'язання систем рівнянь з кількістю невідомих меншою, ніж кількість рівнянь.

Етапи перевірки статистичних гіпотез:

Формулювання основної гіпотези H0 і конкуруючої гіпотези H1. Гіпотези мають бути чітко формалізовані в математичних термінах.

Завдання ймовірності б, яка називається рівнем значущості і відповідає помилкам першого роду, на якому надалі і буде зроблено висновок про правдивість гіпотези.

Розрахунок статистики ц критерію такий, що:

її величина залежить від вихідної вибірки;

за її значенням можна робити висновки про істинність гіпотези H0;

сама статистика ц має підпорядковуватися якомусь відомому закону розподілу, т.к. сама ц є випадковою через випадковість.

Побудова критичної галузі. З області значень ц виділяється підмножина таких значень, якими можна будувати висновки про істотні розбіжності з припущенням. Його розмір вибирається таким чином, щоб виконувалась рівність. Це безліч і називається критичною областю.

Висновок про істинність гіпотези. Значення вибірки, що спостерігаються, підставляються в статистику ц і по потраплянню (або непопаданню) в критичну область виноситься рішення про відкидання (або прийняття) висунутої гіпотези H 0 .

дисперсія кореляційна варіація

Розміщено на Allbest.ru

...

Подібні документи

    Таблиця значень вибірки дискретних випадкових величину впорядкованому вигляді. Таблиця інтервального статистичного рядувідносних частот. Завдання емпіричної функції розподілів та побудова її графіка. Полігон та розподіл випадкової величини.

    практична робота , доданий 26.07.2012

    Числові показники для статистичних розподілів. Побудова інтервального варіаційного ряду, багатокутника частостей, графіка вибіркової функції розподілу та визначення середнього значення вибірки та вибіркової дисперсії двома способами.

    презентація , додано 01.11.2013

    Середнє значення показника (середнє арифметичне). Показники варіації – розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення, дисперсія, коефіцієнт варіації. Максимальне та мінімальне значення статистичного показника.

    контрольна робота , доданий 14.11.2008

    Поняття генеральної сукупності, математичного очікування та дисперсії. Забезпечення випадковості та репрезентативності вибірки у статистичному плануванні. Дискретний та інтервальний варіаційний ряд, точкові оцінкипараметрів розподілу ознаки

    реферат, доданий 13.06.2011

    Сутність вибіркового дослідження. Способи відбору одиниць у вибіркову сукупність. Середня та гранична помилка для показників середньої величини та показників частки. Визначення необхідного обсягу вибірки при заданій граничної помилкисереднього значення.

    презентація , доданий 16.03.2014

    Форми, види та способи статистичного спостереження. Види угруповань, їх інтервал та частота. Структура низки динаміки. Абсолютні та відносні статистичні величини. Подання вибірки як статистичного ряду. Точкове та інтервальне оцінювання.

    курс лекцій, доданий 29.11.2013

    Побудова інтервальних варіаційних рядів за показниками. Обчислення середньої арифметичної, моди та медіани, відносних та абсолютних показників варіації. Визначення кількісних характеристик розподілу, побудова емпіричної функції.

    курсова робота , доданий 11.01.2012

    Діаграма розсіювання як точки на площині, координати яких відповідають значенням випадкових величин X та Y, порядок її побудови та призначення. Знаходження коефіцієнтів та побудова графіка лінійного наближення, графіка квадратичного наближення.

    курсова робота , доданий 03.05.2011

    Упорядкування вихідної вибірки напрацювань повністю. Перевірка статистичної гіпотезипро відповідність експоненційному розподілу та розподілу Вейбулла. Оцінювання параметрів розподілів та показників безвідмовності, його головні методи та прийоми.

    курсова робота , доданий 22.01.2012

    Поняття варіаційного ряду, статистичного розподілу. Емпірична функція та основні характеристики математичного очікування вибіркової дисперсії. Точкові та інтервальні оцінки розподілів. Теорія гіпотез – аналог теорії довірчих інтервалів.

Угруповання, побудовані за той самий період часу, але для різних об'єктів або, навпаки, для одного об'єкта, але за два різних періодівчасу, можуть виявитися непорівнянними через різного числавиділених груп чи неоднаковості меж інтервалів.

Вторинне угруповання, або перегрупування згрупованих даних, застосовується для кращої характеристикидосліджуваного явища (у разі, коли початкове угруповання не дозволяє чітко виявити характер розподілу одиниць сукупності), або приведення до порівняльного виду угруповань з метою проведення порівняльного аналізу.

Вторинне угруповання- це операція з утворення нових груп на основі раніше здійсненого угруповання.

Застосовують два способи утворення нових груп. Першим, найпростішим і найпоширенішим способом є зміна (частіше укрупнення) початкових інтервалів. Другий спосіб отримав назву пайового перегрупування. Він полягає в утворенні нових груп на основі закріплення за кожною групою певної частки одиниць сукупності. Проілюструємо методику вторинного угруповання з прикладу (табл. 3.14).

Таблиця 3.14. Розподіл підприємств роздрібної торгівліодного з міст Московської області за середньорічною чисельністю працівників у 2011 р.*

* Дані умовні.

Зробимо перегрупування даних, утворивши нові групи з інтервалами до 5, 5-10, 10-20, 20-30, 30 і більше людей.

До першої нової групи увійде повністю перша група підприємств роздрібної торгівлі та частина другої групи. Щоб утворити групу до п'яти осіб, необхідно від інтервалу другої групи взяти одну особу. Розмір інтервалу цієї групи становить шість осіб. Отже, необхідно взяти від неї 1/6 частину. Аналогічну частину в знову утворену першу групу треба і від кількості підприємств, тобто. 20 -= 3 підприємства. 6

Тоді у першій групі підприємств роздрібної торгівлі буде 16+3=19 од.

Другу нову групу утворюють підприємства роздрібної торгівлі другої групи з відрахуванням віднесених до першої, тобто. 20 – 3 = 17 підприємств. У новостворену третю групу увійдуть усі підприємства третьої групи та частина підприємств четвертої. Для визначення цієї частини від інтервалу 18 30 (ширина інтервалу дорівнює 12) потрібно додати до попереднього 2,0 (щоб верхня межа інтервалу дорівнювала 20 осіб). Отже, необхідно взяти частину інтервалу, що дорівнює 2/12 = 1/6. У цій групі 74 підприємства, отже треба взяти 74 (1/6) = 12 підприємств. До нової третьої групи увійдуть 44 + 12 = 56 підприємств.

До новоствореної четвертої групи увійдуть 74 - 12 = = 62 підприємства, що залишилися від колишньої четвертої групи. П'яту новостворену групу складуть підприємства роздрібної торгівлі п'ятою та шостою колишніх груп: 37 + 9 = 46 підприємств.

В результаті отримаємо нові групи (табл. 3.15).

Таблиця 3.15. Розподіл підприємств роздрібної торгівлі одного з міст Московської області за середньорічною чисельністю працівників у 2011 р. після перегрупування даних*

* Дані умовні.

Статистична таблиця: сутність, елементи та класифікація

Статистична таблиця - найбільш раціональна, наочна та компактна форма подання статистичного матеріалу, у тому числі результатів статистичного угруповання. Проте чи кожна таблиця є статистичної. Таблиця множення, опитувальний лист соціологічного обстеження можуть мати табличну форму, але ще є статистичними таблицями.

Статистична таблиця- це таблиця, яка містить зведену числову характеристикудосліджуваної сукупності за однією або декількома істотними ознаками, взаємопов'язаними логікою економічного аналізу.

Основні елементи статистичної таблиці, що становлять її кістяк (основу), показані на схемі 3.1.

Таблічнийназивається така форма розташування числової інформації, при якій число розташовується на перетині чітко сформульованого заголовка по вертикальному стовпцю, званому графою, та назви по відповідній горизонтальній смузі - рядку. Таким чином, зовні таблиця являє собою перетин граф і рядків, які формують кістяк таблиці.

Статистична таблиця містить три види заголовків: загальний, верхні та бічні. Загальний заголовок відображає зміст всієї таблиці (до якого місця та часу вона відноситься), розташовується над макетом таблиці по центру та є зовнішнім заголовком. Верхні заголовки характеризують зміст граф (заголовки присудка), а бічні (Заголовки підлягає) - рядків. Вони є внутрішніми заголовками.

Остів таблиці, заповнений заголовками, утворює макет таблиці; якщо на перетині граф та рядків записати цифри, то виходить повна статистична таблиця. Назва таблиці (загальний заголовок)

Схема 3.1. Остів (основа) статистичної таблиці

Цифровий матеріал може бути представлений абсолютними (статутний капітал, обсяг інноваційних товарів тощо), відносними (ВВП на душу населення, число персональних комп'ютерівна 100 працівників і т.д.) та середніми (середній курс акцій, середній надій молока на одну корову тощо) величинами.

Таблиці можуть супроводжуватися приміткою, що використовується для пояснення, у разі потреби, заголовків, методики розрахунку деяких показників, джерел інформації тощо.

За логічним змістом таблиця є " статистичне пропозицію " , основними елементами якого є підлягає і присудок.

Що підлягаютьназивається об'єкт, що характеризується цифрами. Це може бути одна або кілька сукупностей, окремі одиниці сукупності в порядку їхнього переліку або згруповані за будь-якими ознаками, територіальні одиниці тощо. Зазвичай таблиця, що підлягає, дається в лівій частині, в найменуванні рядків.

Сказуванеутворює систему показників, якими характеризується об'єкт вивчення, тобто. підлягає таблиці. Даний формує верхні заголовки і становить зміст граф з логічно послідовним розташуванням показників зліва направо.

Розташування підлягає і присудка в окремих випадках може змінюватися місцями для більш повного і кращого способупрочитання та аналізу вихідної інформації про досліджувану сукупність.

За структурою підлягає,залежно від групування одиниць у ньому, розрізняють прості та складні статистичні таблиці.

Простий називається статистична таблиця, що підлягає якій дається перелік об'єктів чи територіальних одиниць. Прості статистичні таблиці поділяються на монографічні та перелікові.

Монографічні таблиці характеризують не всю сукупність одиниць об'єкта, що вивчається, а тільки одну якусь одиницю або групу, виділену за певною ознакою (табл. 3 .16).

Таблиця 3.16. Введення в дію об'єктів соціально-культурного призначення у суб'єктах РФ у 2009 р.

Переліковими таблицями називаються таблиці, що підлягає містить перелік об'єктів чи одиниць досліджуваного об'єкта (табл. 3.17).

Складні статистичні таблиці на відміну від простих дають можливість виявити соціально-економічні типи досліджуваних явищ, їх структуру, а також взаємозв'язку та взаємозалежності між ознаками, що характеризують їх. Ці завдання повніше можна вирішити з допомогою групових і, особливо, комбінаційних таблиць.

Груповими називають статистичні таблиці, що підлягає містить групування одиниць сукупності за однією кількісною або атрибутивною ознакою.

Найпростішим видом групових таблиць є ряди розподілу. Групова таблиця може бути складнішою, якщо в присудку додатково наводиться ряд показників, що характеризують групи підлягає. Такі таблиці часто використовуються з метою зіставлення узагальнюючих показників за групами (табл. 3.18).

Таблиця 3.17. Надходження іноземних інвестицій в економіку РФ та основним країнам-інвесторам у 2009 р.

Група населення за віком, років

Усього

В тому числі

чоловіки

жінки

Таким чином, групові таблиці дозволяють виявити та охарактеризувати соціально-економічні типи явищ, їх структуру залежно лише від однієї ознаки.

Комбінаційними називають статистичні таблиці, що підлягає містить угруповання одиниць сукупності одночасно за двома і більше ознаками: кожна з груп, побудована за однією ознакою, розбивається, у свою чергу, на підгрупи за якоюсь іншою ознакою і т.д. (Табл. 3.19).

Таблиця 3.19. Угруповання збудованих квартир у житловому будинку за кількістю кімнат та середнім розміром

Таблиця 3.18. Розподіл чисельності зайнятих в економіці РФ за віковими групами на кінець листопада 2009 р., % до підсумку

Підлягають у таблиці групи побудованих квартир за кількістю кімнат та їх середнього розміру.

Комбінаційні таблиці дозволяють характеризувати типові групи, виділені за декількома ознаками, та зв'язок між ними. Послідовність розбиття одиниць сукупності на однорідні групи за ознаками визначається або важливістю однієї з них у комбінації, або їх вивчення.

У присудку статистичної таблиці, як говорилося, наводяться показники, які є характеристикою досліджуваного об'єкта.

За структурою присудка розрізняють прості та складні статистичні таблиці.

При простий розробці присудка представлені у ньому ознаки не перетинаються і підсумкові значення виходять шляхом простого підсумовування значень щодо кожної ознаки окремо, незалежно друг від друга. Прикладом простої розробки присудка може бути табл. 3.20.

При складній розробці присудка виходить повніша і детальна характеристикаоб'єкт. У цьому випадку обидві ознаки присудка (за статтю та за віком) тісно пов'язані один з одним. Можна спочатку проаналізувати склад Державної Думиу розрізі фракцій

Таблиця 3.20.

за віковими групами, а потім кожну вікову групурозділити на дві підгрупи на підлозі. Іншими словами, при складній розробці присудка явище або об'єкт можуть бути охарактеризовані різною комбінацією ознак, що їх формують.

У всіх випадках дослідник при побудові статистичних таблиць повинен керуватися оптимальним співвідношенням показників присудка.

Основні правила побудови та аналіз статистичних таблиць

Статистичні таблиці як наочного і компактного подання цифрової інформації мають статистично правильно оформлені. Існують такі основні прийоми, що визначають техніку формування статистичних таблиць.

  • 1. Цифровий матеріал необхідно викладати таким чином, щоб при аналізі таблиці сутність явища розкривалася читанням рядків зліва направо та зверху донизу.
  • 2. Заголовок таблиці та назви граф та рядків повинні бути чіткими, лаконічними, являти собою закінчене ціле, що органічно вписується у зміст тексту. У назві таблиці повинні знайти відображення об'єкт, ознака, час та місце скоєння події.
  • 3. Інформація, що міститься в стовпцях (графах) таблиці, завершується підсумковим рядком.
  • 4. Якщо назви окремих граф повторюються між собою, містять терміни, що повторюються, або несуть єдине смислове навантаження, то необхідно їм привласнити об'єднуючий заголовок.
  • 5. Графи та рядки корисно нумерувати. Графи зліва, заповнені назвою рядків, прийнято позначати великими літерамиалфавіту (А), (Б) і т.д., а всі наступні графи – номерами в порядку зростання.
  • 6. Взаємопов'язані дані, що характеризують одну із сторін аналізованого явища, доцільно розташовувати у сусідніх один з одним графах.
  • 7. Графи та рядки повинні містити одиниці виміру, що відповідають поставленим у належному та присудковому показникам. При цьому використовуються загальноприйняті скороченняодиниць виміру (руб., кВт год і т.д.).
  • 8. Числа доцільніше наскільки можна округляти. Округлення чисел у межах однієї графи чи рядка слід проводити з однаковим ступенем точності.
  • 9. У разі потреби додаткової інформації (роз'яснень до таблиці) можуть надаватися примітки.

Дотримання наведених правил побудови та оформлення статистичних таблиць робить їх основним засобом подання, обробки та узагальнення статистичної інформації про стан та розвиток аналізованих соціально-економічних явищ.

Аналіз статистичних таблиць проводиться у двох напрямках: структурний та змістовний.

Структурний аналіз передбачає розбір будови таблиці та характеристику:

  • сукупності та одиниць спостереження, що формують її;
  • ознак та їх комбінацій, що формують підлягає та присудок таблиці;
  • виду таблиці;
  • розв'язуваних завдань.
  • аналіз окремих груп підлягає за відповідними ознаками присудка;
  • виявлення співвідношень та пропорцій між групами явищ за ознаками;
  • порівняльний аналізі формулювання висновків, встановлення закономірностей та визначення резервів розвитку об'єкта, що вивчається.

Аналіз окремих ознак та груп необхідно починати з вивчення абсолютних величинпотім - пов'язані з ними відносні величини.

Якщо цього вимагають завдання дослідження, аналіз таблиць може бути доповнений розрахунковими відносними і середніми величинами, графіками, діаграмами тощо.

Аналіз даних таблиць проводиться за кожною ознакою окремо, а потім у логіко-економічному поєднанні ознак.

Дотримання правил та послідовності роботи зі статистичними таблицями дозволить досліднику здійснити комплексний науково обґрунтований економіко-статистичний аналіз об'єктів та процесів, що вивчаються.

Питання 10. Вторинна угруповання, методи проведення.

Угруповання - це розчленовування статистичної сукупності, що вивчається, на частини за однією або декількома групувальними ознаками. Правильно проведене угруповання значною мірою забезпечує достовірність всього статистичного дослідження.

Первинне угруповання провадиться на основі сортування первинних вихідних даних.

Групування, побудовані за один і той же період часу, але для різних регіонів або, навпаки, для одного регіону, але за два різні періоди часу, можуть виявитися несумісними через різну кількість виділених груп або неоднаковість меж інтервалів. У такому разі необхідне перегрупування даних за допомогою вторинного угруповання.

Вторинне угруповання - операція з утворення нових груп на основі раніше здійсненого угруповання.

Застосовують два способи утворення нових груп.

1. Найпростіший і найпоширеніший спосіб - зміна (частіше укрупнення) початкових інтервалів.

2. Долеве перегрупування- спосіб полягає в утворенні нових груп на основі закріплення за кожною групою певної частки одиниць сукупності.

приклад.Необхідно провести перегрупування даних, утворивши нові групи з інтервалами до 500, 500 – 1000,1000 – 2000, 2000 – 3000, понад 3000 руб. за даними розподіл контрактів будівельної фірми за величиною прибутку.

Таблиця. Розподіл контрактів будівельної фірми за величиною прибутку¹

У першу нову групу увійде повністю 1-а група контрактів та частина 2-ї групи. Щоб утворити групу до 500 тис. руб., Необхідно від інтервалу 2-ї групи взяти 100 тис. руб. Розмір інтервалу цієї групи становитиме 600 тис. крб. Отже, необхідно взяти від неї 1/6 (100: 600). Аналогічну ж частину в новостворену нову групу треба взяти і від числа контрактів, тобто 20 1/6 - 3 контракти. Тоді в 1-й групі контрактів буде 16 + 3 = 19 контрактів. Другу нову групу утворюють контракти 2-ї групи за вирахуванням віднесених до 1-ї, тобто 20 – 3 = 17 од. У новостворену третю групу увійдуть усі контракти 3-ї групи та частина контрактів 4-ї. Для визначення цієї частини від інтервалу 1800 -3000 (ширина інтервалу дорівнює 1200 тис. руб.) Треба додати до попереднього 200 тис. руб. (Щоб верхня межа інтервалу дорівнювала 2000 руб.). Отже, необхідно взяти частину інтервалу, що дорівнює 200:1200, тобто 1/6. У цій групі 74 контракти, отже, треба взяти 74 (1: 6) = 12 од. До третьої нової групи увійде: 44 Н-12 - 56 контрактів. У новостворену четверту групу увійде: 74 - 12 = 62 договору, що залишилися від колишньої 4-ї групи. П'яту, новостворену групу складуть контракти 5-ї та б-ї колишніх груп: 37 + 9 = 46 контрактів. Техніка перегрупування показана у таблиці.

Поряд з первинним угрупуванням у статистиці знаходить широке застосування вторинне угруповання. в Вторинним угрупуваннямназивають утворення нових груп на основі раніше проведеного угруповання.

Вторинне угруповання використовують для вирішення різних завдань, найважливішими з яких є: 1) освіта на основі угруповань за кількісними ознаками якісно однорідних груп (типів); 2) приведення двох (або більше) угруповань з різними інтервалами до єдиного виду з метою сумісності та аналізу; 3) утворення більш укрупнених груп, у яких ясніше проявляється характер розподілу.

Суть цього прийому полягає в отриманні зіставних даних щодо різних групуваннях, для чого: чисельний складгрупи (з відсотком) фіксується на одному рівні в усіх групуваннях; у всіх групуваннях встановлюється також рівне числогруп та однаковий зміст групових таблиць. Порівняння та зіставлення підлягають не абсолютні показникиза групами, а відносні величини, відсоткові відносини.

Розрізняють два способи вторинного угруповання: 1) шляхом перетворення інтервалів первинного групування (частіше простим укрупненням інтервалів) та 2) шляхом закріплення за кожною групою певної частини одиниць сукупності (часткове перегрупування). З використанням цих способів вторинного угруповання зазвичай припускають, що розподіл ознаки всередині інтервалів буде рівномірним.

Застосування вторинного угруповання для приведення двох угруповань з різними інтервалами до єдиного виду з метою порівняння проілюструємо на прикладі. І тому використовуємо дані первинного групування двох районів за чисельністю працівників тваринництва (табл. 3.7).

Таблиця 3.7. Угруповання господарств двох районів за чисельністю працівників тваринництва

Район I

Район II

групи господарств по

групи господарств по

в підсумку

чисельністю працівників, чол.

в підсумку

Безпосередньо дані угруповань двох районів непорівнянні, оскільки господарства розподілені за групами з різними інтервалами: 20 чол. в районі I та 30 чол. у районі II. Число виділених груп також неоднакове.

Для приведення двох угруповань у порівняний вигляд проведемо вторинне угруповання. З цією метою перегрупуємо матеріали до груп, єдиних для обох районів: візьмемо інтервал 40 чол. (Табл. 3.8).

Оскільки є можливість вторинне угруповання господарств району І здійснити способом простого укрупнення інтервалів (має місце збіг нижніх та верхніх інтервалів у двох групуваннях), використовуємо цей спосіб для вирішення поставленого завдання.

Пояснимо послідовність розрахунків. У першу групу господарств із чисельністю працівників до 160 чол. увійдуть господарства І та ІІ груп.

Таблиця 3.8. Вторинне угруповання господарств двох районів за чисельністю працівників тваринництва

Питома вага господарств цих груп загалом становитиме 16% (4+12). До другої групи господарств із чисельністю працівників від 160 до 200 чол. увійдуть господарства III та IV груп їх питома вагазагалом становитиме 45% (18+27). Аналогічно виконуються розрахунки під час освіти інших груп.

Перегрупуємо господарства району ІІ. Оскільки укрупнення інтервалів для господарств району II не підходить і завдання не вирішує, використовуємо спосіб часткового перегрупування даних первинного групування.

У першу, заново створену групу господарств району ІІ з чисельністю працівників тваринництва до 160 осіб, повністю увійдуть господарства первинного групування з таким самим інтервалом. Питома вага господарств цієї групи становить 8%.

До другої групи господарств вторинного угруповання з чисельністю працівників від 160 до 200 чол. повністю увійдуть господарства ІІ групи (16%) та частина господарств ІІІ групи. Для визначення частини господарств, яку потрібно взяти з ІІІ групи, необхідно її розчленувати на підгрупи з чисельністю працівників 190 – 200, 200 – 210, 210 – 220 чол. Показники частки господарств у цих підгрупах визначаються пропорційно розподілу величини інтервалу. Розмір інтервалу, яку ми розглядаємо, становить 30 чол. і поділяється на три рівні частини. Для отримання потрібного інтервалу 160 – 200 чол. до величини інтервалу ІІ групи (160 - 190 чол.) слід додати одну третину величини інтервалу ІІІ групи (190 - 220 чол.) і таку ж частину господарств цієї групи.

Отже, в іншу, новостворену групу господарств, увійдуть 16% господарств другої групи та одна третина III групи – 10% (1/3-30), що становитиме 26% загальної чисельності господарств району II.

У III групу господарств вторинного угруповання (200 - 240 чол.) увійде частина господарств III групи (190 - 220 чол.), що залишилася, - 20% (%-30) та дві третини господарств IV групи (220 - 250 чол.) - 14% (%-21), тобто 34% усієї чисельності господарств району ІІ.

Аналогічні розрахунки виконуються і за освіті інших, заново створених груп господарств: 240 - 280 і більше 280 чол. Як би у табл. 3.7 поряд з даними про питому вагу господарств за групами були наведені дані про їх чисельність, то розрахунки у новостворених групах виконувались у тих же співвідношеннях, що й за питомою вагою господарств.

Після вторинного угруповання первинний матеріал стає порівнянним, оскільки двох районів взяті однакові групи за чисельністю працівників. З даних табл. 3.8 видно, що розподіл господарств за чисельністю працівників тваринництва у двох районах суттєво відрізняється: у районі I переважають господарства із чисельністю працівників тваринництва до 200 чол. (61% загальної чисельності господарств), у районі ІІ – господарства з чисельністю працівників тваринництва – понад 200 чол. (66% від загальної чисельності господарств).

Розподіл сукупності на групи, однорідні у тому чи іншому відношенні, пов'язані з такими діями, як систематизація, типологія, класифікація, угруповання. Традиційно такий розподіл виконують за такою схемою: з множини ознак, що описують явище, вибирають групувальні, а потім сукупність ділять на групи та підгрупи відповідно до значень цих ознак.

У кожному конкретному дослідженні вирішуються три питання:

1) що взяти за основу угруповання;

2) скільки груп, позицій необхідно виділити;

3) як поділити групи.

Основою угруповання може бути будь-яка атрибутивна або кількісна ознака, що має градації.

Проміжок змін (область існування) ознаки статистичної сукупності

(R=хmах - xmin)

прийнято називати розмахом варіації. Сукупність значень ознаки статистичної сукупності, що належать окремому проміжку, прийнято називати групою Орієнтовно оптимальна кількість груп визначається формулою, рекомендованою американським статистиком Стерджесом

K=1+3.322LgN

де К - число груп (інтервалів); N – обсяг статистичної сукупності.

Формула Стерджесса придатна за умови, що розподіл одиниць сукупності за даною ознакою наближається до нормальної, і при цьому застосовують рівні інтервали в групах. Щоб отримати групи, адекватні дійсності, необхідно керуватися сутністю явища, що вивчається (процесу).

Інтервали є каркасом угруповання. Насправді їх утворюють, дотримуючись трьох формальних принципів: рівності інтервалів, кратності інтервалів, рівності частот. Кількість груп і величина інтервалу пов'язані між собою: що більше утворено груп, то менше інтервал, і навпаки. Кількість груп залежить від кількості одиниць об'єкта, що обстежується, і ступеня коливання групувального ознаки.

Інтервали можуть бути рівніі нерівні. Нерівні інтервали використовуються, якщо діапазон варіації ознаки занадто широкий та розподіл значень нерівномірний. Формуються вони на основі принципу кратності, коли ширина кожного наступного інтервалу в раз більше (менше) попереднього. Рівні інтервали доцільно застосовувати у тих випадках, коли варіація проявляється у порівняно вузьких межах та розподіл є практично рівномірним. Для угруповань з рівними інтерваламивеличина інтервалу

Порівнянність статистичних угруповань. Вторинне угруповання

Іноді виникає необхідність проведення вторинних угруповань – утворення нових груп на основі раніше здійсненого угруповання. Така необхідність може виникнути, якщо наявні угруповання не задовольняють вимогам аналізованого (несуставні через різного числавиділених груп або різних меж інтервалів). Отримання нових груп на основі наявних можливо двома способами перегрупування: об'єднанням початкових інтервалів (шляхом їх укрупнення) та пайової перегрупування (на основі закріплення за кожною групою певної частки одиниць сукупності).

Приклад:

Таблиця 2 - Розподіл співробітників підприємства і рівнем доходу

Зробимо перегрупування даних, утворивши нові трупи з інтервалами до 5, 5-10,10-20,20-30, понад 30 тис. руб. До першої нової групи увійде повністю перша група співробітників та частина другої групи. Щоб утворити групу до 5 тис. руб., Необхідно від інтервалу групи взяти 1,0 тис. руб. Розмір інтервалу цієї групи становить 6,0 тис. крб. Отже, необхідно взяти від неї 1/6 (1,0:6,0) частину. Аналогічну частину треба взяти від числа працівників, тобто. . У першій групі кількість працюючих: 16 +3 = 20 осіб. Другу нову групу утворюють діючі другої групи з відрахуванням віднесених до першої, тобто 20-3=17-чел. До новоствореної третьої групи увійдуть всі співробітники третьої групи і частина співробітників, четвертої. Для визначення цієї частини від інтервалу 18-30 (ширина інтервалу дорівнює 12) потрібно додати до попереднього 2,0 (щоб верхня межа інтервалу дорівнювала 2,0 тис. руб.). Отже, необхідно взяти частину інтервалу, рівну . У цій групі 74 особи, отже, треба взяти 74х(1:6)=12 чол. До нової третьої групи увійдуть 44+12 = 56 чол. У новостворену четверту групу увійдуть 74-12 = 62 чол., Що залишилися від колишньої четвертої групи. П'яту новостворену групу складуть працюючі п'ятої та шостої колишніх груп: 37 +9 = 46 чол. В результаті отримаємо такі нові групи:

Таблиця 3 – Нове угруповання

4 Закріплення знань _______

1 У чому полягає процес угруповання

2 Перерахуйте та охарактеризуйте основні види угруповань

3 Інтервал. Види та формула

4 Формула Стерджесу

5 Перегрупування

5 Видача домашнього завдання ______

Повторити пройдений матеріал

Підбиття підсумків заняття


План заняття №(7) 4

з навчальної дисципліни «Статистика»

Група Дата
Е2-1
Зм2-5

Тема заняттяЗведення статистичних даних. Угруповання та перегрупування даних

Метод угруповань.

Тип заняттяурок удосконалення знань

Вид заняттяурок-практична робота №1

Дидактичні цілі

Освітні

знають поняття угруповання, види, цілі та завдання, порядок проведення угруповання, вміють проводити угруповання, перегрупування статистичних даних

Розвиваючі

класифікують різні видиугруповань, формулюють висновки за результатами проведеного угруповання

Виховують

сприяють формуванню професійної культури.

Міжпредметні зв'язки:

Забезпечуючі дисципліни:АФХД

Забезпечувані дисципліни:математика

Методи навчання:практичного навчання

Методичне забезпечення заняття:роздатковий матеріал

Література:

1 Н.В. Товстик Статистика

2 Є.М. Єфімова Статистика

ХІД НАВЧАЛЬНОГО ЗАНЯТТЯ

Організаційний момент

Робота з журналом, рапортом, перевірка готовності групи до уроку

Вивчення нового матеріалу

1 Угруповання- це процес утворення однорідних груп на основі розчленування статистичної сукупності на частини або об'єднання досліджуваних одиниць у приватні сукупності за суттєвими для них ознаками.

Ознаки, якими виробляється розподіл одиниць спостережуваної сукупності групи, називаються групувальними ознаками.

Класифікація угруповань:

Структурне угрупованняхарактеризує склад однорідної сукупності за певними ознаками. Наприклад, склад населення регіону за місцем проживання, за розміром середньодушового доходу, угруповання господарств за обсягом продукції, структура депозитів за термінами їх залучення.

Типологічне угруповання- Це розподіл якісно неоднорідних сукупностей на класи, соціально-економічні типи, однорідні групи. Прикладом може бути угруповання секторів економіки, суб'єктів господарювання за формами власності: державна, федеральна, муніципальна, приватна, змішана.

Аналітичні угрупованняпризначені виявлення залежності між ознаками.

Основою угруповання може бути будь-яка атрибутивна або кількісна ознака.

Сукупність значень ознаки статистичної сукупності, що належать окремому проміжку, називається групою. Орієнтовно оптимальна кількість груп визначається формулою, рекомендованою американським статистиком Стерджесом:

K=1+3.322LgN (1)

де К - число груп (інтервалів);

N – обсяг статистичної сукупності.

Інтервали є каркасом угруповання. Кількість груп і величина інтервалу пов'язані між собою: що більше утворено груп, то менше інтервал, і навпаки. Кількість груп залежить від кількості одиниць об'єкта, що обстежується, і ступеня коливання групувального ознаки.

Інтервали груп можуть бути закритими (коли вказано нижню та верхню межі) та відкритими (коли вказано лише одну межу - верхню або нижню).

де х min , max – мінімальне та максимальне значення ознаки

n – кількість груп

h – щаг інтервалу

Завдання 1

Здійсніть угруповання 30 магазинів одного з регіонів РФ на 1.01.05, застосовуючи спосіб угруповань.

Таблиця 1 - Вихідні дані

Середньооблікова чисельність, Чол. Товарообіг, млн. руб.

Рішення:

В якості групувального ознаки вибираємо товарообіг.

Тепер необхідно утворити 4 групи з рівними інтервалами. Розмір інтервалу визначається за такою формулою:

де h - крок інтервалу

n - кількість груп

Позначимо межі груп:

2100-7350 – 1-а група (2100+5250)

7350-12600 – 2-а група (7350+5250)

12600-17850 - третя група (17850 +5250)

17850-23100 – 4-а група (17850+5250)

Після того, як визначено число груп та групувальну ознаку, необхідно визначити показники, що характеризують групи та їх величини. Показники розносяться групами і підраховуються результати.

Таблиця 2 - Угруповання магазинів за величиною товарообігу

Таблиця 3 - Угруповання магазинів за величиною товарообігу (% до підсумку)

Висновок: З таблиці 3 видно, що переважає група з товарообігом в інтервалі 2100-7350 - 60%.

Провести угруповання комерційних банків одного з регіонів РФ на 1.01.06

Таблиця 4 - Вихідні дані

Номер банку Капітал Робочі активи Статутний капітал
207,7 2,48 1,14
200,3 2,40 1,10
190,2 2,28 1,05
323,0 3,88 1,88
247,1 2,96 1,36
177,7 2,12 0,97
242,5 2,90 1,33
182,9 2,18 0,99
315,6 3,78 1,73
183,2 2,20 1,01
320,2 3,84 1,76
207,3 2,48 1,14
181,0 2,17 0,99
172,4 2,06 0,94
234,3 2,81 1,29
189,5 2,27 1,04
187,7 2,24 1,03
166,9 1,99 0,91
157,7 1,88 0,86
168,3 2,02 0,93
224,4 2,69 1,23
166,5 1,99 0,91
198,5 2,38 1,09
240,4 2,88 1,32
229,3 2,75 1,26
175,2 2,10 0,96
156,8 1,87 0,86
160,1 1,92 0,88
178,7 2,14 0,98
171,6 2,05 0,94

Рішення:

Як групувальну ознаку візьмемо капітал банку.

Утворимо чотири групи банків із різними інтервалами. Величину інтервалу визначаємо за формулою:

де h - крок інтервалу

х max , x min – мінімальне та максимальне значення групувальної ознаки

n - кількість груп

Тепер позначимо межі груп:

1 - я група 156,0-197,8
2 - я група 1297,8-239,6
3 - я група 239,6-281,4
4 - я група 281,4-323,2

Після того, як визначено групувальну ознаку – капітал, крок інтервалу та утворені групи, ми визначимо показники, що характеризують групи та їх величини за кожною групою.

Таблиця 5 – Угруповання комерційних банків за величиною капіталу

Групи банків за величиною капіталу Число банків Капітал Активи Активи, що працюють
156,0-197,8 2699,5 35,48 16,25
197,8-239,6 1501,8 17,99 8,25
239,6-281,4 730,0 8,74 4,01
281,4-323,2 958,8 11,5 5,37
Разом 6157,1 73,71 33,88

Структурне угруповання комерційних банків матиме вигляд:

Таблиця 6 - Угруповання комерційних банків за величиною кариталу (% до підсумку)

Групи банків за величиною капіталу Число банків, % до підсумку Капітал, % до підсумку Активи, % до підсумку Працюючі активи, % до підсумку
156,0-197,8 56,7 48,2 48,1 48,0
197,8-239,6 23,3 24,4 24,4 24,3
239,6-281,4 10,0 11,9 11,9 11,8
281,4-323,2 10,0 15,5 15,6 15,9
Разом

Висновок:

З таблиці 6 видно, що переважно переважають дрібні банки – 56,7 %, їх частку припадає 48,2% капіталу. Великі та середні банки займають по 10%, частка їхнього капіталу склала 15,5 та 11,9 % відповідно.

Закріплення знань

1 У чому значення методу угруповань в аналізі статистичних даних?

2 Що таке угруповання?

3 Види угруповань

4 Охарактеризуйте кожен вид угруповання

5 Поняття інтервалу

6 Види інтервалів

7 Формула інтервалу

4 Видача домашнього завдання

Записати в зошит приклади кількісних та якісних ознак, які можуть бути покладені в основу угруповання для підприємства (3-5 прикладів)

Доробити практичну роботу