Open Library - открытая библиотека учебной информации. Сложные и вторичные группировки

Группировки различают:

  1. Первичные , составленные на основе первичного материала собранного при наблюдениях.
  2. Вторичные , составленные на основе первичных, используется в двух случаях:
    • когда необходимо мелкие формальные группы, переформировать, в более крупные;
    • когда надо дать сравнительную оценку материалов собранных в разных местах и по различным методикам.
Группировка, составленная по двум или более признакам, называется – комбинационной .
Признак, по которому происходит выделение групп или типов явлений, называется группировочным или основанием группировки . Основание может быть количественным или атрибутивным. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).

Пример №1 . Имеются следующие данные о распределении торговых фирм по численности работников двух регионов.


Постройте вторичную группировку данных о распределении фирм, пересчитав данные региона 1 в соответствии с группировкой региона 2. В каком регионе средняя численность работников больше?

Решение:
В первую группу «Менее 5» войдет 4/5 от группы «1-5». Тогда число фирм составит: 6*4/5 = 4,8 ≈ 5.
В группу «5-10» полностью входит группа «6-10» и часть группы «1-5», т.е. число фирма будет равно 4 + (6-5) = 5
В группу «11-20» полностью войдет группа «11-15» и часть группы «16-20», а именно ¼*50 = 12,5 ≈ 13.
В группу «21 -30» полностью входит группа «16-20» и группа «21-25», а группа «более 25». Получаем: (50-13) + 20 + 15 = 72


Находим среднюю численность работников:
Для первого региона.

Средняя взвешенная: x ср = 1960/105 = 18,67

Для второго региона.


Средняя взвешенная: x ср = 3502,5/117 = 29,94
Таким образом, во втором регионе средняя численность работников больше.

Пример №2 .
Распределение рабочих по стажу работы

№ группы Группы рабочих по стажу, лет Число рабочих, чел. Число рабочих в процентах к итогу
I 2-6 6 30,0
II 6-10 6 30,0
III 10-14 5 25,0
IV 14-18 3 15,0
ИТОГО 20 100,0

В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2-6 лет – 30% и от 6-10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.
Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в таблице 2.

Таблица 2 - Группировка рабочих по стажу работы

№ группы Группы рабочих по стажу лет Число рабочих, чел. Средний стаж работы, лет Выработка продукции, руб.
Всего На одного раб.
I 2-6 6 3,25 1335,0 222,5
II 6-10 6 7,26 1613,0 268,8
III 10-14 5 11,95 1351,0 270,2
IV 14-18 3 16,5 965,0 321,6
ИТОГО: 20 8,62 5264 236

Для заполнения таблицы 2. необходимо составить рабочею таблицу 3.

Таблица 3.

№ п/п Группы рабочих по стажу, лет Номер рабочего Стаж Выработка в руб.
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Итого по группе: 6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Итого по группе 6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Итого по группе 5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Итого по группе 3 49,5 965
Всего 20 172.4 5264,0

Разделив графы (4:3); (5:3) табл. 3 получим соответствующие данные для заполнения таблицы 2. Итак далее по всем группам. Заполнив таблицу 2. получим аналитическую таблицу.
Рассчитав рабочую таблицу сверяем итоговые результаты таблицы с данными условия задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проверим еще арифметический контроль.
Анализируя аналитическую таблицу 2, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5 % мы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач такая группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, т.е. к комбинационной. Произведем вторичную группировку данных по средней выработке продукции.
Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего расчеты представлены в таблице 4.

Таблица 4 - Группировка рабочих по стажу и средней выработке продукции

№ п/п Группы рабочих Число раб., чел. Сред. стаж работы, лет Средняя выработка прод., руб.
по стажу по средней выраб. прод. в руб. всего на одного раб.
1 2-6 200,0-250,0 4 2,5 835,0 208,75
Итого по группе 6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
Итого по группе 5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
Итого по группе 3 16,5 965,0 321,6
Итого по группам 200,0-250,0 5 3,0 1065,0 213,0
Всего 20 8,62 5264 263,2

Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп, определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше чем в первоначальной группировке.
Тогда, i=(350-200)/3 = 50 руб.
Больше групп брать нет смысла, будет очень маленький интервал, меньше можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, направить по первой 19, 5 лет делится на число рабочих – 6 человек, получим 3,25 года.
Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.

Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп, с тем чтобы сделать группировку сопоставимой с другими.

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.

Задачи сводки и ее содержание

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.

Статистические сводки различаются по ряду признаков:

    По сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка .Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц.

    По способу разработки сводки делятся нацентрализованные , когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). Придецентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности).

    По технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.

Метод группировки

Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.

Особым видом группировки является классификация . Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).

Отличительные черты классификации:

    В основу кладется качественный признак.

    Они стандартны.

    Они устойчивы.

То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.

    Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные - по качественному признаку и количественные.

Классификация группировочных признаков

По форме выражения

атрибутивные , не имеющие количественного выражения (профессия, образование);

количественные : 1)дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2)непрерывные, значения, которые могут быть как целые, так и дробные.

По характеру колеблемости

альтернативные , которыми одни единицы обладают, а другие нет (качество);

имеющие множество количественных значений

По роли признака во взаимосвязи изучаемых явлений

факторные, воздействуют на другие признаки;

результативные, испытывающие на себе влияние других

Для нахождения числа групп служит формула Стерджесса

п = 1 + 3,322 lgN,

где N-количество элементов совокупности.

Согласно этой формуле, выбор числа групп зависит от объема совокупности.

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (). Он рассчитывается

где - среднее значение признака по совокупности, которое определяется по формуле;

    Е значение варьирующего признака;

    среднее квадратическое отклонение.

Если величина интервала равна 0,5 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если делится на 6 групп, то получаются следующие интервалы:

Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.

После определения числа групп следует определить интервалы группировки.

Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами .

Хмах - Хmin

h= ---------------- ;

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. (0,7; 1,4; 5,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до

Например, Х max = 180, Х min= 80, п= 5.

h= (Хмах - Хmin) / п;

h= (180 - 80) / 5 = 20;

Следовательно получили следующие интервалы

80-100; 100-120; 120-140; 140-160; 160-180.

б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.

в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

г) закрытые , когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).

При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».

Применение зависит от формы написания интервалов, особенно первой и последней групп.

    180 и более - исключительно - 180 входит в последний

    свыше 180 - включительно - 180 входит в предыдущий.

В практике встречаются оба, но предпочтение отдается принципу «исключительно».

Серединное значение интервалов определяется несколькими приемами.

    Суммируем верхнюю и нижнюю границу интервала и делим на 2.

    Середина 2-го интервала плюс величина интервала.

    Середина 2-го интервала минус величина интервала (для открытого).

    К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок

    Типологическая группировка. Суть: Выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Еслиатрибутивный признак , то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основеколичественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0-2; дошкольный 3-6; школьный 7-17; трудоспособный 16-54 для женщин и 16-59 для мужчин.

Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.

Группировка по формам собственности в 1998 г.

    Структурная группировка. Это группировки, используемые для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов.

Группировка населения России по месту проживания

за 1959-1994 гг.

    Аналитическая группировка(факторная). Она используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенности аналитической группировки: во-первых, в основу кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Группировка коммерческих банков России по сумме активов баланса

Группа банков по сумме активов баланса, млн. руб.

Количество банков, единиц

В среднем на один банк

численность занятых, чел.

Балансовая прибыль, млрд.руб.

50000 и более

    Комбинированная группировка. Это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа положенных в их основание признаков делят на:

Простая - это группировка, выполненная по одному признаку.

Сложная группировка производится по двум и более признакам

Вторичная группировка

Вторичной группировкой называется перегруппировка уже сгруппированного материала.

К ней прибегают:

    Когда из большого числа первоначально образованных групп надо получить меньшее число более крупных.

    Когда в целях сравнения нужно привести в сопоставимый вид по-разному сгруппированный материал.

Статистические ряды распределения

Среди простых группировок особо выделяют ряды распределения.

Ряды распределения представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Ряды распределения, образованные по качественным признакам называют атрибутивными.

При группировке ряда по количественному признаку получаются вариационные ряды.

Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота это численность отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.

Например, по атрибутивному признаку.

Например, дискретный ряд.

Количество студентов

В % к итогу

Характер распределения в дискретных рядах изображается графически в виде полигона распределения.

Пример интервального ряда.

Распределение рабочих по выработке

Выработка, т.р.

Число рабочих

Кумулятивная(накопленная) численность

Интервальный ряд распределения графически изображается в виде гистограммы.

В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве . Вариационные ряды с равными интервалами обеспечивают это условие.

Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения , т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

Группы магазинов по размеру товарооборота, т.р.

Число магазинов

Величина интервала, т.р.

Плотность распределения, ед. (1:2)

Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250-450 т.р.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Статистические таблицы

Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными.

К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.

В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми.

При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят и корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называетсясложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»

Применение комбинационных таблиц относятся к более позднему периоду (1882).

К техническим моментам при составлении таблиц относятся:

    Четкость заголовков.

    Указываются единицы измерения в отдельных графах.

    Повторяющиеся термины выносятся в общие заголовки.

    Графы и строки необходимо нумеровать.

    В групповых и комбинационных таблицах всегда надо давать итоговые графы и строки.

    Округление чисел проводится с одинаковой точностью. Когда одна величина превосходит другую многократно, то полученные показатели динамики лучше выражать не в % , а в разах. Например, вместо 586%, следует в 5,9 раз больше.

    В аналитических таблицах значимость абсолютных цифр должна быть наименьшей. Когда интересами исследования предусмотрены многозначные числа, то начиная справа следует выделять миллионы, тыс.ед. Например, 1458946 р., 1 458 946 р. или можно округлять до 2-3 знаков 1,46 млн.р.

    Когда в таблице наряду с отчетными данными приводятся сведения расчетного порядка, то делаются оговорки в виде сносок.

    При неполном объеме изучаемой совокупности или отсутствии исходных данных все слагаемые сначала показывают в строке « общие итоги», а потом после пояснения в строке «в том числе» перечисляются наиболее важные их составные части.

    Отдельные клетки могут быть не заполнены по следующим причинам:

а) «х» - клетка вообще не подлежит заполнению;

б) «...» - отсутствуют сведения;

в) «-» - отсутствует само явление;

г) 0,0 - то при округлении с большей точностью может появиться значащая цифра.

Статистические графики

Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).

Основные элементы графика включают в себя:

    Поле графика - это место, на котором он выполняется. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5 (правило «золотого сечения»). Иногда используется и поле в виде квадрата.

    Графический образ - это символические знаки, с помощью которых изображаются статистические данные.

    Пространственные и масштабные ориентиры. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями. Масштабные ориентиры - придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.

    Экспликация графика - это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.

Наряду с первичным группировкой в статистике находит широкое применение вторичное группировки. в Вторичным группировкой называют образование новых групп на основе ранее проведенной группировки.

Вторичное группировки используют для решения различных задач, важнейшими из которых являются: 1) образование на основе группировок по количественным признакам качественно однородных групп (типов); 2) приведение двух (или более) группировок с различными интервалами к единому виду с целью сопоставимости и анализа; 3) образование более укрупненных групп, в которых яснее проявляется характер распределения.

Суть этого приема заключается в получении сопоставимых данных по различным групуваннях, для чего: численный состав группы (с процентом) фиксируется на одном уровне у всех групуваннях; во всех групуваннях устанавливается также равное число групп и одинаковое содержание групповых таблиц. Сравнению и сопоставлению подлежат не абсолютные показатели по группам, а относительные величины, процентные отношения.

Различают два способа вторичной группировки: 1) путем преобразования интервалов первичного группирования (чаще простым укрупнением интервалов) и 2) путем закрепления за каждой группой определенной части единиц совокупности (частичная перегруппировка). При использовании этих способов вторичного группировки обычно предполагают, что распределение признака внутри интервалов будет равномерным.

Применение вторичного группировки для приведения двух группировок с различными интервалами к единому виду в целях сравнимости проиллюстрируем на следующем примере. Для этого используем данные первичного группирования двух районов по численности работников животноводства (табл. 3.7).

Таблица 3.7. Группировка хозяйств двух районов по численности работников животноводства

Район I

Район II

группы хозяйств по

группы хозяйств по

в итоге

численностью работников, чел.

в итоге

Непосредственно данные группировок двух районов несопоставимы, так как хозяйства распределены по группам с разными интервалами: 20 чел. в районе I и 30 чел. в районе II. Число выделенных групп также неодинаковое.

Для приведения двух группировок в сопоставимый вид проведем вторичную группировку. С этой целью перегрупуємо материалы в группы, единые для обоих районов: возьмем интервал 40 чел. (табл. 3.8).

Поскольку есть возможность вторичное группировка хозяйств района И осуществить способом простого укрупнения интервалов (имеет место совпадение нижних и верхних интервалов в двух групуваннях), используем этот способ для решения поставленной задачи.

Поясним последовательность расчетов. В первую группу хозяйств с численностью работников до 160 чел. войдут хозяйства I и II групп.

Таблица 3.8. Вторичное группировка хозяйств двух районов по численности работников животноводства

Удельный вес хозяйств этих групп в общем итоге составит 16% (4+12). Во вторую группу хозяйств с численностью работников от 160 до 200 чел. войдут хозяйства III и IV групп их удельный вес в общем итоге составит 45% (18+27). Аналогично выполняются расчеты при образовании остальных групп.

Перегрупуємо хозяйства района II. Поскольку укрупнение интервалов для хозяйств района II не подходит и задачи не решает используем способ частичного перегруппировки данных первичного группирования.

В первую, заново созданную группу хозяйств района II с численностью работников животноводства до 160 чел., полностью войдут хозяйства первичного группирования с таким же интервалом. Удельный вес хозяйств этой группы составляет 8%.

Во вторую группу хозяйств вторичного группировки с численностью работников от 160 до 200 чел. полностью войдут хозяйства II группы (16%) и часть хозяйств III группы. Для определения части хозяйств, которую нужно взять из III группы, необходимо ее расчленить на подгруппы с численностью работников 190 - 200, 200 - 210, 210 - 220 чел. Показатели удельного веса хозяйств в этих подгруппах определяются пропорционально делению величины интервала. Величина интервала, которую мы рассматриваем, составляет 30 чел. и делится на три равные части. Для получения нужного интервала 160 - 200 чел. до величины интервала II группы (160 - 190 чел.) следует добавить одну треть величины интервала III группы (190 - 220 чел.) и такую же часть хозяйств этой группы.

Итак, в другую, вновь созданную группу хозяйств, войдут 16% хозяйств второй группы и одна треть III группы - 10% (1/3-30), что составит 26% общей численности хозяйств района II.

В III группу хозяйств вторичного группировки (200 - 240 чел.) войдет часть хозяйств III группы (190 - 220 чел.), что осталась, - 20% (%-30) и две трети хозяйств IV группы (220 - 250 чел.) - 14% (%-21), то есть 34% всей численности хозяйств района II.

Аналогичные расчеты выполняются и при образовании остальных, заново созданных групп хозяйств: 240 - 280 и более 280 чел. Как бы в табл. 3.7 наряду с данными о удельный вес хозяйств по группам были приведены данные об их численности, то расчеты во вновь созданных группах выполнялись бы в тех же соотношениях, что и по удельным весом хозяйств.

После вторичного группировки первичный материал становится сопоставимым, поскольку для двух районов взяты одинаковые группы по численности работников. Из данных табл. 3.8 видно, что распределение хозяйств по численности работников животноводства в двух районах существенно отличается: в районе I преобладают хозяйства с численностью работников животноводства до 200 чел. (61% общей численности хозяйств), в районе II - хозяйства с численностью работников животноводства - свыше 200 чел. (66% общей численности хозяйств).

Вторичная группировка

Вторичная группировка - это образование новых групп на ос­нове ранее произведенной группировки. Применяют два способа об­разования новых групп на основе ранее произведенной группировки.

Первый способ состоит в укрупнении первоначальных интерва­лов. Это наиболее простой и распространенный способ.

Второй способ принято называть методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определœенная до­ля единиц совокупности. Рассмотрим два способа на примере.

Имеется группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы (цифры условные).

Таблица 3.6

Кредитное управление Валютное управление
№ груп­пы Число работ­ников, чел. № группы Размер зарплаты, руб. в мес. Число работ­ников, чел.
2000 - 2500 2000 - 3000
2500 - 3000 3000 - 5000
3000 - 4000 5000 - 7000
4000 - 5000 7000 и более
5000 и более - -
Итого Итого

Приведенные данные не позволяют сравнить распределœение работников по размеру месячной заработной платы, так как величины интервалов различны, в связи с этим крайне важно привести эти ряды распределœения к сопоставимому виду.

Произведем вторичную группировку, образовав группы с новыми укрупненными интервалами.

Таблица 3.7

При вторичной группировке методом долевой перегруппировки устанавливаем новые интервалы распределœения работников по размеру месячной заработной платы, при этом за каждым интервалов закрепляем определœенную долю единиц совокупности. В нашем примере одну из группировок (по кредитному управлению) оставляем без изменений. А по валютному управлению производим перегруппировку следующим образом. В первой группе с интервалом от 2000 до 3000 руб. частота равна 2. Применительно к группировке по кредитному управлению данный интервал крайне важно разбить на два равных интервала: от 2000 до 2500 руб. и от 2500 до 3000 руб., при этом исходная частота делится поровну. Следующий интервал от 3000 до 5000 руб. соответственно нужно разделить на два равных интервала: от 3000 до 4000 руб. и от 4000 до 5000 руб., при этом исходная частота делит­ся поровну (6:2 = 3). Последние две группы крайне важно объединить в одну с интервалом 5000 руб. и выше.

Таблица 3.8

№ группы Размер зарплаты, руб. в мес. Кредитное число управления работников Валютное число управления работников
чел. в % к ито­гу чел. в % к итогу
2000 - 2500 8,33 3,33
2500 - 3000 16,67 3,33
3000 - 4000 25,00 10,00
4000 - 5000 33,33 10,00
5000 и выше 16,67 73,34
Итого 100,00 100,00

Контрольные вопросы

(выберите правильный ответ)

1. Статистическая сводка включает в себя:

а) только подсчет итогов в данных;

б) группировку данных и подсчет итогов;

в) группировку данных, подсчет итогов и расчет обобщаю­щих показателœей.

2. Группировка, в которой изучается структура совокупности, принято называть:

а) типологической; б) структурной; в) аналитической.

3. Группировочный признак может быть:

а) количественный;

б) качественный;

в) и количественный, и качественный.

4. Величина интервала определяется:

а) верхней границей интервала;

б) нижней границей интервала;

в) разностью верхней и нижней границ.

5. Вариационный ряд распределœения строится:

а) по качественному признаку;

б) по количественному признаку.

6. Частоты - это:

а) абсолютные числа;

б) относительные числа.

7. Частости - это:

а) абсолютные числа;

б) относительные числа.

8. В дискретном вариационном ряду значения признака выражены:

а) в виде чисел;

б) в виде интервалов.

9. Интервальный вариационный ряд графически изображается в виде:

а) полигона распределœения;

б) гистограммы;

в) кумуляты.

10. Вторичная группировка осуществляется методом:

а) уменьшения интервалов;

б) укрупнения интервалов;

в) и уменьшения, и укрупнения интервалов;

г) долевой перегруппировки.

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • § Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • § Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Ряды распределения

Группировка может быть построена на основе ряда распределения. В то же время построение рядов может осуществляться на основе группировки. Всестороннее изучение статистического явления наиболее плодотворно, если в его основе лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны явления.

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

Виды рядов распределения:

  • - атрибутивный;
  • - вариационный - дискретный и интервальный.

Иными словами, ряд распределения - результат группировки.

Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и т.д.

Любой ряд, представленный в табличном виде, состоит из двух колонок. В первой колонке указываются значения изучаемого признака (атрибутивные или количественные). Во второй колонке фиксируется число единиц наблюдения, обладающих данным значением. Таким образом, построение вариационного ряда сводится к определению значения признака в каждой классификационной группе и определению количества элементов, попавших в эту группу.

Каждое индивидуальное значение признака в ряду распределения называется вариантой.

Количество элементов в каждой классификационной группе или количество элементов в совокупности с данной вариантой называется частотой, или, иначе, число единиц наблюдения, содержащееся в каждой отдельной группе, принято называть частотой ряда распределения.

Удельный вес данной группы в совокупности называется частостью. Частость или структура, показывает долю совокупности данной классификационной группы.

Частость - отношение частоты к общему количеству исследуемых элементов, то есть объему совокупности.

Частоту обозначим n или f , частость - p или j.

Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.