Опубликован: 13.05.2017 | Доступ: свободный | Студентов: 1694 / 784 | Длительность: 13:46:00
Специальности: Менеджер, Экономист
Лекция 3:

Сводка и группировка статистических данных

< Лекция 2 || Лекция 3: 123 || Лекция 4 >

3.2. Метод группировок в статистике

Под статистической группировкой понимается распределение единиц наблюдения по группам по одному или нескольким признакам. Эти признаки называются группировочными. В зависимости от задач исследования строят типологические, структурные и аналитические группировки.

Типологическая группировка представляет собой распределение единиц наблюдения качественно неоднородной совокупности по социально-экономическим типам, классам, качественно однородным группам. Например, распределение совокупности предприятий по формам собственности (табл. 3.1); отраслям экономики; размеру бизнеса - малые, средние и крупные предприятия (отнесение к ним идет сразу по нескольким критериям); банков - на государственные и коммерческие и т.д. Основная задача типологической группировки - идентификация и описание типов исследуемого явления. Число выделяемых групп определяется количеством типов, классов, однородных групп, т.д. самим характером явления.

Таблица 3.1. Распределение предприятий и организаций по формам собственности на 1 января 2006 г.
Форма собственности Число предприятий и организаций, тыс.
Государственная 160
Муниципальная 252
Собственность общественных и религиозных объединений (организаций) 252
Частная 3 838
Прочие формы собственности, включая смешанную российскую, иностранную, совместную российскую и иностранную 265
Всего 4 767

Источник: Россия в цифрах. 2006: Крат. стат. сб. / Росстат. М., 2006. С. 167.

При структурной группировке разделение единиц однородной совокупности на группы происходит с целью выявления ее структуры по одному из признаков. Например, распределение наемных работников по полу, возрасту; распределение предприятий по численности работающих и т.д. Примером структурной группировки являются данные табл. 3.2.

Таблица 3.2. Структура работников по стажу работы на предприятии
Стаж работы, лет Число работников Число работников в процентах к итогу
До 2 10 5
2-4 20 10
4-6 30 15
6-8 80 40
8 и более 60 30
Итого 200 100

Важную роль в статистическом анализе играют аналитические группировки. С их помощью определяют наличие связи между признаками и ее направление. При этом один из признаков является результативным, а другой - факторным. Результативный признак меняется под воздействием факторного признака.

При построении аналитической группировки в качестве группировочного признака всегда выбирают факторный признак. В каждой выделенной группе рассчитывают среднее значение результативного признака. Например, в табл. 3.3 компании сгруппированы по величине затрат на рекламу. В каждой группе определен средний размер товарооборота. Из таблицы видно, что чем больше внимания компании уделяют рекламе, тем значительнее результаты их деятельности, выражающиеся в объеме товарооборота.

Таблица 3.3. Распределение компаний по затратам на рекламу и объему товарооборота
Затраты на рекламу в год, млн руб. Число компаний Объем товарооборота в среднем на одну компанию, млн руб.
До 3 5 300
3-5 20 305
5-7 15 315
7 и более 10 320
Итого 50 311

Связь между признаками называется прямой, если с ростом значений факторного признака увеличиваются значения результативного признака. Связь является обратной, если увеличение значений факторного признака приводит к уменьшению значений результативного признака. В нашем примере рост затрат на рекламу вызвал увеличение объемов товарооборота, значит между этими признаками наблюдается прямая связь.

Наряду с группировками в статистическом анализе используются классификации. Классификация - это общепринятое, традиционно применяемое, часто официально установленное разбиение совокупности на группы, являющееся определенным стандартом, при котором единицам наблюдения предъявляются строгие требования относительно их соответствия той или иной группе. В основе классификаций лежит качественный признак. К наиболее известным относятся классификации отраслей экономики, административно-территориального деления, экономических регионов, видов экономической деятельности и др. Классификации не являются чем-то стабильным, в соответствии с экономическими и политическими изменениями меняются и они.

В зависимости от количества признаков, по которым проводится группировка, различают простые и сложные группировки. Если группировка проводится по одному признаку, то она называется простой (см. табл. 3.1, 3.2). Если единицы совокупности группируются сразу по двум или более признакам, то такая группировка называется сложной. При этом внутри групп, образованных по одному признаку, единицы совокупности подразделяются на подгруппы по другому признаку. Примером сложной группировки является группировка учащихся на потоке по двум признакам - полу и возрасту. Ее результаты могут быть представлены в виде таблицы (табл. 3.4).

Таблица 3.4. Распределение учащихся на потоке по полу и возрасту
Возраст, лет Пол Итого
мужчины женщины
До 14 10 8 18
15 8 9 17
16 12 13 25
17 и более 11 10 21
Итого 41 40 81

Вторичная группировка данных. На практике часто возникают ситуации, когда по имеющимся сгруппированным данным требуется построить новую группировку. При этом, как правило, массив первичных данных оказывается недоступным. Тогда прибегают к методам вторичной группировки данных.

Вторичной группировкой называется перегруппировка уже сгруппированных данных без обращения к массиву первичных данных. Для этой цели применяются два подхода: объединение первоначальных интервалов, если границы новых и старых групп совпадают, и долевая перегруппировка данных при несовпадении границ.

Метод объединения первоначальных интервалов продемонстрируем на следующем примере. Предположим, что исходные данные представляют собой ряд, приведенный в табл. 3.5.

Таблица 3.5. Распределение работников фирмы по размеру заработной платы
Номер интервала Заработная плата, руб. Численность работающих, чел.
1 2 000-3 000 16
2 3 000-4 000 40
3 4 000-5 000 65
4 5 000-6 000 58
5 6 000-7 000 44
6 7 000 и выше 17
Итого - 240

Перегруппируем данные и образуем новые интервалы: "2000-4000", "4000-6000", "6000 и выше". Поскольку границы новых и старых интервалов совпадают, легко видеть, что в первый новый интервал "2000-4000" попадут работники первого и второго интервалов исходной группировки (16 + 40 = 56 чел.), во второй новый интервал - работники третьего и четвертого интервалов исходной группировки (65 + 58 = 123 чел.), в третий новый интервал - работники двух последних интервалов (44 + 17 = 61 чел.). Результаты перегруппировки представлены в табл. 3.6.

Таблица 3.6. Распределение работников фирмы по размеру заработной платы (вторичная группировка)
Номер интервала Заработная плата, руб. Численность работающих, чел.
1 2 000-4 000 56
2 4 000-6 000 123
3 6 000 и выше 61
Итого - 240

Долевая перегруппировка базируется на принципе равномерности распределения единиц наблюдения внутри границ интервальных групп. В результате ее проведения рассчитывают, какая часть единиц наблюдения перейдет из старой интервальной группы в новую.

Пример 3.1. "Перегруппируем данные табл. 3.5 и образуем новые интервалы: "2000-3400"; "3400-4800"; "4800-6200"; "6200 и выше". Распределим единицы совокупности по новым интервалам.

В первый новый интервал войдут из исходной группировки все единицы первого интервала и часть единиц из второго интервала. Эту часть мы определяем следующим образом. Новая граница "3400" разбивает второй интервал на два отрезка: "3000-3400" и "3400-4000". Находим, какую долю составляет длина отрезка "3000-3400" от длины второго интервала. Она равна Значит, от 40 единиц, находившихся во втором интервале исходной группировки, следует взять для нового первого интервала 16 единиц Тогда первый новый интервал будет содержать 32 единицы (16 + 16).

Во второй новый интервал войдут оставшиеся от второго интервала исходной группировки 24 единицы (40 - 16) и часть единиц из третьего интервала. Для этого мы находим, какую долю составляет отрезок "4000-4800" от длины третьего интервала "4000-5000". Она равна Значит, от 65 единиц следует взять для второго нового интервала 52 единицы Итак, второй интервал новой группировки будет содержать 76 единиц (24 + 52).

В третий интервал вторичной группировки войдут оставшиеся 13 единиц (65 - 52 = 13) третьего интервала исходной группировки, все единицы ее четвертого интервала (58 ед.) и 9 единиц пятого интервала

В последний интервал новой группировки войдут оставшиеся 35 единиц (44 - 9 = 35) пятого интервала и все 17 единиц последнего интервала, т.е. 52 единицы (35 + 17).

При проверке правильности расчетов видим, что сумма единиц совокупности осталась равной 240.

Результаты вторичной группировки приведены в следующей таблице.

Таблица 3.7. Распределение работников фирм по размеру заработной платы
Номер интервала Заработная плата, руб. Численность работающих, чел.
1 2 000-3 000 32
2 3 000-4 800 76
3 4 800-6 200 80
4 6 200 и выше 52
Итого - 240
< Лекция 2 || Лекция 3: 123 || Лекция 4 >
Юрий Насакин
Юрий Насакин

Мне нужно изучить математическую статистику с нуля для обработки данных на компьютере. Читаю уже вторую лекцию, но пока ничего даже отдалённо близкого к моей цели не нахожу. Есть ли математическая статистика в дальнейших лекциях? Или я зря теряю время на изучение этого курса? У меня крайне ограниченный временной срок - я не могу терять время на самостоятельную проверку моего вопроса посредством изучения данного курса.

Альмира Мукашева
Альмира Мукашева

Какие документы еще необходимы что бы получить удостоверение?