Статистическая сводка и группировка. Статистический ряд распределения. Примеры решения задач. Понятие статистических рядов распределения и их виды

Статистический ряд распределения - упорядоченное распределение единиц совокупности на группы по определенному признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивным (качественным) признакам, называются атрибутивными (распределение населения по полу, занятости, национальности, профессии и т.д.).

Ряды распределения, построенные по количественному признаку, называются вариационными (распределение населения по возрасту, рабочих – по стажу работы, зарплате и т.д.). Вариационные ряды распределения состоят из двух элементов: вариантов и частот. Варианты – отдельные значения признака, которые он принимает в ряду. Частоты – это численность отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности. Частости – это частоты, выраженные в долях единиц или в % к итогу.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения, на дискретных признаках, представленных в виде интервалов. Интервальные вариационные ряды основаны на непрерывных признаках (имеющих любые значения, даже дробные).

7. Табличное и графическое представление статистических данных.

Результаты сводки и группировки излагаются в виде таблиц. Таблица – рациональная, наглядная и компактная форма стат.материала.

Статистическая таблица – таблица, содержащая результаты подсчета практических данных и является итогом сводки первоначальной информации.

Таблица характеризует совокупность по одному или нескольким признакам, взаимосвязанным логикой.

Статистическая таблица имеет свое подлежащее и сказуемое. Подлежащее – объект, характеризующийся цифрами. Сказуемое таблицы - система показателей.

Таблицы бывают простые и сложные. В простой таблице дается простой перечень объектов. Сложная таблица содержит группировку единиц совокупности одновременно по 2-м и более признакам. Таблица д/б компактной, заголовки краткими, информация в столбцах и графах должна завершаться итоговой строкой. Графы и строки должны иметь единицы измерения, затем необходимо провести четную и логическую проверку таблицы.

Статистический график – чертеж, на котором стат.совокупности, характеризуемые определенными показателями описываются с помощью условных геометрических образов или знаков. При построении графика необходимо соблюдать требования: наглядность, выразительность, понятность. Поле графика – часть плоскости, где расположены графические образы. Виды графиков: линейные, столбиковые, полосовые, круговые, секторные, фигурные, точечные, объемные, применяются диаграммы и стат.карты. Картограмма – схематическая географическая карта, на которой выделены отрасли промышленности или структура состава населения.

Статистическое измерение, методы сплошного и выборочного наблюдения социально-экономических явлений и процессов, статистические группировки, методы обработки и анализа статистической информации.

Статистическое наблюдение – это планомерный, научно организованный и как правило систематический сбор данных о явлениях и процессах общественной жизни путём регистрации заранее намеченных существенных признаков с целью получения в дальнейшем обобщающих характеристик этих явлений и процессов. На основе наблюдения делаются выводы о тех или иных психических процессах. Различают два вида наблюдения - сплошное и выборочное.Сплошным называют наблюдение, когда фиксируются все особенности и проявления психической деятельности человека в течение какого-то определенного периода. В отличие от этого при выборочном наблюдении обращается внимание только на те факты в поведении человека, которые имеют прямое или косвенное отношение к изучаемому вопросу.

Выборочное наблюдение является одним из наиболее широко применяемых видов несплошного наблюдения. В основе выборочного наблюдения лежит идея о том, что отобранная в случайном порядке некоторая часть единиц может представлять всю изучаемую совокупность явления по интересующим исследователя признакам. Целью выборочного наблюдения является получение информации для определения сводных обобщающих характеристик всей изучаемой генеральной совокупности.

Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Признаки, по которым проводится группировка, называют группировочными признаками . Группировочный признак иногда называют основанием группировки . Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.). Система способов, приемов, с помощью которых статистика исследует массовые явления, образует статистическую методологию. Ее специфика заключается в том, что все основные методические приемы используются по мере выполнения задач трех последовательных стадий (этапов) статистического исследования:
I. Статистического наблюдения;
II. сводки и группировки первичных статистических данных;
III. научной обработки и анализа статистической информации.
Содержание работы первого этапа предполагает использование метода массовых наблюдений, которые есть не что иное, как сбор первичной статистической информации.
На втором этапе собранная информация при помощи метода статистических группировок определенным способом обобщается и распределяется.
На третьем этапе с помощью метода обобщающих показателей осуществляется анализ статистической информации.

Организационные формы и виды статистического наблюдения. Способы статистического наблюдения. Виды группировок, их применение в статистике. Группировочные признаки, их обоснование и выбор. Определение числа групп и величины интервала.

К основным организационным формам статистического наблюдения относят: отчетность и специально организованное наблюдение.

Отчетность – это форма статистического наблюдения, при которой в соответствующие статистические органы поступают в определенные сроки сведения от предприятий и организация, которые осуществляют экономическую деятельность. Сведения должны подаваться в установленном законом порядке отчетных документов.

Органами государственной статистики утверждаются формы статистической отчетности.

В коммерческой деятельности отчетность подразделяется на:

1) общегосударственную – обязательна для всех организаций и представляется в сводном виде в органы государственной статистики;

2) внутриведомственную – эта отчетность действует в пределах ведомств и министерств. Существуют следующие формы отчетности:

1) типовой называют отчетность, которая содержит показатели, одинаковые для всех предприятий, учреждений различных организационных форм, а также для иных видов деятельности

2) если предприятие имеет свои определенные особенности, то в эту организацию вводится специализированная отчетность;

3) отчетность, предоставляемая каждым предприятием в одинаковые промежутки времени, называется периодической;

4) отчетность, которая поступает в органы статистики по мере необходимости, называется единовременной отчетностью. Каждая организация вправе выбирать, по какому способу ей предоставить отчетные данные.

Виды статистического наблюдения:

1) если обследованию подвергается абсолютно все единицы изучаемой совокупности явлений и процессов, то это сплошное статистическое наблюдение;

2) если обследованию подвергаются часть единиц изучаемой совокупности явлений, то это несплошное статистическое наблюдение;

3) выборочным наблюдением называют наблюдение, при котором характеристика всей совокупности фактов дается по некоторой их части, отобранной в случайном порядке;

4) монографическое обследование – это детальное изучение и описание определенных единиц совокупности;

5) если обследованию подвергается та часть единиц совокупности, у которой величина изучаемого признака является преобладающей во всем объеме, то это называетсяметодом основного массива;

6) сбор данных, основанный на добровольном заполнении адресатами анкет, называетсяанкетным обследованием;

7) если наблюдение ведется непрерывно, и при этом все факты и явления, происходящие в состоянии изменения, регистрируются, то это наблюдение называется текущим;

8) если же наблюдение осуществляется нерегулярно, но только тогда, когда требуется, это наблюдение называется единовременным;

9) периодическим называется наблюдение, которое повторяется через определенные промежутки времени (год, месяц, квартал и т. д.).

В зависимости от источников собираемых сведений различают:

1) наблюдение, осуществляемое самими регистраторами путем замера и с помощью осмотра, подсчета и взвешивания признаков изучаемого объекта, называется непосредственным;

2) опрос – это наблюдение, при котором ответы человека на вопросы фиксируются на определенном формуляре;

3) при документальном учете фактов источником сведений служат документы.

Предоставление предприятиями, организациями статистических отчетов о своей хозяйственной деятельности в строго установленном порядке называют отчетным способом. Вид статистического наблюдения, предполагающий предоставление сведений в органы, которые и ведут наблюдение, в явочном порядке называют явочным способом.

Если сведения в органы предоставляют корреспонденты, то этот способ называют корреспондентским.(1) Типологические группировки

Их задача – выявление социально-экономических типов или однородных в существенном отношении групп.

(2) Структурные группировки

Их задача – изучение состава отдельных типических групп при помощи объединения единиц совокупности, близких друг к другу по величине группировочного признака.

(3) Аналитические группировки

Их задача – выявления влияния одних признаков на другие (выявить связь между социально-экономическими явлениями).

(4) Комбинационные группировки

В них производится разделение совокупности на группы по двум или более признакам. При этом группы, образованные по одному признаку, разбиваются на подгруппы по другому признаку.

Такие группировки дают возможность изучить структуру совокупности по нескольким признакам одновременно.Группировочный признак - признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы. Для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.

Первичная группировка - непосредственная группировка данных статистического наблюдения. Вторичная группировка - это перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:

1) ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;

2) для сравнения данных, относящихся к различным периодам времени или к различным территориям, если первичная группировка была произведена по разным группировочным признакам или по разным интервалам.

Существуют два способа вторичной группировки: объединение мелких групп, а более крупные и выделение определённой доли единиц совокупности.

Основные задачи, решаемые с помощью группировок:

1) выделение в совокупности изучаемых явлений их социально-экономических типов;

2) изучение структуры общественных явлений;

3) выявление связей и зависимостей между общественными явлениями.

Для определения оптимального числа групп применяется формула Стерджесса: , где n – число групп; N – число единиц совокупности. n округляют до целого числа. После определения числа групп следует определить интервалы группировки. Интервал – это значения варьирующего признака, лежащие в определённых границах. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нём. Величина (ширина) интервала представляет собой разность между верхней и нижней границами интервала. Интервалы группировки в зависимости от их величины бывают равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величину равного интервала определяют по формуле: , где и – максимальное и минимальное значения признака Открытые – это интервалы, у которых указана только одна граница: верхняя – у первого интервала, нижняя – у последнего. Ширина открытого интервала принимается равной ширине смежного с ним интервала. Закрытыми называются интервалы, у которых обозначены обе границы. При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки выступает непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Т.о., верхняя граница i-го интервала равна нижней границе i+1-го интервала. При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Обычно нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно». Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1. Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах.

Статистические ряды распределения, их виды. Основные характеристики рядов распределения.

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным(распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Графически ряды распределения изображаются в виде:
1) гистограмма – график, по которому интервальный вариационный ряд изображается в виде смежных друг с другом столбиков. (По оси Ох – границы интервалов, по Оу – частота интервала).
2) полигон распределения – график, на котором график распределения изображается в виде линейной диаграммы. (По Ох – значение варьируемого признака, по Оу – частота).
3) кумулята – график, на котором по Ох – значения варьируемого признака или верхние границы интервалов, а по Оу – накопленные частоты.
4) огива – а) график, на котором по Ох – значения варьируемого
признака, по Оу – частость признака;
б) график, на котором по Ох – накопленная частота, по Оу
– значения варьируемого признака. В вариационных рядах существует определенная связь в изменении частот и значений варьирующего признака: с увеличением варьирующего признака величина частот вначале возрастает до определенной величины, а затем уменьшается. Такого рода изменения называются закономерностями распределения.
Важные свойства кривой распределения – это степень ее асимметрии, высоко– или низковершинность, которые в совокупности характеризуют форму или тип кривой распределения.
Важная задача – это определение формы кривой.
Характер общего распределения предполагает оценку степени его однородности и вычисление показателей асимметрии и эксцесса.
Симметричным называют распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой.
Для симметричных распределений средняя арифметическая, мода и медиана равны между собой.
Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка.
Общим является нормальное распределение, которое может быть представлено графически в виде симметричной куполообразной кривой.
Куполообразная форма кривой показывает, что большинство значений концентрируется вокруг центра измерения, и в действительно симметричном одновершинном распределении средняя, мода и медиана совпадут.
Закон нормального распределения предполагает, что отклонение от среднего значения является результатом большого количества мелких отклонений, что позитивные и негативные отклонения равновероятны и что наиболее вероятным значением всех в равной мере надежных измерений является их арифметическая средняя.
Теоретической кривой распределения называют кривую распределения, которая выражает общую закономерность данного типа.
В кривой нормального распределения отражается закономерность, которая возникает при взаимодействии множества случайных причин.
Для симметричных распределений рассчитывается показатель эксцесса (островершинности).
Эксцесс – выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.
Оценка показателей асимметрии и эксцесса дает возможность сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения.

Виды абсолютных величин, единицы измерения и способы получения. Относительные величины, их виды, способы расчета. Относительные величины планового задания, структуры, динамики, интенсивности, координации, сравнения и методы их исчисления и анализа.

Абсолютные величины бывают экономически простыми (численность магазинов, работников) и экономически сложными (объем товарооборота, размер основных фондов). Абсолютные величины – всегда числа именованные, имеют определенную размерность, единицы измерения. В статистической науке применяются натуральные, денежные (стоимостные) и трудовые единицы измерения. Единицы измерения называют натуральными, если они будут соответствовать потребительским или природным свойствам предмета, товара и будут выражены в физических весах, мерах длины и т. п. В статистической практике натуральные единицы измерения могут быть составными. Применяют условно-натуральные единицы измерения при суммировании количества разнородных товаров, продуктов. Абсолютные величины используют в практике торговли, применяют в анализе и прогнозировании коммерческой деятельности. На основе этих величин в коммерческой деятельности составляют хозяйственные договоры, оценивают объем спроса на конкретные изделия и т. д. Абсолютными величинами измеряются все стороны общественной жизни. Абсолютные величины по способу выражения размеров изучаемых процессов подразделяются на: индивидуальные и суммарные, они в свою очередь относятся к одному из видов обобщающих величин. Размеры количественных признаков у каждой статистической единицы характеризуют индивидуальные абсолютные величины, а также они являются базой при статистической сводке для соединения отдельных единиц статистического объекта в группы. На их основе получают абсолютные величины, в которых можно выделить показатели объема признаков совокупности и показатели численности совокупности.

Относительные величины – это показатель, который представляет собой частное от деления двух статистических величин и характеризует количественное соотношение между ними. Для расчета относительных величин в числитель ставится сравниваемый показатель, который будет отражать изучаемое явление а в знаменателе отражается показатель, с которым и будет производиться это сравнение, он является основанием или базой для сравнения. База сравнения – это своеобразный измеритель. Основание имеет результат отношения в зависимости от количественного (числового) значения, который выражается в: коэффициенте, процентах, промилле или децимилле.

Если база сравнения принимается за единицу, то относительная величина является коэффициентом и показывает, во сколько раз изучаемая величина больше основания. Если базу сравнения принять за 100%, то результат вычисления относительной величины будет выражен в процентах.

Если базу сравнения принимают за 1000, то результат сравнения выражается в промилле (%0). Относительные величины могут быть выражены и децимилле, если основание отношения равно 10 000.

В зависимости от цели статистического исследования относительные величины подразделяются на следующие виды: выполнение договорных обязательств; относительные величины, характеризующие структуру совокупности; относительные величины динамики; сравнения; координации; относительные величины интенсивности.

Относительные показатели планового задания (ОППЗ) используются для перспективного планирования деятельности субъекта финансово–хозяйственной сферы и т.д.

ОППЗ рассчитывается следующей формулой:

Относительные величины структуры– это показатели, характеризующие долю от состава изучаемых совокупностей. Относительная величина структуры определяется отношением абсолютной величины отдельного элемента статистической совокупности к абсолютной величине всей совокупности, т. е. как отношение части к общему (целому), и характеризует удельный вес части в целом, в форме процента.

Относительные величины динамики характеризуют изменение изучаемого явления во времени, выявляют направление развития, измеряют интенсивность развития. Рассчитывается относительная величина динамики как отношение уровня признака в определенный период или момент времени к уровню того же признака в предшествующий период или момент времени, т. е характеризует изменение уровня определенного явления во времени. Относительные величины динамики называются темпами роста:

Именованные величины выражаются в относительных величинах интенсивности:

Относительная величина интенсивности = абсолютная величина изучаемого явления / абсолютная величина, характеризующая объем среды, в которой распространяется явление

Относительные показатели координации (ОПК) – это соотношение одной части совокупности к другой части этой же совокупности:

ОПК = уровень, характеризующий i – ую часть совокупности / уровень, характеризующий часть совокупности, выбранную в качестве базы сравнения

Средняя в статистике, ее сущность и условия применения. Виды и формы средней. Средняя простая и взвешенная. Веса средних, их выбор. Расчет средних по данным вариационного ряда распределения.

Средняя величина - это обобщающая количественная характеристика совокупности однотипных явлений по одному варьирующему признаку. В экономической практике используется широкий круг показателей, вычисленных в виде средних величин. Важнейшее свойство средней величины заключается в том, что она представляет значение определенного признака во всей совокупности одним числом, несмотря на количественные различия его у отдельных единиц совокупности, и выражает то общее, что присуще всем единицам изучаемой совокупности. Таким образом, через характеристику единицы совокупности она характеризует всю совокупность в целом. Важнейшим условием научного использования средних величин в статистическом анализе общественных явлений является однородность совокупности, для которой исчисляется средняя. Качественная однородность совокупности определяется на основе всестороннего теоретического анализа сущности явления. Так, например, при исчислении средней урожайности требуется, чтобы исходные данные относились к одной и той же культуре (средняя урожайность пшеницы) или группе культур (средняя урожайность зерновых). Нельзя вычислять среднюю для разнородных культур. Средние, полученные для неоднородных совокупностей, будут искажать характер изучаемого общественного явления, фальсифицировать его, или будут бессмысленными. Еще одним важным условием применения средних величин в анализе является достаточное количество единиц в совокупности, по которой рассчитывается среднее значение признака. Достаточность анализируемых единиц обеспечивается корректным определением границ исследуемой совокупности, т.е. закладывается еще на начальном этапе статистического исследования. Данное условие становится решающим при применении выборочного наблюдения, когда необходимо обеспечить репрезентативность выборки.

Определение максимального и минимального значения признака в изучаемой совокупности также является условием применения средней величины в анализе. В случае больших отклонений между крайними значениями и средней, необходимо проверить принадлежность экстремумов к исследуемой совокупности. Если сильная изменчивость признака вызвана случайными, кратковременными факторами, то, возможно, крайние значения не характерны для совокупности. Следовательно, их следует исключить из анализа, т.к. они оказывают влияние на размер средней величины. Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней, определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное, позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др. В статистике выделяют несколько видов средних величин:

1. По наличию признака-веса: а) невзвешенная средняя величина; б) взвешенная средняя величина.

2. По форме расчета: а) средняя арифметическая величина; б) средняя гармоническая величина;

в) средняя геометрическая величина; г) средняя квадратическая, кубическая и т.д. величины.

3. По охвату совокупности: а) групповая средняя величина; б) общая средняя величина. При расчете средних величин появилось понятие “вес ”. В качестве веса будет выступать стоимость основных производственных фондов и нормируемых оборотных средств, то есть понятие веса и частоты не всегда совпадают.

На практике из массы признаков необходимо выбрать один, который следует использовать в качестве веса. Выбор веса не следует понимать так, что всякий раз может быть несколько вариантов взвешивания. Вопрос должен быть решен таким образом, чтобы в результате взвешивания был бы обеспечен возврат к тем величинам, которые играли роль числителя при исчислении средней величины. Следовательно, при взвешивании средних величин в качестве весов должен быть взят знаменатель дроби, ибо только при умножении на то, на что раньше делили, мы вернемся к первоначальной величине.

Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f). Наряду со средними величинами в качестве статистических характеристик вариационных рядов распределения рассчитываются структурные средние – мода и медиана.
Мода (Mo) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины ∑|x i - Me|=min.

7.Структурные средние: мода, медиана, квартили и децили.

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле:

где х0 – нижняя граница интервала;

h – величина интервала;

fm – частота интервала;

fm-1 – частота предшествующего интервала;

fm+1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:

Где х0 – нижняя граница интервала; h – величина интервала;

fm – частота интервала; f – число членов ряда; Sm- 1 – сумма накопленных членов ряда, предшествующих данному. Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на четыре равные части, а децили – на десять равных частей. Квартилей насчитывается три, а децилей – девять. Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристика–ми статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака.

8.Показатели вариации признака: размах вариации, среднее квадратическое отклонение, коэффициент вариации.

Для характеристики степени однородности изучаемой совокупности, степени колеблемости индивидуальных знаний признака от средней по всей совокупности применяются так называемые показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и коэффициент вариации. Размах вариации - это разность между максимальным и минимальным значением признака по данной совокупности. Показывает лишь разницу между максимальным и минимальным значением изучаемого признака, не касаясь степени колеблемости (варьирования) признаков остальных единиц совокупности. Среднее линейное отклонение - это средняя арифметическая, полученная из абсолютных отклонений индивидуальных значений признака от средней арифметической по всей совокупности. Среднее квадратичное отклонение определяется путем извлечения корня квадратного, из суммы квадратов линейных отклонений, поделенных число индивидуальных значений признаков изучаемой совокупности. Коэффициент вариации:процентное отношение среднего квадратичного отклонения к средней арифметической.

В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения.

Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Различают атрибутивные и вариационные ряды распределения.

Атрибутивный – это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах – в виде долей, удельных весов, представленных в процентах к итогу.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

В интервальном вариационном ряде распределения группиро–вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

Вариационные ряды состоят из двух элементов: частоты и варианты.

Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота – это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

Плотность распределения – это отношение числа единиц совокупности к ширине интервала.

2. Графическое изображение рядов распределения

Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.

Полигон – ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У – частоты.

Гладкая кривая, соединяющая точки – это эмпирическая плотность распределения.

Кумулята – ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У – накопленные частоты.

Для дискретных рядов на оси откладываются сами значения признака, а для интервальных – середины интервалов.

На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.

3. Статистические таблицы

В виде статистических таблиц оформляются результаты сводки и группировки материалов наблюдения.

Статистическая таблица – это особый способ краткой и наглядной записи сведений об изучаемых общественных явлениях. Статистическая таблица позволяет охватить материалы статистической сводки в целом, она также является системой мыслей об исследуемом объекте, излагаемых цифрами на основе определенного порядка в расположении систематизированной информации.

По внешнему виду статистическая таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали – графы (столбцы, колонки), которые в совокупности составляют как бы скелет таблицы.

В образовавшиеся внутри таблицы клетки записывается информация. Составленную таблицу принято называть макетом таблицы, в котором мысленно определяются в деталях цель обследования, объем разработки материалов сводки.

Статистическая таблица имеет свое подлежащее и сказуемое. Подлежащее таблицы показывает, о каком явлении идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым таблицы называются числовые показатели, с помощью которых характеризуется объект, т. е. подлежащее таблицы.

Показатели, образующие подлежащее, располагают в левой части таблицы, а показатели, составляющие сказуемое, помещают справа.

Составленная и оформленная статистическая таблица должна иметь общий, боковые и верхние заголовки. Общий заголовок обычно располагается над таблицей и выражает ее основное содержание. Помещенные слева боковые заголовки раскрывают содержание строк подлежащего, а верхние – вертикальных граф (сказуемого таблицы),

В коммерческой деятельности разрабатываются и составляются различные статистические таблицы, которые в зависимости от построения подлежащего делятся на три вида: перечневые, групповые и комбинационные.

Простые таблицы не содержат в подлежащем систематизации изучаемых единиц статистической совокупности.

По характеру представляемого материала эти таблицы бывают собственно перечневые, территориальные и хронологические.

Простая таблица в подлежащем содержит перечисление единиц изучаемой совокупности.

Сведения простой таблицы применяют и для оценки изменения какого–либо явления во времени. Хронологическую таблицу можно составлять за любые по величине отрезки времени или на моменты, отстоящие друг от друга по времени на различную длину Таблицы, в подлежащем которых приводится перечень территорий (районов, областей и т. п.), называются перечневыми территориальными.

Групповые статистические таблицы дают более информативный материал для анализа изучаемых явлений благодаря образованным в их подлежащем группам по существенному признаку или выявлению связи между рядом показателей.

Комбинационными называют статистические таблицы, которые имеют в подлежащем группировку по двум или более группи–ровочным признакам, связанным между собой.

С помощью групповых и комбинационных таблиц можно изучать состав явлений, а также связь и зависимость числовых показателей сказуемого от группировочных признаков подлежащего.

Комбинационная таблица устанавливает взаимное действие на результативные признаки (показатели) и существующую связь между факторами группировки.

Одними из ответственных моментов построения статистических таблиц являются разработка сказуемого, определение его содержания, правильное установление связи между группировоч–ными признаками и показателями, их характеризующими.

Сказуемое, находясь во взаимосвязи с подлежащим таблицы должно быть построено так, чтобы с помощью системы его показателей можно было получить полную характеристику выделенных групп, охватить их существенные черты.

Сказуемое статистических таблиц бывает простым и сложным. При простой разработке показатели сказуемого располагаются последовательно один за другим. Распределяя показатели на группы по одному или нескольким признакам в определенном сочетании, получают сложное сказуемое.

4. Основные правила составления таблиц

Таблица должна быть составлена компактно, т. е. быть небольшой по размеру и легко обозримой.

Общий заголовок таблицы должен кратко выражать ее основное содержание. В нем стараются указать время, территорию, к которым относятся данные, единицы измерения, если они выступают едиными для всей совокупности.

Строки подлежащего и графы сказуемого располагают в виде частных слагаемых с последующим подытоживанием по каждому из них.

Для удобства анализа таблицы при большом числе строк подлежащего и граф сказуемого возникает потребность в нумерации тех из них, которые заполняются данными.

При заполнении таблиц нужно использовать следующие условные обозначения: при отсутствии явления пишется (-) прочерк, если нет информации о явлении, ставится многоточие (…) или пишется: «нет сведений».

Одинаковая степень точности, обязательная для всех чисел, обеспечивается соблюдением правил их округления (от 0,1 до 0,01 и т. д.). Когда одна величина превосходит другую многократно, полученные показатели динамики лучше выражать не в процентах (%), а в разах.

Если в таблице с отчетными данными приводятся сведения расчетного порядка, то нужно сделать соответствующую оговорку.

Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения, например: чел., руб. и т. д. Если графы имеют единую единицу измерения, то она выносится в заголовок таблицы.

Для удобной работы с цифровым материалом числа в таблицах следует расставлять в середине граф, одно под другим: единицы под единицами, запятая под запятой и т. д., четко соблюдая при этом их разрядность.

В таблицу можно включать примечания, в которых будут указываться источники данных, более подробное содержание показателей и другие необходимые пояснения.

В наше время необходимо научиться составлять и пользоваться статистическими таблицами.

Для того чтобы проанализировать данные, которые содержит таблица, необходимо прежде ознакомиться с названием таблицы заголовками ее граф и строк, установить, на какую дату и к какой территории относятся зафиксированные в таблице статистические данные, обратить внимание на единицы измерения и установить, какие процессы характеризуются средними и относительными величинами.

Анализ статистической таблицы логичнее начинать с общего итога, который позволяет получить общую характеристику совокупности, затем переходить к изучению данных отдельных строк и граф, т. е. к оценке частей изучаемого объекта, исследуя при этом вначале наиболее важные, а потом уже и все остальные элементы таблицы.

Наиболее простым способом обобщения статистического материала является построение рядов. Результатом сводки статистического исследования могут быть ряды распределения.

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.

Ряд распределния является одним из видов группировок.

Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.

  1. Виды рядов распределения

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

    атрибутивными называют ряды распределения, построенные по качественными признакам;

    вариационными называют ряды распределения, построенные в порядке возрастания или убывания значений количественного признака.

Вариационный ряд распределения состоит из двух столбцов. В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются. Дискретная варианта - выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд. Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

    частоты - это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака; сумма всех частот должна быть равна численности единиц всей совокупности;

    частости - это частоты выраженные в процентах к итогу; сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Вариационный ряд характеризуется двумя элементами: вариантой (Х) и частотой (f). Варианта – это отдельное значение признака отдельной единицы или группы совокупности. Число, показывающее, сколько раз встречается то или иное значение признака, называется частотой. Если частота выражена относительным числом, то она называется частостью.

Вариационный ряд может быть:

    интервальным, когда определены границы «от» и «до», интервальные ряды распределения можно представить графически в виде гистограммы;

    дискретным, когда изучаемый признак характеризуется определенным числом.

  1. Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:

    полигона;

    гистограммы;

    кумуляты;

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) - частоты или частости.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат - накопленные частоты или частости.

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака - на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат - накопленные значения доли (в процентах) по объему признака.

Тема 9. Ряды распределения

Статистические ряды распределения – это первичная характеристика массовой статистической совокупности, упорядоченное разложение единиц изучаемой совокупности на группы по группировочному признаку. Любой статистический ряд распределения состоит из двух элементов:

1) отдельных значений варьирующего признака (вариантов );

2) величин, которые показывают, сколько раз повторяется данная варианта (частот ).

Примечание . Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями ; это численность ряда распределения выражается суммой частот .

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.). Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным . Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда :

1) ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака; ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются; другие формы вариационного ряда - групповые таблицы , составленные по характеру вариации значений изучаемого признака;

2) дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением, между которыми нет промежуточных значений (дискретные признаки - тарифный разряд, количество детей в семье, число работников на предприятии и т.д.); эти признаки могут принимать только конечное число определенных значений;

Дискретный ряд представляет собой групповую таблицу , которая состоит из двух граф: в первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака;

3) если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный ряд (с равными или неравными интервалами).

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота). Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение. Частоты ряда f могут заменяться частностями w , выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме (9.1):



(9.1)

При построении вариационного ряда с интервальными значениями, прежде всего, необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп n (9.2):

где R = x max - x min ; n = 1 + 3,322 lgN(формула Стерджесса ); N - общее число единиц совокупности.

Интервальные вариационные ряды могут быть построены и для признаков с дискретной вариацией. Нередко в статистическом исследовании указывать отдельное значение дискретного признака нецелесообразно, т.к. это, как правило, затрудняет рассмотрение вариации признака. Поэтому возможные дискретные значения признака распределяются по группам и подсчитываются соответствующие им частоты (частности). При построении интервального ряда по дискретному признаку границы смежных интервалов не повторяют друг друга: следующий интервал начинается со следующего по порядку (после верхнего значения предыдущего интервала) дискретного значения признака.

При сравнении частот ряда с неравными интервалами для характеристики их наполненности рассчитывают плотность распределения. Средняя плотность в интервале – это частное от деления частоты и частности на величину интервала. В первом случае плотность абсолютная, во втором – относительная. Средняя плотность показывает, сколько единиц или их процентов приходится на единицу измерения варианты. Частота, частность, плотность и накопленная частота – это различные функции от величины варианты.

В процессе анализа статистических данных , представленных рядами распределения, кроме знания о характере распределения (или структуре совокупности) могут вычисляться различные статистические показатели (числовые характеристики), которые в обобщенном виде отражают особенности распределения изучаемых признаков. Эти характеристики (показатели) могут быть разделены на 3 основные группы

1) характеристики центра распределения (средняя, мода, медиана);

2) характеристики степени вариации (вариационный размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации);

3) характеристики формы (типа) распределения (показатели эксцесса и асимметрии, ранговые характеристики, кривые распределения).

Наиболее надежный путь выявления закономерности распределения состоит в следующем:
1) увеличить количество наблюдаемых случаев (в соответствии с законом больших чисел, в таких рядах случайные отклонения от общей закономерности у индивидуальных значений будут взаимно погашаться);

2) первоначально совокупность разбить на максимальное возможное число групп, затем, постепенно сокращая число групп, оптимизировать группировку с точки зрения выявления закономерности распределения.

При реализации такого подхода закономерность, характерная для данного распределения будет выступать все более и более ясно, а ломаная линия, изображающая полигон, будет приближаться к некоторой плавной линии и в пределе должна превратиться в кривую линию.