Краткий конспект лекций по статистике

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ПРОФЕССИОНАЛЬНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
МОСКОВСКОЙ ОБЛАСТИ
"КОЛЛЕДЖ "ПОДМОСКОВЬЕ"
Краткий конспект лекций по статистике
2017 г.
2
Выполнил преподаватель
__________О.В. Морозова
Пояснительная записка
Методическая разработка содержит краткий конспект лекций по
важнейшим темам дисциплины «Статистика». Лекции имеют проблемный
характер и направлены на получение обучающимися новых знаний в процессе
решения проблемных задач. Каждый раздел содержит задания для
самостоятельной работы.
Методическая разработка предназначена для обучающихся по
специальности 38.02.03 Операционная деятельность в логистике, 38.02.01
Экономика и бухгалтерский учёт (в отраслях) дневной, заочной и
дистанционной форм обучения.
3
Оглавление
Тема 1 Предмет и метод статистики…………………………………………….4
Тема 2 Статистические наблюдения…………………………………………….6
Тема 3 Сводка и группировка статистических данных………………………..8
Тема 4 Способы наглядного представления статистических данных……....10
Тема 5 Абсолютные и относительные величины……………………………...15
Тема 6 Ряды динамики…………………………………………………………..18
Тема 7 Средние величины…………………………………………………...….20
Тема 8 Показатели вариации……………………………………………………24
Тема 9 Индексы………………………………………………………………….27
Тема 10 Корреляционно-регрессивный анализ………………………………..32
Вопросы для подготовки к экзамену…………………………………………...37
4
Тема 1 Предмет и метод статистики
1.1 Понятие статистики
Статистика возникла и развивалась в результате появления и роста необходимости
управления жизнью общества. Слово «статистика» происходит от латинского status, что
означает «состояние». Статистика как наука возникла в 17 веке, однако сбор числовых
данных начался в глубокой древности. Так, в Китае, еще за 5 тыс. лет до н.э., проводилась
перепись населения, в Древнем Риме велся учет имущества граждан. Данные такого учета
использовались, в частности, в целях налогообложения.
Сегодня статистика представляет собой систему научных дисциплин, в которую
входят: теория статистики, экономическая статистика, социальная статистика,
математическая статистика.
Предмет статистики – количественная сторона изучаемых явлений в конкретных
условиях места и времени.
Задача статистики – используя систему показателей, дать обещающую
характеристику изучаемого явления. Для изучения явлений статистика пользуется
специальными методами, которые соответствуют трем стадиям процесса статистического
исследования:
1. Сбор первичной информации. Осуществляется методом массового статистического
наблюдения, обеспечивающего полноту, представительность информации.
2. Сводка и обработка первичной информации. Осуществляется методом
статистической группировки.
3. Анализ статистической информации. Осуществляется на основе применения
обобщающих статистических показателей: абсолютных, относительных, средних
величин, показателей динамики, индексов и т.д. Анализ позволяет раскрыть
причинно-следственные связи между явлениями, влияние и взаимодействие
различных факторов. Оценить эффективность принимаемых решений.
При изучении статистических явлений также применяются табличные и графические
методы.
1.2 Основные категории статистики
Категории науки – это основные понятия.
Статистическая совокупность – множество единиц изучаемого явления,
объединенных общей закономерностью (например, совокупность студентов группы).
Единица совокупности – неделимый элемент совокупности (например, один студент).
Признак – характеристика некоторого свойства единицы совокупности:
 Количественный признак – признак, варианты которого выражены числовыми
значениями (например, возраст, рост, успеваемость студента).
 Атрибутивный признак – признак, варианты которого выражены смысловым
понятием (например, пол студента).
Статистический показатель – характеристика всей совокупности изучаемого
явления (например, количество студентов в группе, средний балл успеваемости).
5
1.3 Государственные органы статистики в Российской Федерации
Основная задача статистики в нашей стране – характеристика социальноэкономических явлений жизни общества в условиях рыночных отношений. Информация о
социально-экономических процессах необходима органам государственной власти для
принятия эффективных управленческих решений.
Главным учетно-статистическим центром России является Федеральная служба
государственной статистики (Росстат). Росстат осуществляет функции по формированию
официальной статистической информации, отражающей экономическое и социальное
развитие страны, а так же контрольные и надзорные функции.
Наряду с общегосударственной статистикой в стране существует и ведомственная статистика,
в задачи которой входит сбор и анализ информации для осуществления руководство предприятиями
и ведомствами.
В целях единого учета предприятий и организаций всех форм собственности в РФ создан
Единый государственный регистр предприятий и организаций (ЕГРПО). В ЕГПРО содержатся
данные по каждому предприятию (организации): наименование, адрес, вид собственности,
организационно-правовая форма, размер уставного фонда, численность работников, балансовая
прибыль и др.
Задание для самостоятельной работы
1. Назовите в качестве примера сферы общественной жизни, изучаемые статистикой.
2. Сформулируйте определение статистики как науки и дайте ему соответствующее
обоснование.
3. Дайте характеристику основным чертам определения предмета статистики:
а) Почему статистика является общественной наукой?
б) Почему статистика изучает количественную сторону общественных явлений в связи с их
качественным содержанием?
в) Почему статистика изучает массовые явления?
г) Почему каждое статистическое исследование должно опираться на изучение всех
относящихся к данному вопросу фактов?
4. К каким видам (количественным или атрибутивным) относятся следующие признаки:
а) количество работников на фирме;
б) родственные связи членов семьи;
в) пол и возраст человека;
г) социальное положение вкладчика Сбербанка;
д) этажность жилых помещений;
е) количество детей в семье;
ж) розничный товарооборот торговых объединений.
5. Определить статистические категории для следующих совокупностей: множество жилых
домой района, множество работников предприятия, множество предприятий малого
бизнеса в России.
Наименование
категории
Множество жилых
домов района
Множество
работников
предприятия
Множество
предприятий малого
бизнеса в России
6
Тема 2 Статистические наблюдения
2.1 Понятие о статистическом наблюдении
Статистическое наблюдение – научно организованная работа по сбору
статистической информации о каких-либо явлениях и процессах с обязательной
регистрацией фактов в специальных учетных документах.
Статистическая информация – первичный статистический материал, который в
дальнейшем подвергнется обработке и анализу.
Требования к статистическому наблюдению:
1. Массовый характер – охват большого числа случаев проявления исследуемого
процесса.
2. Систематичность – проведение исследования через определённые промежутки
времени.
3. Планомерность – наличие специально разработанного плана исследования.
2.2 Формы и виды статистического наблюдения
Существуют две формы организации статистического наблюдения: статистическая
отчетность и специальное статистического обследование.
Статистическая отчетность – такая форма организации сбора данных, при которой
сведения представляют в виде обязательных отчетов в определенные сроки и по
утвержденным формам. Источником сведений при этом являются данные первичных
документов бухгалтерского и оперативного учета, которые все предприятия и организации
представляют в органы статистики. Статистические отчеты могут быть текущими
(квартальными, за месяц, недельными) и годовыми.
Специальное статистическое обследование – сбор сведений о каком-либо явлении
посредством единовременного наблюдения и учета (например, перепись населения).
Специально организованное обследование осуществляется путем опроса, тестирования,
анкетирования, мониторинг и другими методами. При опросе ответы на вопросы
записываются со слов опрашиваемого. При анкетировании сбор данных осуществляется с
помощью специальных вопросников (анкет), как правило, анонимных. Тестирование
предполагает выбор варианта ответа из нескольких предложенных. Мониторинг – это
непрерывное наблюдение за каким-либо явлением.
Виды статистического наблюдения по времени регистрации данных:
 текущее или непрерывное;
 периодическое, повторяющееся через равные промежутки времени;
 единовременное.
Виды наблюдения по степени охвата единиц совокупности:
 сплошное, предполагающее обследование всех без исключения единиц изучаемого
явления;
 несплошное, предполагающее обследование заранее установленной части
изучаемого вяления.
7
Несплошное наблюдение имеет следующие разновидности:
 выборочное наблюдение, при котором характеристика всей совокупности дается по
некоторой ее части, отобранной в случайном порядке;
 наблюдение методом основного массива, при котором характеристика всей
совокупности дается по той ее части, в которой величина изучаемого признака
является преобладающей.
2.3 Организация статистического наблюдения
Организационные вопросы статистического наблюдения включают в себя
определение объекта, места, времени, формы и способа наблюдения. Для проведения
статистического наблюдения разрабатывается план, в котором указываются:
1. Объект наблюдения.
2. Цель наблюдения.
3. Форма наблюдения.
4. Вид наблюдения по времени регистрации данных.
5. Вид наблюдения по степени охвата единиц совокупности.
6. Период наблюдения.
Задание для самостоятельной работы.
1. Провести статистическое наблюдение за совокупностью студентов группы. Составить
план наблюдения и собрать данные по некоторым признакам данной совокупности в
таблицу.
Признаки, характеризующие студентов группы
ФИО
Пол
Возраст
Рост
Успеваемость
Отношение к
учебе
1.
2.
2. Сформулируйте объект, единицу и цель наблюдения и разработайте программу:
а) обследования детских садов;
б) обследования фирм, выпускающих детское питание;
в) обследование автозаправочных станций.
3. Сформулируйте вопросы для включения их в формуляр наблюдения по следующим
признакам объектов наблюдения:
а) количество работников на фирме;
б) численный состав семьи;
в) родственные связи членов семьи;
г) пол и возраст человека.
4. Торговая фирма «Эльдорадо» поручает вам разработать бланк анкетного опроса
покупателей с целью изучения контингента, посещающего фирму, удовлетворения их
спроса и затрат времени на приобретение необходимой аудио и видео техники. Укажите, к
какому виду относится данное наблюдение по времени, охвату и способу получения
данных.
8
Тема 3 Сводка и группировка статистических данных
3.1 Сущность статистической сводки и группировки
На первой стадии исследования получают информацию, представляющею собой
большое количество первичных разрозненных сведений об отдельных единицах
совокупности (например, при переписи населения страны указывается пол,
национальность, возраст и т.д. каждого гражданина). Собранные данные необходимо
привести в определённый порядок. С это целью на второй стадии исследования составляют
статистическую сводку.
Статистическая сводка – это научно организованная обработка материалов
наблюдения, включающая в себя систематизацию, группировку данных, составление
таблиц, подсчётов итогов.
Сводка является простой, если в ней только подсчитываются итоги.
Сводка является групповой, если предполагают группировку данных.
Статистическая группировка – это объединение отдельных однородных по какомулибо признаку единиц совокупности в группы.
Признак, по которому единицы совокупности распределяются на группы, называется
группировочным.
3.2 Статистические ряды распределения
Результаты группировки материалов наблюдения оформляются в виде статистических
рядов распределения.
Статистический ряд распределения – упорядоченное распределение единиц
изучаемой совокупности на группы по группированному признаку.
В зависимости от признака различают атрибутивные (качественные) и вариационные
(количественные) ряды распределения. Ряды, построенные по качественному признаку,
называются атрибутивными, а по количественному признаку – вариационными.
Вариационные ряды распределения, в свою очередь, могут быть дискретными
(прерывными) и интервальными (непрерывными). В дискретных рядах распределения
значение признака выражено целым числом, в интервальных рядах – в виде интервала.
Вариационный ряд распределения состоит из 2-х элементов: варианты (x) и частоты (f).
Варианты называется значение варьирующего признака.
Частотами называют числа, показывающие число раз повторения вариант.
Сумма частот равно объему совокупности.
Объем совокупности (N) – это общее число единиц совокупности.
Частоты, выраженные в виде относительных величин (в долях единиц или процентах),
называются частостями.
Сумма частостей равна 100% или 1.
9
3.3 Построение вариационного интервального ря да распределения
Если варианты исследуемого группировочного признака повторяются недостаточно
часто, а объем совокупности значителен, то целесообразно варианты признака (x) записать
в виде интервалов. Для этого следует:
1. Ранжировать значения группировочного признака, т.е. расположить их в порядке
возрастания.
2. Определить количество групп, на которые следует разбить изучаемую совокупность.
Оптимальное число групп (p) определяется по формуле Стерджесса:
P = 1+ 3,222lgN,
где N – объем совокупности.
3. Определить длину интервала i.
I = (xmin – xmax)/p,
где xmin, xmax– наименьшее и наибольшее значения признака соответственно.
4. Построить вариационный интервальный ряд распределив, отразив результаты
группировки в таблице:
Варианты (x)
Частоты (f)
%
Задания для самостоятельной работы
1. Построить вариационный дискретный ряд распределения студентов группы по
признаку «возраст».
Возраст
Распределение студентов группы по признаку «возраст»
Количество чел.
%
2. Построить вариационный дискретный ряд распределения студентов группы по
признаку «отношение к учебе».
Распределение студентов группы по признаку «отношение к учёбе».
Отношение к учебе
Количество чел.
%
3. Построить атрибутивный ряд распределения студентов группы по признаку «пол».
Пол
Распределение студентов по признаку «пол»
Количество чел.
%
4. Построить вариационный интервальный ряд распределения студентов группы по
признаку «успеваемость».
5. Построить вариационный ряд распределения студентов группы по признаку «рост»
(проблемное задание; частично-поисковый метод).
10
Тема 4 Способы наглядного представления статистических
данных
4.1 Статистические таблицы
Результаты группировки и сводки материалов наблюдения могут оформляться в виде
таблиц. Каждая таблица имеет подлежащие и сказуемое.
Подлежащим в статистической таблице называется объект, которому дается
характеристика. Это то, о чем говорится в таблице. Обычно подлежащим является
наименование признака (x).
Сказуемое статистической таблицы представляют собой систему показателей,
характеризующих подлежащие. Это то, что говорится о подлежащем. Сказуемое всегда
имеет числовое выражение, обычно им является частота повторения признака (f).
Правила заполнения статистических таблиц:
1. Таблица должна иметь наименование и нумерацию.
2. Графы (заголовки сказуемого) и строки (заголовки подлежащего) таблицы должны
иметь наименование и быть пронумерованы.
3. В случае отсутствия сведения в какой-либо строке или графе ставить прочерк.
4. Граф и строки должны содержать единицы измерения, при этом используются
общепринятые сокращения (чел., руб., кВт и т.д.). Если графы имеют одну единицы
измерения, то она выносится в заголовок таблицы.
5. Таблица должна быть замкнутой, т.е. иметь итоги.
4.2 Статистические графики
Для большей наглядности статистической материал может быть представлен в виде
графиков. Статистический график – это чертеж, на котором при помощи условных
геометрических линий, символов и фигур отражена статистическая информация.
В статистическом графике различают следующие основные элементы:
 поле;
 графический образ;
 пространственные и масштабные ориентиры;
 экспликация.
Поле графика – пространство, на котором он располагается. Поле графика
характеризуется его формами (размерами и пропорциями сторон). Оптимальным для
восприятия является график, выполняемый на поле прямоугольной формы с
соотношениями сторон т 1:1,2 до 1:1,5. Такое соотношение называется правилом «золотого
сечения».
Графический образ – символические знаки, с помощью которых отображаются
статистические данные: линии, точки, геометрические фигуры (круг). Одни и те же данные
можно отобразить с помощью разных графических образов.
Пространственные ориентиры определяют размещение графических образов на поле.
В статистических графиках обычно применяется система прямоугольных (декартовых)
координат.
11
Масштабные ориентиры определяют масштаб графика, т.е. меру перевода числовой
величины в графическую.
Масштабной шкалой является линия, отдельные точки которой могут быть прочитаны
как определенные числа. Интервалы между этими точками для равномерной шкалы
одинаковы. Масштабом равномерной шкалы является длина отрезка, принятого за единицу
и измеренного в каких-либо мерах.
Если равным числовым интервалам соответствуют неравные графические интервалы и
наоборот, то шкала является неравномерной.
Примерной неравномерной шкалы:
0
10
100
1000
Экспликация – словесное пояснение к графику, содержащие наименования величин,
отложенных по осям абсцисс и ординат. Ось абсцисс – горизонтальная ось прямоугольной
системы координат, ось ординат – вертикальная.
Основными видами статистических графиков являются:
 Картограмма – схематическая карта или план местности, на которой отдельные
территории в зависимости от значения отображаемого показателя обозначаются с
помощью графических символов (например, цветами разной интенсивности);
 Диаграмма – рисунок, на котором статистическая информация представлена с
помощью геометрических фигур или символических знаков. Наиболее часто
используется линейная, столбиковая и круговая (секторная) диаграммы.
Линейная диаграмма – график, на котором отдельные значения результатов
наблюдения соединены непрерывной ломаной линией. Линейную диаграмму
целесообразно использовать для отображения динамики (изменения) какого-либо явления.
В этом случае по оси абсцисс откладываются периоды времени, а по оси ординат – уровни
явления. На одном графике не следует помещать более четырёх кривых.
Пример. Построить линейную диаграмму (рис.1), отображающую динамику численности
населения России на основании следующих данных.
Год
1959
Численность 117,0
населения
млн. чел.
1969
130,0
1979
137,4
1989
147,0
1996
148,3
2008
142,0
12
150
140
130
120
110
100
1959
1969
1979
1989
1996
2008
Рис. 1. Динамика численности населения России.
Частным случаем линейной диаграммы является полигон частот, с помощью которого
изображаются вариационные дискретные распределения. Для построения полигона частот
в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладывать
ранжирование значения варьирующего признака, а по оси ординат – величины частот.
Полученные на пересечении абсцисс и ординат точки соединяются прямыми отрезками, в
результате чего получают ломаную линию, называемую полигоном частот.
Столбиковая диаграмма – это тип диаграммы, где каждое значение показателя
(признака) изображается в виде столбика. Для ее построения также используется
прямоугольная система координат. Ширина столбиков может быть произвольной, но
одинаковой для всех столбиков. Высота отражает уровень показателя.
Столбиковые диаграммы целесообразно применять для сравнения нескольких
показателей (признаков), тогда разные показатели представлены столбиками разного цвета
или штриховки.
Столбиковая диаграмма, применяемая для изображения интервального
вариационного ряда распределения, называется гистограмма. По оси абсцисс
откладывается интервалы, а частоты изображаются прямоугольниками, построенными на
соответствующих интервалах. Высота столбиков должна соответствовать частотам.
Пример. Построить столбиковую диаграмму (рис. 2), отражающую динамику
численности населения России (см. приведенные выше данные).
13
150
147
148,3
142
140
130
130,4
1969
1979
130
120
117
110
1959
1989
1996
2008
Рис. 2. Динамика численности населения России.
Круговая (секторная) диаграмма - это вид диаграммы, в которой площадь круга
принимается за величину всей изучаемой совокупности, а площадь отдельных секторов
соответствует удельному весу ее частей. Такая диаграмма требует подсчёта частостей.
Круговая диаграмма удобна для изображения структуры (состава) явления.
Пример. Построить круговую диаграмму распределения индивидуального дохода на
основании следующих данных: питание - 50% дохода; образование – 20% дохода;
проживание – 30% дохода.
Питание
Образование
Проживаение
Рис. 3. Распределение индивидуального дохода.
14
Задания для самостоятельной работы
1. Оформить в виде таблицы данные о составе работников предприятия по полу
(численном и в процентах): женщины – 20 чел., мужчины – 15 чел.
2. Изобразить равномерные масштабные шкалы с масштабом 50мм, 10 мм, 1 мм (как
правило, масштаб определяется примерной прикидкой возможной длины шкалы).
3. На поле в 20 клеток построить шкалу от 0 до 950 (так как 950 не делится удобно на 20,
округляем до 1000 (1000:20 = 50), т.е. одна клетка равна 50, две – 100).
4. Построить полигон распределения студентов группы по возрасту.
5. Построить столбиковую диаграмму, отражающую распределение студентов по полу.
6. Построить гистограмму, отражающую распределение студентов по успеваемости.
7. Простроить круговую диаграмму распределения студентов по признакам «пол»,
«отношение к учебе», «успеваемость».
15
Тема 5 Абсолютные и относительные величины
5.1 Абсолютные величины
Абсолютные величины – это количественные сведения о каком-либо явлении. Их
получают в результате статистического наблюдения, простой сводки или расчетным путем.
Различают следующие виды абсолютные величин:
- индивидуальные, характеризующие размер количественного признака у отдельных
единиц совокупности (результат статистического наблюдения);
- суммарные, характеризующие суммарный размер количественного показателя
совокупности (результат простой сводки);
- расчетные, характеризующие величину показателя совокупности (результат
расчета).
Абсолютные величины всегда именованы, т.е. имеют единицу измерения. Различают
натуральные (тонны, штуки, метры), стоимостные (рубли) и трудовые (человеко-дни,
человеко-часы) абсолютные величины.
5.2 Относительные величины
Относительные величины рассчитывают, если необходимо выявить структуру явления,
соотношение между отдельными его сторонами, сравнить явления.
Относительная величина (i)– это показатель, который представляет собой частное от
деления одной абсолютного показателя на другой. Величина, с которой производится
сравнение (знаменатель дроби), называется базой сравнения или основанием.
Виды относительных величин:


Относительная величина динамика (i дин);
Относительная величина планового задания (i пл.зад);

Относительная величина выполнения планового задания (iвып.пл.зад);

Относительная величина структуры(iстр);

Относительная величина интенсивности (iинт).
Относительная величина динамики(iдин), или темп роста, характеризует изменения
явления во времени, выражается в процентах. За базу сравнения (знаменатель) принимается
уровень явления в более раннем периоде:
iдин = Уровень показателя, достигнутый в исследуемом периоде 100%
Уровень показателя в базовом периоде
Для расчета i дин используется фактические данные уровней обоих периодов.
Если i дин >100%, то уровень явления увеличился.
16
Относительная величина планового задания(iпл..зад.) характеризует изменение
планового задания: на следующий период по сравнению с фактически достигнутым в
предыдущем периоде (показывает, что запланировано), выражается в процентах. За базу
сравнения (знаменатель) принимается уровень явления, фактически достигнутый в более
раннем периоде:
iпл.зад=
Запланированный уровень следующего периода
100%
Фактически достигнутый уровень настоящего периода
Относительная величина выполнения планового задания (iвып.пл.зад) характеризует
степень выполнения плана, выражается в процентах. За базу сравнения (знаменатель)
принимается уровень явления, запланированный ранее на исследуемый период:
iвып.пл.зад = Фактически достигнутый уровень исследуемого периода
100%
Запланированный уровень исследуемого периода
Относительная величина структуры(iстр) характеризует долю (удельный вес)
отдельной части явления по всем объеме, выражается в процентах. За базу сравнения
принимается объем совокупности
iстр = Число совокупности
100%
Объем совокупности
Пример. Рассчитать относительные величины для филиала №1 и определить его долю
фактическом выпуске продукции в 2016 году. Сформулировать выводы.
Объем выпущенной продукции, млн. руб.
Филиал
предприятия
Филиал № 1
Филиал № 2
Филиал № 3
Итого
Факт 2015 г.
90
80
70
240
План 2016 г.
110
70
100
280
Факт 2016
80
90
110
280
Относительная величина динамики:
Iдин. = Факт2016 : Факт2015= 80:90 *100 = 89%
Вывод: выпуск продукции в 2016г. по сравнению с 2015 г. сократился.
Относительная величина планового задания:
Iпл. зад. = План2016 : Факт2015 = 110:90 *100= 122%
17
Вывод: в 2016 г. запланировано увеличить выпуск продукции по сравнению с 2015 г.
I вып.пл.зад.= Факт2016 : План2016= 80:110*100 = 73%
Вывод: в 2016 г. план выпуска продукции не выполнен.
Относительная величина структуры:
Iстр. = (80: 280) * 100% = 29%
Вывод: удельный вес филиала №1 в общем объеме выпуска продукции на предприятии в
2016 г. составил 29%.
Относительная величина интенсивности (Iинт.)
характеризует
распространения одного явления в другом, измеряется в натуральных единицах.
Iинт. =
степень
Объем одной совокупности
Объем другой совокупности
Пример. Численность населения России – 142 млн. чел., площадь территории России – 17,2
млн. кв. км. Рассчитать плотность населения.
Iинт. = 142: 17,2 = 8,3 чел./кв. км.
Задание для самостоятельной работы
1. Выявить индивидуальные, суммарные и расчетные абсолютные величины для
совокупности студентов группы.
2. Имеются данные о выпуске продукции на фабрике: по плану 2015 г. – 12 млн. руб.;
фактически в 2015 г. – 10 млн. руб.; по плану 2016 г. – 15 млн. руб. Рассчитать
относительные величины. Сформулировать выводы.
3. Дать характеристику структуры группы студентов, определив удельный вес мальчиков в
группе; обучающихся, успевающих на четыре и пять; обучающихся, ответственно
относящихся к учебе.
18
Тема 6 Ряды динамики
6.1 Ряды динамики, их виды
Динамика – изменение явления во времени. Ряд динамики – ряд статистического
показателя. Он характеризует изменение показателя во времени.
Ряд динамики имеет два основных элемента: период времени (t) и значение
показателя (у), или уровень ряда. Различают интервальные и моментальные ряды динамики.
В интервальных рядах динамики уровень характеризует состояние изучаемого явления за
конкретный период времени, в моментальных – на определённые даты (момент времени).
Например, данные о численности населения страны на конец года представляют собой
моментальный ряд динамики.
Путем последовательного суммирования уровней интервального ряда строится ряд
динамики с нарастающими итогами. Суммировать уровни моментальных рядов не следует,
так как в каждом последующем уровне такого ряда содержится полностью или частично
значение предыдущего уровня.
6.2 Показатели, рассчитываемые на основе рядов динамики
Чтобы проанализировать явление во времени, на основе рядов динамики
рассчитывают абсолютные и относительные показатели: абсолютный прирост; темп роста;
темп прироста.
Уровень, с которым приходит сравнение, называется базой сравнения.
Абсолютный прирост (∆) выражается в натуральных единицах и показывает, на
сколько единиц изменился уровень явления по сравнению с базой. Это расчетный
абсолютный показатель.
Абсолютный прирост может быть базисным и цепным.
Абсолютный прирост называется базисным (∆баз), если за базу сравнения принят
какой-либо определённый уровень (чаще начальный):
∆баз= yi-yo,
Где yi - уровень исследуемого периода;
yo– уровень начального периода.
Абсолютный прирост называется цепным (∆цеп), если за базу сравнения принят уровень
предыдущего периода:
∆цеп= yi-yo-1,
где yo-1– уровень предыдущего периода.
Темп роста или относительная величина динамики, показывает во сколько изменился
уровень явления по сравнению с базой, и выражается в процентах или коэффициентах
роста.
Темп роста может быть базисным и цепным.
Темп роста называется базисным (Tр.баз.), если за базу сравнения принят уровень
начального периода:
𝑦𝑖
(𝑇р. баз. ) = 100%.
𝑦𝑜
19
Темп роста называется цепным (Тр.цеп), если за базу сравнению принят уровень
предшествующего периода:
𝑦𝑖
(𝑇р. цеп. ) =
100%.
𝑦𝑖−1
Темп прироста (Тпр) показывает, на сколько процентов изменился уровень роста по
сравнению со 100%.
Темп прироста может быть базисным и цепным:
Тпр. баз.= Тпр. баз(%) – 100%;
Тпр. цеп.= Тпр. цеп(%) – 100%.
Задания для самостоятельной работы
1. По данным о вводе жилой площади по району:
1) Определить тип ряда динамики.
2) Построить ряд с периодом 3 года.
3) Построить ряд нарастающих итогов.
2011г.
100
Ввод жилой площади по району, млн. кв. м
2012г.
2013г.
2014г.
2015г.
98
95
94
96
2016г.
98
2. По данным задания 1 рассчитать базисные и цепные показатели абсолютного прироста и
заполнить таблицу.
Прирост жилой площади по району.
Показатель
2011г.
2012г.
2013г.
2014г.
2015г.
2016г.
∆баз
∆цеп
Примечание.∑∆цеп=∆баз 2016.
3. По данным задания 1 рассчитать базисные и цепные показатели темпов роста для каждого
периода и заполнить таблицу. Сформулировать вывод относительно темпов роста
последнего периода.
Темпы роста ввода жилой площади по району.
Показатель
2011г.
2012г.
2013г.
2014г.
2015г.
2016г.
Тр. баз.
Тр. цеп.
4. По данным задания 1 рассчитать базисные и цепные показатели темпов прироста каждого
периода и заполнить таблицу. Сформулировать вывод относительно темпов прироста
последнего периода.
Темпы прироста ввода жилой площади по району.
Показатель
2011г.
2012г.
2013г.
2014г.
2015г.
2016г.
Тпр. баз.
Тпр. цеп.
20
Тема 7 Средние величины
7.1 Понятие средней величины
Средней величиной называется обобщающей статической показатель, характеризующей
типичный уровень явления. Средняя величина имеет ту же размерность, что и оцениваемый
признак.
Бельгийский статистик А. Кетле считал средние величины основным показателем,
характеризующим явление. Он даже создал теорию «среднего человека» - идеал, к
которому стремится природа.
Множество значений признака (вариант x) можно представить в следующем виде:
Х1, X2,X3….., Xn,
где Х – усредняемый признак;
Хi- Варианты признака Х;
n– число единиц совокупности N.
Средняя величина обозначается X.
Виды средних величин:





cредняя арифметическая;
средняя гармоническая;
средняя геометрическая;
средняя квадратическая;
структурные средние (мода и медиана).
7.2. Средняя арифметическая величина
Различают два вида арифметических средних: простую, или невзвешенную (Xап.пр), и
взвешенную (Xар.взв).
Формулу средней арифметической простой величины целесообразно применять, если
значения вариант не повторяются.
Например, имеются данные о стаже работников малого предприятия: 2;4;5;3;6 (лет).
Определяем средний стаж работы:𝑥 =
Выведем формулу!
2+4+5+3+6
5
= 4 (года).
21
Средняя арифметическая простая
Xар.пр.=
∑Xi
,
N
Где Xi – варианты усредняемого признака;
n – объем совокупности.
Правило. Для вычисления средней арифметической простой величины необходимо сумму
всех значений признака (вариант) разделить на их число (объем совокупности).
Варианты признака могут повторяться. Число раз повторения вариант называется
частотой или весом варианты (f).
Например, стаж работников предприятия 2; 7; 2; 2; 7 (лет). Определяем средний стаж
работы, построив вариационный дискретный ряд распределения.
Стаж, лет (х)
2
7
𝑥=
Количество работников, чел. (f)
3
2
2 ∗ 3 + 7 ∗ 2 6 + 14
=
= 4 (года).
3+2
5
Выведем формулу!
Средняя арифметическая взвешенная
Xап.взв=
∑XiFi
∑Fi
,
где Fi- частота повторений, или вес варианты, ∑Fi = N.
Правило. Для вычисления средней й арифметической взвешенной величины необходимо
сумму произведений повторяющихся вариант признака и частот разделить на сумму частот.
Базой для вычисления средней арифметической простотой величины является
результат статистического наблюдения и простой сводки, средней арифметической
взвешенной величины – вариационный дискретный ряд распределения. Если необходимо
рассчитать среднюю арифметическую величину для интервального ряда распределения, не
обходимо вычислить среднее значение для всех интервалов (Xср) которые буду выбраны в
качестве вариант значений признака (Xi).
7.3 Средняя гармоническая величина
Требуется определить среднюю заработную плату (ЗП) работников на основании
следующих данных.
22
Данные о заработной плате
Категория работников
Рабочие
Служащие
Итого
ЗП работника, тыс. руб. (х)
10
15
Фонд ЗП, тыс. руб. (w)
20
45
65
Как мы видим, приведенная статистическая информация не содержит частот по
отдельным вариантам совокупности, а представлена в виде объема (w=fx). Для определения
средней ЗП рассчитаем частоты повторений каждого варианта ЗП, т.е. количество
работников (f), разделив фонд ЗП на ее размер. Получим 2 и 3. Теперь рассчитаем среднюю
ЗП по формуле Xап.пр:
20 + 45
65
𝑥 = 20 45 =
= 13 (тыс. руб. )
2+3
+
10
15
Выведем формулу!
Средняя гармоническая взвешенная
𝑋гар. взв =
∑𝑤
∑𝑤/𝑥
Правило. Для расчета средней величины применяется формула средней гармонической
взвешенной, если статистическая информация не содержит частот по отдельным
вариантам совокупности, а представлена в виде объемов, куда частота уже входит в виде
сомножителя, и вариант.
Информация может быть задана в виде объемов (w = fx) и частот (f), но не
содержать вариант (x).
Например, требуется рассчитать среднюю заработную плату работников на
основании
следующих данных.
Данные о заработной плате
Категории работников
Рабочие
Служащие
Итого
Решение:
Фонд ЗП, тыс. руб. (w)
20
45
65
20+45
𝑥ср. = 2+3 = 13 тыс. руб.
Выведем формулу!
Средняя гармоническая взвешенная
𝑋гар. взв =
∑𝑤
∑𝑓
Количество человек (f)
2
3
5
23
Правило. Для расчета средней величины применяется формула средней гармонической
взвешенной, если информация задана в виде объемов и частот, но не содержит вариант.
7.4 Средняя геометрическая величина
Средним геометрическим числом называется такое число, которым можно заменить
каждое из данных чисел, чтобы их произведение не изменилось Xn.
Средняя геометрическая величина равно корню степени n из произведения вариант
признака (Xi):
n
Xср. = √𝑋1 ∗ 𝑋2 ∗ … .∗ 𝑋𝑛.
Данная формула используется, в частности, для расчета среднего темпа роста:
𝑇𝑝 = 𝑛√Тр1 ∗ 𝑇𝑝2 ∗ … … . −𝑇𝑝п.
На основе среднего темпа роста можно вычислить средний темп прироста:
Тпр = Тр (%) – 100%.
Пример. Даны значения темпов роста прибыли предприятия за первые пять месяцев года:
100%; 101,9%; 102,8%; 99,1%; 101,8%.
Решение:
Т𝑝 = 5√1,0 ∗ 1,019 ∗ 1,028 ∗ 0.991 ∗ 1,019= 1,011 = 101,1%.
Tпр=101,1% - 100% = 1,1%.
7.5 Структурные средние величины
Для изучения структуры явления применяются структурные средние величины мода
и медиана.
Модой (Мо) называется наиболее часто встречающееся значение признака.
Медианой (Ме) называется значение признака, расположенное в середине
ранжированного ряда. Если число единиц совокупности четное, медианой является среднее
из двух значений, расположенных посередине.
Например, стаж работников предприятия 2; 7; 2; 2; 7 (лет). Значение признака, равно
2, встречается чаще, таким образом, Мо=2.
Чтобы определить медиану, составим ранжированный ряд:
2, 2, 2, 7, 7.
Ме = 2.
Распределение совокупности по какому-либо признаку является нормальным, если
значения средней величины, моды и медианы совпадают или близки.
Задания для самостоятельной работы
1. Определить средний рост студентов группы по данным интервального ряда
распределения.
2. Выявить «среднего человека» в группе, рассчитав средние значения по всем признакам.
3. Определить среднюю цену товара по следующим данным:
24
Цена, руб.
8
18
Выручка, руб.
120
180
300
4. Записать задачу 3 так, чтобы в условии имелись данные о выручке (w) и количестве
продаж (f). По этим данным определить среднюю цену товара.
5. Выявить признаки, по которым распределение студентов группы является нормальным.
Являются ли нормальными распределения студентов по признакам «успеваемость» и
«отношение к учебе»?
Тема 8 Показатели вариации
8.1 Понятие о вариации
Предположим, имеются две совокупности:
(1) 5, 10, 15;
(2) 1, 10, 19.
Определим средне значение каждой совокупности:
𝑋1 =
5 + 10 + 15
1 + 10 + 19
= 10; 𝑋2 =
= 10.
3
3
Итак, средние величины одинаковы, но совокупности различны. Средняя величина
дает только обобщенную характеристику совокупности. Следовательно, необходимы
другие показатели, выявляющие степень различия вариантов, т.е. степень их вариации.
Вариация – различие в значениях какого-либо признака единиц совокупности.
Для оценки структуры совокупности используют показатели вариации,
характеризующие степень разброса, рассеивания значений вариантов признака:
 Размах вариации (R);
 Среднее линейное отклонение (d);
 Средний квадрат отклонений (дисперсия) (𝜎2);
 Среднее квадратическое отклонение (𝜎);
 Коэффициент вариации (Квар).
8.2. Размах вариации
Размах вариации(R) – это разность между максимальным и минимальным
значениями вариантов признака:
R = Xmax – Xmin.
Например, для первой совокупности размах вариации R1=15-5=10, а для второй
R2=19-1=18.
25
8.3 Среднее линейное отклонение
Среднее линейное (d) характеризует среднее отклонение вариант признака xi от средней
величины X.
Например, чтобы рассчитать средние линейные отклонения для 1-й и 2-й
совокупностей, по каждой совокупности рассчитываем все отклонения от средней
величины и выявим среднее.
Среднее линейное отклонение для первой совокупности
(5−10)+(10−10)+(15−10)
−5+0+5
D1=
=
= 0.
3
3
При расчете D2 мы так же получим 0. Сумма отклонений вариант от средней всегда
будет равна 0. Для определения величины отклонения необходимо избавиться от влияния
отрицательного знака и рассчитать абсолютную величину отклонений:
|5 − 10| + |10 − 10| + |15 − 10| |−5| + |0| + |5|
=
= 3,3;
3
3
|1 − 10| + |10 − 10| + |19 − 10| |−9| + |0| + |9|
𝐷2 =
=
= 6.
3
3
Вывести формулу!
𝐷1 =
Среднее линейное отклонение простое
∑|𝑥𝑖 −𝑋ср|
Dпр=
𝑛
.
Правило. Среднее линейное отклонение (d) – среднее отклонение вариант признака Xi от
средней величины Xбез учета их знака.
Если отдельные варианты имеют частоту повторений (Fi), то каждое отклонение
повторяется fi раз.
Вывести формулу!
Среднее линейное отклонение взвешенное
dвзв=
∑(𝑥𝑖 −𝑋ср.)𝑓𝑖
∑𝑓𝑖
.
8.4 Средний квадрат отклонений (дисперсия)
Есть ли другой способ избавиться от влияния знака? Для этого можно возвести каждое
отклонение в квадрат.
Дисперсия, или средний квадрат отклонений (𝜎 2 ), характеризует среднее значение
квадрата отклонений вариант признака xiот средней величины Xср..
Например, требуется рассчитать средние квадраты отклонений для 1й и 2й
совокупностей. Для этого суммируем квадраты отклонений вариант от средней и выявим
среднее значение.
(5 − 10)2 + (10 − 10)2 + (15 − 10)2 25 + 0 + 25
2
𝜎1 =
=
= 16,7;
3
3
(1 − 10)2 + (10 − 10)2 + (19 − 10)2
𝜎22 =
= 54.
3
26
Вывести формулу!
Дисперсия простая
∑(𝑥𝑖 − 𝑋ср. )2
𝑛
Если отдельные варианты имеют частоту повторений Fi, то каждый квадрат
отклонений повторяется Fi раз. В таком случае рассчитывается дисперсия взвешенная.
2
𝜎пр
=
Вывести формулу!
Дисперсия взвешенная
2
𝜎взв
=
∑(𝑥𝑖 − 𝑋)2 𝑓𝑖
∑𝑓𝑖
8.5 Среднее квадратическое отклонение
Среднее квадратическое отклонение(𝜎) – квадратный корень из дисперии:
𝜎 = √𝜎 2
8.6 Коэффициент вариации
Коэффициент вариации (Квар) характеризует степень однородности совокупности и
рассчитывается по формуле
𝜎
Квар = 100%.
𝑥
Совокупность считается однородной, если Квар< 33%.
Задания для самостоятельной работы
1. Рассчитать среднее квадратическое отклонение для 1-й и 2-й совокупностей (см. пример
в начале темы).
2. Определить степень однородности для 1-й и 2-й совокупностей.
3. Рассчитать показатели вариации для совокупностей студентов группы по признакам
«отношении к учебе» и «успеваемость». Выявить признаки, по которым распределение
является однородным.
27
Тема 9 Индексы
9.1 Понятие и виды индексов
Слово «индекс» происходит от латинского index и означает «показатель». Индекс –
это относительный показатель, получаемый в результате сопоставления уровней явлений
во времени или пространстве. Индекс выражается в процентах или в виде коэффициента.
Различают индексы динамические и пространственные. Если сопоставляются уровни
явления во времени, то говорят об индексах динамики. Если сопоставляются уровни
явления в пространстве – о территориальных индексах.
По степени охвата единиц совокупности индексы делятся на индивидуальные и
сводные (общие). Индивидуальные индексы рассчитываются по одной единицы
совокупности, сводные по всей или определенной группе совокупности.
9.2 Индивидуальные индексы
Индивидуальные индексы (i) характеризуют изменение какого-либо признака
единицы совокупности. Она показывают, во сколько раз изменилось значение признака.
Индивидуальный индекс цен (ip) характеризует изменение цены товара в исследуемом
периоде по сравнению с базисным:
Например, определим степень изменения цены товара, если в 2015 г. цена составляла
90 руб., а в 2016 г. - 100 р.:
100
𝐼𝑝 =
= 1.11 или 111%
90
Если от значения индекса, выраженного в процентах, вычесть 100%, то полученная
величина характеризует темп прироста значения и показывает, на сколько процентов он
изменился:
Тпр = 111% − 100% = 11%
Вывод: цена товара в 2016 г. по сравнению с 2015 г. увеличилась в 1.11 раза, или на 11%.
Вывести формулу!
Индивидуальный индекс цен
𝑖𝑝 =
𝑝1
,
𝑝0
где 𝑝1 – цена товара в исследуемом периоде;
𝑝0 – цена товара в базисном периоде.
Индивидуальный индекс физического объема товарооборота (iq) характеризует
изменение объема реализованного товара в исследуемом периоде по сравнению с
базисным.
Определим степень изменения объема реализованного товара, если в 2015 г. было
реализовано 200 тыс. шт., а в 2016 г. – 230 тыс. шт.:
230
𝑖𝑞 =
= 1,15 или 115%;
200
28
Тпр = 115% − 100% = 15%.
Вывод: объём реализованного товара в 2016 году по сравнению с 2015 годом увеличился в
1,15 раза, или на 15 %.
Вывести формулу!
Индивидуальный индекс физического объема
𝑖𝑞 = 𝑞1 / 𝑞0 ,
где q1- объем товара в исследуемом периоде;
q0 – объем товара в базисном периоде.
Индивидуальный индекс товарооборота характеризует изменение стоимости
реализованного товара. Произведенные цены (p) и количество товара (q) дает стоимость
реализованного товара (pq), т.е. товарооборот.
Определим изменение товарооборота, если в 2015 г. было реализовано 200 тыс. шт.
по цене 90 руб., а в 2016 г. – 230 тыс. шт. по цене 100 руб.:
100 ∗ 230
𝑖𝑝𝑞 =
= 1.28 или 128%;
90 ∗ 200
Тпр = 128% − 100% = 28%.
Вывод: товарооборот в 2016г. по сравнению с 2015 г. увеличился в 1,28 раза, или на 28%.
Вывести формулу!
Индивидуальный индекс товарооборота
𝑖𝑝𝑞 =
𝑝𝑖 𝑞𝑖
𝑝0 𝑞0
Индексы могут быть базисными или цепными. Базисные индексы предполагают
сравнение с базисными, обычно начальными периодом, цепные – с предшествующим
периодом.
Базисный индивидуальный индекс товарооборота
𝑖𝑝𝑞 =
𝑝𝑖 𝑞𝑖
𝑝0 𝑞0
Цепной индивидуальный индекс товарооборота
𝑖𝑝𝑞 =
𝑝𝑖 𝑞𝑖
𝑝𝑖−1 𝑞𝑖−1
.
9.3 Сводные (общие) индексы
Сводные (общие индексы) характеризуют изменение показателей совокупности,
отдельные элементы которой не подлежат суммированию. К ним относятся индексы
товарооборота, потребления, промышленной продукции, национального дохода, цен,
себестоимости, производительности труда, реальных доходов.
29
Основной формой сводных индексов является агрегатный индекс. Слово «агрегат» в
переводе с латинского означает «суммирование».
Агрегатный индекс представляет собой дробь, числитель и знаменатель которой
образованы из сумм произведений двух величин.
Рассмотрим агрегатные индексы на примере показателя товарооборота. Например,
требуется определить степень изменения стоимости, цен и объема реализации товара на
основании следующих данных.
Данные об изменении цен и объема реализованного товара
Вид товара
А
Б
Базисный период
Цена, тыс. руб. Количество, шт.
10
300
20
500
Исследуемый период
Цена, тыс. руб. Количество, шт.
15
400
22
1000
Агрегатный индекс стоимости (Ipq) характеризует степень изменения стоимости
различных товаров. Он показывает, во сколько раз изменилась стоимость товаров.
Решение:
𝐼𝑝𝑞 =
15∗400+22∗1000
10∗300+20∗500
= 2,15, или 215%.
Тпр=215%−100%=115%
Вывод: стоимость реализованного товара в 2016 г. по сравнению с 2015увеличилась в 2,15
раза, или на 115%.
Вывести формулу!
Агрегатный индекс стоимости
𝐼𝑝𝑞 =
∑𝑝𝑖1 𝑞𝑖1
∑𝑝𝑖0 𝑞𝑖0
,
где pi0 , pi1 – цена товара в базисном и исследуемом периодах соответственно;
qi1, qi0 0 – объем товара в базисном и исследуемом периодах соответственно.
Изменение стоимости товаров определяется двумя факторами изменением цены (p) и
объема (q). Для выявления степени изменения значения под влиянием одного из факторов
необходимо значение другого фактора принять неизменным.
Агрегатный индекс цен (Ip) характеризует степень изменения цен группы различных
товаров. Он показывает, во сколько раз изменился уровень цен на группу товаров.
Количество товаров принимается неизменным обычно на уровне исследуемого периода.
Определим степень изменения цен реализованных товаров по вышеперечисленным
данным. Количество товаров принимаем неизменным на уровне исследуемого периода.
Решение:
15 ∗ 400 + 22 ∗ 1000
𝐼𝑝 =
= 1,17, или 177%;
10 ∗ 400 + 20 ∗ 1000
Тпр = 117% − 100% = 17%.
30
Вывод: уровень цен товаров, реализованных в 2016 г., по сравнению с 2015г. увеличился в
1,17 раза, или на 17%.
Вывести формулу!
Агрегатный индекс цен
𝐼𝑝 =
∑𝑝𝑖1 𝑞𝑖1
∑𝑝𝑖0 𝑞𝑖1
С помощью агрегатного индекса цен рассчитывается индекс потребительских цен для
определенной группы товаров и услуг (потребительской корзины). Прирост стоимости
потребительской корзины является характеристикой уровня инфляции в стране.
Агрегатный индекс физического объема (Iq) характеризует степень изменения объема
реализации по группе разнородных товаров. Он показывает, во сколько раз изменился
физический объем продукции. Цены на товары необходимо принять неизменными на
уровне базисного периода.
Определим степень изменения объема реализованного товара на нашем примере.
Цены на товар Принимаем неизменными на уровне базисного периода.
Определим степень изменения объема реализованного товара на нашем примере. Цена
на товары принимаем неизменными на уровне базисного периода.
Решение:
10 ∗ 400 + 20 ∗ 1000
Ipq =
= 1,85 или 185%;
10 ∗ 300 + 20 ∗ 500
Тпр = 185% − 100% = 85%.
Вывод: объем реализованных товаров в 2016 г. по сравнению с 2015г. увеличился в 1.85
раза, или на 85%.
Вывести формулу!
Агрегатный индекс физического объема
𝐼𝑞 =
∑𝑝𝑖0 𝑞𝑖1
∑𝑝𝑖0 𝑞𝑖0
Задание для самостоятельной работы
1. Определить степень изменения отношения к учебе каждого студента группы за период с
начала семестра. Сформулировать вывод.
2. Имеются данные о реализации товара предприятием.
Вид товара
Сентябрь
Октябрь
31
Цена, руб.
Количество, т
Цена, руб.
Количество, т
А
100
2
110
4
Б
300
1
320
3
Рассчитать сводные индексы товарооборота, цен, физического объема. Сформулировать
выводы.
3. Рассчитать индекс цен, если огурцы, помидоры и кабачки в количестве соответственно
100, 75, 50 т были проданы по цене 100, 150, 75 ден. ед. за 1 кг. В предыдущем году цены
были: 60, 90, 80 ден. ед. за 1 кг.
4. По имеющимся в таблице данным о цене товара определить недостающие показатели.
Данные о цене товара
Месяц
Цена
Индивидуальные индексы цен
Ценные
Базисные
Январь
Февраль
550
103
Март
Тема 10 Корреляционно-регрессивный анализ
105
32
10.1 Сущность корреляционной связи
Слово «корреляция» в переводе с латинского «соотношение». Между многими
явлениями существует причинно-следственная связь. Любая причинно-следственная связь
вскрывается зависимость результата от фактора. Если эта зависимость обязательная и
строгая, то ее называют функциональной. В этом случае каждому значению факторного
признака (x) соответствует определенное значение результативного признака (y):
Y= f(x).
В социально-экономической сфере функциональная связь выражается редко, чаще
зависимость признака от факторного носит вероятностный характер. В этом случае говорят,
что существует корреляционная связь.
Корреляционная связь – это зависимость между явлениями, которая проявляется не в
каждом отдельном случае, а в массе случаев, в форме определенной тенденции. При этом
одному значению факторного признака (x) может соответствовать несколько значений
результативного признака (y).
Корреляционная связь проявляется приближенно, в среднем. Например, зависимость
себестоимости единицы продукции объема от производства, производительности труда;
зависимость производительности труда от уровня используемых технологий,
квалификации работников, зависимость уровня развития экономики страны от степени
конкуренции; зависимость урожайности культуры от состояния почвы; заработной платы
работников - от уровня образования и т.д.
10.2 Корреляционный анализ
Корреляционный анализ выявляет характер связи между явлениями, ее форму и
тесноту. При этом изучаемые совокупности должны удовлетворять следующим
требованиям:



Количественное выражение признаков;
Однородность совокупностей (Квар< 33%) и их нормальное распределение;
Достаточно большое число единиц в совокупности.
Последовательность проведения корреляционного анализа:
1. Определение степени однородности исследуемых совокупностей.
2. Определение, является ли распределение признаков совокупности нормальным.
3. Составление двух параллельных ранжированных рядов .
4. Аналитическая группировка с целью определения характера связи (прямая или обратная
зависимость).
5. Построение графика корреляционного поля (облака) с целью определения формы связи.
6. Определение тесноты связи и выявление наличия статистически значимой части.
7. Построение уравнения регрессии.
Проведем корреляционный анализ связи уровня затрат на производство и выработки
на одного рабочего на примере следующих данных.
33
Исходные данные для анализа
Средняя выработка одного рабочего, % (x)
7
12
8
10
9
10
Затраты на производство, % (y)
15
10
14
11
13
12
1. Определение степени однородности совокупностей
Для выявления степени однородности совокупностей необходимо рассчитать
коэффициенты вариации признаков:
Квар х =
𝜎
1,6
100% =
= 100% = 17,2 (< 33%)
𝑦
9,3
Квар х =
𝜎
1,7
100% =
= 100% = 13,6 (< 33%)
𝑦
12,5
Вывод: совокупности являются однородными.
2. Определение, являются ли распределения нормальными
Распределения являются нормальными, если значения средней величины, медианы и
моды совпадают или незначительно расходятся.
Медиана х = 9,5; Х= 9,3 – распределение нормальное.
Медиана у = 12,5; Y= 12,5 – распределение нормальное.
3. Составление двух параллельных ранжированных рядов
Факторный признак (х) (выработка)
7
8
9
10
10
12
4. Аналитическая группировка
Результативный признак (y) (Затраты на
производство)
15
14
13
13
11
10
34
Аналитическая группировка производится с целью выявления связи между
явлениями.
Порядок выполнения аналитической группировки:




произвести группировку вариантов факторного признака (x);
для каждой группы факторного признака выписать соответствующие значения
результативного признака (уср) каждой группы;
сопоставить изменения результативного признака (y) по мере изменения факторного
(x);
выявить характер связи (прямая, обратная отсутствует).
Данные для определения характера связи
Факторный признак
(выработка)
Варианты (х)
Частота (fx)
Варианты результативного
признака
(затраты не производство) (у)
7,0 – 8,7
8,7 – 10,4
10,4 – 12,0
7,85
9,55
11,25
15; 14
12; 13
10; 11
Среднее значение
групп вариант
результативного
признака (уср)
14,5
12,5
10,5
Если с ростом значений факторного признака (X) увеличиваются средние групповые
значения результативного (Уср), то связь прямая, если уменьшая обратная.
Аналитическая группировка, выявляя характер связи, не позволяет определить ее
форму (линейная, гиперболическая, параболическая).
Вывод: Зависимость затрат на производство от выработки обратная.
5. Построение графика корреляционного поля
Последовательность этапов построения графика корреляционного поля:
Построить систему координат, на которой по оси абсцисс отложить значения
вариантов факторного признака (x), по оси ординат – результативного (y) (график должен
находиться в центре координатного поля);
Исходные эмпирические (фактические) данные нанести на координатное поле в виде
точек; совокупность таких точек называется графиком корреляционного облака;
Обозначить на графике средние групповые значения результативного признака (yср) и
соединить их ломанный линией (эмпирическая линия средних ЭЛС);
Сформулировать вывод о форме связи (прямая линейная, обратная линейная и т.д.).
Затраты на производство
35
15
14
13
12
11
10
9
7
8
9
10
11
12
Выработка
Рис. 4 График корреляционного поля, отражающий зависимость затрат на
производство и выработки
Вывод: зависимость затрат на производство от выработки обратная линейная.
6. Определение тесноты связи.
Для выявления тесноты связи существует несколько способов, один из них
предполагает расчет коэффициента корреляции.
Выборочный парный коэффициент корреляции для выборки объемом n, где (xi, yi) –
результат i-го наблюдения (I= 1, 2, 3, ……….n), определяется по формуле:
1
𝑟
𝑛
∑(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
𝜎𝑥 𝜎𝑦
После преобразований получим упрощенную формулу для расчета r:
𝑥𝑦 − 𝑥 ∗ 𝑦
; −1 < 𝑟 < 1
𝜎𝑥 𝜎𝑦
7 ∗ 15 + 8 ∗ 14 + 9 ∗ 13 + 10 ∗ 12 + 10 ∗ 11 + 12 ∗ 10
𝑥𝑦 =
= 114
6
114 − 9,3 ∗ 12,5
𝑟=
= −0,8
1,6 ∗ 1,7
Степень тесноты связи зависит от близости |𝑟|к 1. Связь считается статистически
значимой, если |𝑟|>0,7. Знак свидетельствует о направлении связи («-» - обратная, «+» прямая).
Вывод: зависимость затрат на производство от выработки обратная, статистически
значимая.
𝑟
7. Построение уравнения регрессии
36
После того как с помощью корреляционного анализа выявлено наличие
статистической связи между переменными, обычно переходят к математическому
описанию зависимости с использованием регрессивного анализа. Результатом такого
анализа является уравнение (обычно линейное), выражающее математическую зависимость
результативного признака (y)от факторного (x):
Y = a + bx
Это уравнение соответствует теоретической линии регрессии (ТЛР).
Согласно методу наименьших квадратов минимизируется сумма квадратов отклонений
точек ТЛР и ЭЛР.
2
∑(𝑦𝑖 − 𝑓(𝑦𝑖 )) = 0.
В результате получают следующие формулы для коэффициентов b и a:
𝑟𝜎𝑦
𝑏 = 𝜎 ; a=y-bx;
𝑥
б = -0,8; x = 9,3; y = 12,5; a=12,5 –(-0,8)*9,3=20; a=20.
Уравнение регрессии: у=20-0.8х.
По полученному уравнению на графике строят ТЛР. Уравнение регрессии имеет
большое практическое значение, с его помощью можно определить вероятностное
значение результативного признака при определенном значении факторного.
Задание для самостоятельной работы
1. Провести корреляционный анализ связи успешности обучение (y) и отношения к учебе
(x).
2. Оценить тесноту связи между прибылью и уровнем затрат.
Исходные данные для определения тесноты связи:
Уровень затрат, млн. руб. (х)
Прибыль, млн. руб. (у)
96
0,22
78
1,07
77
1,00
89
0,61
81
0,78
82
0,79
Вопросы для подготовки к экзамену
37
1.Понятие статистики. Предмет и задачи статистики.
2. Основные категории статистики.
3. Государственные органы статистики в Российской Федерации.
4. Понятие о статистическом наблюдении. Его формы и виды.
5. Требования к статистическому наблюдению.
6. Организация статистического наблюдения.
7. Сущность статистической сводки и группировки
8. Статистические ряды распределения.
9. Построение вариационного ряда распределения.
10. Способы наглядного представления статистических данных.
11. Правила заполнения статистических таблиц.
12. Статистические графики.
13. Абсолютные величины: понятие, виды.
14. Относительные величины: понятие, виды, порядок расчёта.
15. Ряды динамики, их виды.
16. Показатели, рассчитываемые на основе рядов динамики.
17. Понятие средней величины.
18. Средняя арифметическая величина: виды, расчёт.
19. Средняя гармоническая величина.
20. Средняя геометрическая величина.
21. Структурные средние величины: мода и медиана.
22. Понятие о вариации.
23. Показатели вариации.
24. Понятие и виды индексов.
25. Индивидуальные индексы.
26. Сводные (общие) индексы.
27. Сущность корреляционной связи.
28. Корреляционный анализ.