Материалы лабораторных занятий Темы лабораторных занятий 1-ый рейтинг 1) Лабораторная работа №1: Прогнозы с применением метода скользящего среднего. Сглаживание по простой, скользящей средней. Наиболее распространенной процедурой сглаживания, является метод скользящей средней. Сначала для временного ряда определяется интервал сглаживания (д). Если необходимо сгладить мелкие колебания, то интервал сглаживания берут по возможности большим, если нужно сохранить более мелкие колебания, то интервал сглаживания уменьшают. Для первых (д) уровней временного ряда вычисляются их среднее арифметическое значение. Это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень в право, повторяются вычисление средней арифметической и т.д. Длину интервала сглаживания (д) удобно брать в виде нечетного числа, в этом случае расчетные значения скользящей средней будут приходиться на средний интервал ряда. Например: Для интервала (д)=3 сглаженные уровни рассчитываются по формуле yt yt 1 yt yt 1 (5) 3 Для того, что бы не потерять первый и последний уровни ряда, их можно вычислять по формулам параболического интервала. y1 5 y1 2 y2 y3 (6) 6 yn yn2 2 yn1 5 yn 6 Метод простой скользящей средней дает хорошие результаты в динамических рядах с линейной тенденцией развития. Сглаживание с использованием взвешенной скользящей средней. Для рядов с нелинейной тенденцией развития необходимо применять метод взвешенной скользящей средней. Этот метод отличается от метода простой скользящей средней тем, что уровни входящие в интервал сглаживания суммируются с разными весами. Для полиномов второго и третьего порядков по 5-ти членной взвешенной скользящей средней, центральные значения интервала определяются по формуле: yt 1 3 yt 2 12 yt 1 17 yt 12 yt 1 3 yt 2 (7) 35 Весовые коэффициенты при сглаживании по полиномом 2-го и 3-го ряда порядков в зависимости от длены интервала сглаживания, представлены в таблице: Длина интервала сглаживания 5 Весовые коэффициенты 1 3,12,17 35 1 2,3,6,7 21 7 9 1 21,14,39,54,59 231 Задание по лабораторной работе №1: По данным динамики урожайности за 10 лет приведенным в таблице рассчитать: - 3-х, 5- летние скользящие средние простые - 5- летние скользящие средние взвешенные - сравнить результаты расчетов 2) Лабораторная работа №2: Прогнозирование на основе анализа трендов и сезонности. Покажем применение математического моделирования к анализу структуры временных рядов, содержащих сезонные или циклические колебания. Моделирование циклических колебаний в целом осуществляется аналогично моделированию сезонных колебаний, поэтому рассмотрим только методы моделирования последних. Простейший подход – расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Аддитивная модель временного ряда: A = T+S+E Мультипликативная модель временного ряда: A = T*S*E Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимости от значений сезонной компоненты. Построение аддитивной и мультипликативной модели сводится к расчету значений T, S, E для каждого уровня временного ряда. Процесс построения модели включает в себя следующие шаги: 1. Выравнивание исходного ряда методом скользящей средней; 2. Расчет значений сезонной компоненты S; 3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (T+E) в аддитивной или (T*E) в мультипликативной модели; 4. Аналитическое выравнивание уровней (Т+Е) или (Т*Е) и расчет значений Т с использованием полученного уравнения тренда; 5. Расчет абсолютных и/или относительных ошибок. Методику построения аддитивной модели временного ряда рассмотрим на примере. Пример. Построение аддитивной модели временного ряда. В таблице 1 указан объем продаж (тыс. тенге) за последние 11 кварталов. Построим аддитивную модель временного ряда. Для данного примера предлагается находить среднее арифметическое четырех последовательных значений уровней методом скользящей средней: 4 5 5 6 20 5 4 4 5 5 6 9 25 6,25 и т.д. 4 4 Таблица 1 – Объем продаж (млн. тенге) за 11 кварталов Скользящая средняя за 4 квартала № Объем квартала продаж Оценки Центрированная сезонной скользящая средняя вариации 1 4 2 5 3 5 5 5,625 -0,625 4 6 6,25 6,75 -0,75 5 9 7,25 7,625 1,375 6 9 8 8,5 0,5 7 8 9 9,25 -1,25 8 10 9,5 10 0 9 11 10,5 11,5 -0,5 10 13 12,5 11 16 Замечание. Если при заполнении третьего столбца скользящая средняя вычислялась для нечетного числа сезонов, то результат записывается напротив среднего слагаемого и данные не надо центрировать (т.е. не надо заполнять четвертый столбец). Полусумму двух соседних чисел из третьего столбца запишем в четвертый столбец напротив верхнего из них, таким образом производится центрирование скользящей средней. Пятый столбец – это разность второго и четвертого столбцов (второго и третьего столбцов, если скользящая средняя вычислялась для нечетного числа сезонов). Заполним таблицу 2. Оценки сезонной вариации запишем под соответствующим номером квартала в году. В каждом столбце вычисляем среднее (равно сумме чисел в столбце/количество чисел в столбце). Результаты пишем в строке «Среднее» (округление до 1 цифры после запятой). Сумма чисел в строке «Среднее» равно (-0,4). Скорректируем значения в строке «Среднее», чтобы общая сумма была равна 0. Это необходимо, чтобы усреднить значения сезонной вариации в целом за год. Корректирующий фактор вычисляется следующим образом: сумма оценок сезонных вариаций (-0,4) делится на число кварталов в году (4), и найденное частное вычитается из каждого числа строки «Среднее». Поэтому из каждого числа этой строки надо вычесть (-0,1). В последней строке получены значения сезонной вариации для соответствующего квартала года. Таким образом мы выполнили шаг 2. Теперь можно выполнить третий шаг, т.е. исключить сезонную вариацию из фактических данных. Проведем десезонализацию данных. Таблица 2 – Расчет значений сезонной вариации Номер квартала в году 1 1,375 2 3 4 -0,625 -0,75 -1,25 0 0,5 Сумма -0,5 Среднее 0,4 0,5 -0,9 -0,4 -0,4 Скорректированная сезонная вариация 0,5 0,6 -0,8 -0,3 0 Таблица 3 – Десезонализация данных № квартала Объем продаж Сезонная вариация S Десезонализированный объем продаж A-S = T+E 1 4 0,5 3,5 2 5 0,6 4,4 3 5 -0,8 5,8 4 6 -0,3 6,3 5 9 0,5 8,5 6 9 0,6 8,4 7 8 -0,8 8,8 8 10 -0,3 10,3 9 11 0,5 10,5 10 13 0,6 12,4 11 16 -0,8 16,8 Далее выполним четвертый шаг, т.е. аналитическое выравнивание уровней Т+Е. Уравнение линии тренда равно Т = a+b*t. Коэффициенты a и b найдем из системы уравнений по данным первого и последнего столбцов: n n i 1 i 1 b t i a n Ti n n n i 1 i 1 i 1 b t i2 a t i t i Ti Для нашего случая a = 2,1; b = 1,1. Подставляем в уравнение линии тренда значения t = 1, 2,…, 11. Найдем уровни Т для каждого момента времени, тем самым завершим четвертый шаг. Далее переходим к пятому шагу, т.е. займемся расчетом ошибок. Для этого из чисел 3-го столбца вычитаем числа 4-го столбца и результат пишем в 5-ом столбце. Таблица 4 – Расчет ошибок Объем № A-S=T+E квартала продаж Трендовое значение Ошибки et et et 2 1 4 3,5 3,2 0,3 0,3 0,09 2 5 4,4 4,3 0,1 0,1 0,01 3 5 5,8 5,4 0,4 0,4 0,16 4 6 6,3 6,5 -0,2 0,2 0,04 5 9 8,5 7,6 0,9 0,9 0,81 6 9 8,4 8,7 -0,3 0,3 0,09 7 8 8,8 9,8 -1 1 1 8 10 10,3 10,9 -0,6 0,6 0,36 9 11 10,5 12 -1,5 1,5 2,25 10 13 12,4 13,1 -0,7 0,7 0,49 11 16 16,8 14,2 2,6 2,6 6,76 Сум ма 8,6 12,06 Среднее абсолютное отклонение (MAD) MAD = e t / n 0,78 ; Среднеквадратическая ошибка (MSE) MSE = e 2t / n 1 . Мы видим, что ошибки не велики, следовательно, прогноз будет достаточно качественным. Дадим прогноз объема продаж на следующие два квартала. Тенденция, выявленная по прошлым данным, сохраняется и в ближайшем будущем. Подставляем номера кварталов в формулу и учитываем сезонную вариацию. Прогноз объема продаж в 12 квартале. Осуществляем прогноз T+S: 2,1+1,1*12-0,3 = 15 (млн. тенге). Прогноз объема продаж в 13 квартале: 2,1+1,1*13+0,5 = 16,9 (млн. тенге). Задание по лабораторной работе №2: В таблице указан объем продаж (млн. тенге) за последние 11 кварталов. Дать на основании этих данных прогноз объема продаж на следующие два квартала. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем 4 6 4 5 10 8 7 9 12 14 15 3)Лабораторная работа №3: Выбор тренда для прогнозирования В качестве кривых выравнивающих временной ряд можно взять линейный тренд, параболический тренд и показательную кривую: а) Составление уравнения прямой линии нами уже рассмотрено; б) Рассмотрим составление уравнения квадратного тренда Для этого необходимо найти неизвестные параметры Применяется метод наименьших квадратов (МНК) с помощью которого минимизируется функция (2) Решая систему (2) находим уравнений линий квадратного тренда. которые являются параметрами в) Выравнивание временного ряда с помощью показательной кривой для нахождения параметров а и b показательной кривой прологарифмируем это равенство по основанию 10. Обозначим Применяя МНК, получаем как и для линейного тренда два уравнения первой степени с двумя неизвестными А и В Решая систему, находим А и В, с помощью равенств найдем значения а и b, которые входят в формулу показательной кривой Задание по лабораторной работе №3: Предлагаемые задания выполняются на компьютере с помощью электронных таблиц «Ехсеl». В предлагаемых заданиях требуется отметить правильный вариант ответа. 1975 1976 1977 1978 1979 1980 1981 1982 1983 5 5,4 6 7 8 9,7 10,3 10,8 10,2 1974 1972 3,5 4,6 1971 3 1973 1970 2,8 4 год объем В таблице приведены данные об объемах продаж некоторой фирмы за период с 1970 по 1991 год в миллионах долларов: Выполните следующие задания: 1. Постройте точечную диаграмму, отражающую зависимость объема продаж от времени, и проведите линию линейного тренда. Уравнение этого тренда имеет вид: 1) y 0.7835x 1542.2 ; 2) y 0.7355x 1542.2 ; 3) y 0.7835x 1632.2 ; 4) y 0.6735x 1462.2 2. Коэффициент аппроксимации (детерминации) временного ряда линейным трендом равен: 1) 0.9251 ; 2) 0.9361 ; 3) 0.9661 ; 4) 0.9445 . 3. На построенной диаграмме проведите линию квадратичного (полиномиального 2 степени) тренда. Уравнение этого тренда имеет вид: 1) y 0.0237 x 2 90.237 x 91221 ; 2) y 0.7835x 1542.2 ; 3) y 0.237 x 2 93.237 x 9151 ; 4) y 0.0237 x 2 93.237 x 91561 . 4. Коэффициент аппроксимации (детерминации) временного ряда квадратичным трендом равен: 1) 0.9636 ; 2) 0.9771 ; 3) 0.9361 ; 4) 0.9225 . 5. На построенной диаграмме проведите линию экспоненциального тренда. Уравнение этого тренда имеет вид: 1) y 3E 77e 0.0922 х ; 2) y 3E 8e 0.911 x ; 3) y 3E 78e 0.0911 x 4) y 3E 88e 0.0821 x . 6. Коэффициент аппроксимации (детерминации) временного ряда экспоненциальным трендом равен: 1) 0.9756 ; 2) 0.9692 ; 3) 0.9861 ; 4) 0.9335 . 7. С помощью диаграммы и коэффициента аппроксимации выберите модель, дающую наилучшее приближение: 1) линейная; 2) квадратичная; 3) все дают плохое приближение; 4) экспоненциальная. 8. Прогноз на 1992 год, вычисленный по линейной модели равен: 1) 18,6668 ; 2) 16,5888 ; 3) 18,5558 ; 4) 19,5658 . 9. Величина отклонения построенного прогноза от реального значения, равного 20,1 млд. долларов, имеет вид: 1) 1,544 ; 2) 1,654 ; 3) 1,677 ; 4) 1,684 . 10. С помощью диаграммы сделайте вывод, о том по какой модели получается наилучший прогноз: 1) по линейной; 2) по экспоненциальной; 3) по квадратичной; 4) все прогнозы одинаково хорошие. Литература Основная литература 1. Эконометрика / Под ред. Елисеевой И.И. - М/. Финансы и статистика, 2005. 2. Многомерный статистический анализ в экономике./Под ред. Тамашевича В.Н. -М.: ЮНИТИ, 1999. 3. Дубров А.М., Мхитарян В.С, Трошин Л.И. Многомерные статистические методы. — М.: Финансы и статистика, 2003. 4. Алексахин СВ. и др. Прикладной статистический анализ. -М.: ПРИОР, 2001. 5. Дуброва Т.А. Статистические методы прогнозирования. -М/. ЮНИТИ, 2003. 6. Мухамедиев Б.М. Эконометрика и эконометрическое прогнозирование. — Алматы: Казак университет!, 2007. — 250 с. Дополнительная литература 7. Сигел Э. Практическая бизнес-статистика. — Москва-Санкт-Петербург-Киев: Вильяме, 2002. 8. Васильев В.И и др. Статистический анализ объектов произвольной природы. Введение в статистику качества. — М.: ИКАР, 2004. 9. Экономико-статистический анализ./Под ред. Ильенковой С.Д.-М.: ЮНИТИ, 2002. 10.Парсаданов Г.А. Прогнозирование и планирование социально-экономической системы страны. - М.: ЮНИТИ, 2001. П.Лугачев М.И., Ляпунцов Ю.П. Методы социально-экономического прогнозирования. -М.: ТЕИС, 1999. 12.Басовский Л.Е. Прогнозирование и планирование в условиях рынка. - М.: ИНФРА-М, 1999. 2-ой рейтинг 4) Лабораторная работа №4: Прогнозирование с применением метода экспоненциального сглаживания. Суть экспоненциального метода сглаживания заключается в том, что в процедуре нахождения сглаженного уровня используется значение только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровней ряда. Если для исходного временного ряда соответствующие сглаженные значения уровней St, t =1, n , то экспоненциальное сглаживание производится с помощью рекуррентной формулы: S t yt (1 )S t 1 , (1) где - параметры сглаживания 0< <1, 1 - - коэффициент дисконтирования Обычно для временных рядов в экономических задачах величину параметра сглаживания выбирают в интервале от 0,1 до 0,3. Начальный параметр S0 принимают равным значению первого уровня ряда y1 или равным средней арифметической первых нескольких членов ряда, например (y1, y2, y3): S0 y1 y 2 y 3 , 3 (2) Указанный порядок выбора величины S0 обеспечивает хорошее согласование сглаженного и исходного временных рядов для первых уровней. Если же при подходе к правому концу ряда сглаженный значения начинают значительно отличаться от соответствующих значений исходного ряда, то целесообразно перейти на другой параметр сглаживания . Пример. В таблице приведены данные численности преподавателей ВУЗов РФ (тыс. чел) по годам год yt 1992 1993 1994 1995 1996 1997 1998 1999 233,5 239,9 239,8 261,9 261,8 268,7 260,7 290,6 Произвести сглаживание временного ряда с использованием экспоненциальной средней, приняв параметр = 0,1 и = 0,3. По результатам расчетов определить какой из сглаженных временных рядов носит более гладкий характер. Решение: = 0,1 S 0 233,5 239,9 239,8 237 ,7 3 S1 = 0,1*233,5+0,9*237,7 = 237,3 S2 = 0,1*239,9+0,9*237,3 = 237,6 S3 = 0,1*239,8+0,9*237,6 = 237,8 и. т. д. При = 0,3 S1 = 233,6, S2 = 235,5, S3 = 236,8 и. т. д. Из проведенных расчетов можно заключить, что при = 0,1 временной ряд имеет более гладкий характер. Задание по лабораторной работе №4: В таблице указан объем продаж (млн. тенге) за последние 11 кварталов. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем 4 6 4 5 10 8 7 9 12 14 15 Пусть = 0,2. Дать прогноз на 12-ый квартал методом экспоненциального сглаживания. 5) Лабораторная работа №5: Прогнозирование на основе парной регрессии. В случае линейной зависимости между двумя переменными уравнения регрессии Y по Х и Х по Y имеют вид (3) где (4) (5) (6) – это средние значения переменных; b – Коэффициент регресии (7) [ковариация (выборочная)] (8) – коэффициенты регрессии У по Х и Х по У (9) (10) - дисперсия переменных (11) где частоты пар значений причем (12) Для оценки тесноты линейной зависимости используется выборочный коэффициент корреляции ( r ) который может быть вычислен по одной из следующих формул: (13) (14) где знак ( r ) совпадает со знаком (15) (16) , Если ( r ) строго больше нуля, то корреляционная связь между переменными Х и Y называется прямой, а при ( r ) меньше нуля – обратной. Свойства коэффициента корреляции , чем ближе 1) к 1, тем теснее линейная корреляционная связь , тогда корреляционная связь представляет собой функциональную связь 3) , то линейная корреляционная связь отсутствует. 2) Задание по лабораторной работе №5: Рассматривается зависимость между суточной выработкой продукции Y(t) и величиной основных производственных фондов Х (млн. тенге) для совокупности 50-ти однотипных предприятий. Необходимо найти уравнения регрессии Y по X и Х по Y, пояснив их смысл и коэффициент корреляции между Х и Y. Величина ОПФ (млн. тенге) середина Суточная выработка предприятий, интервалов тонны ///////////////// 7-11 11-15 15-19 19-23 23-27 9 13 17 21 25 20-25 22,5 25-30 27,5 30-35 32,5 35-40 37,5 40-45 42,5 Всего Групповая средняя тонны 2 3 5 25,5 1 6 3 1 11 29,3 6) Лабораторная работа множественной регрессии. 2 1 3 39,2 Всего Групповая средняя тонны 3 13 21 11 2 50 - 10,3 13,3 17,8 20,3 23 - 4 11 2 17 31,9 7 6 1 14 25,4 №6: Прогнозирование на основе Множественный линейный регрессионный анализ применялся на одном из заводов для построения математической модели рынка легковых подъемников. Требовалось выявить факторы (экономические показатели), оказывающие наибольшее влияние на объем продаж подъемников, найти зависимость объема продаж от этих факторов и использовать эту зависимость для прогнозирования объема продаж. Зависимую через V. Независимыми переменными будут – грузоподъемность , цена , наличие напольной рамы , количество двигателей переменную объем продаж обозначим , наличие синхронизации , суммарная мощность двигателей нижнем положении подъема – , максимальная высота подъема , гарантийный срок , внешний вид , высота подхвата в , срок службы , срок поставки , скорость , время на рынке , уровень сервисного обслуживания , наличие системы смазки , масса Для восстановления зависимости использовалась линейная регрессионная модель, в которой присутствуют 17 независимых переменных. ~ y b 0 b1x1 b 2 x 2 ... b17 x17 Реализовать ее можно лишь на компьютере, поэтому решим эту задачу средствами Excel. По результатам пошагового анализа из рассмотрения последовательно исключались независимые переменные, имеющие коэффициенты, незначимо отличающиеся от нуля, иными словами мало отличающиеся от нуля в сравнении с их дисперсией. В результате расчетов была получена зависимость объема продаж от 12 факторов: V 1769 ,77 65,09 x 1 0,003 x 2 68,79 x 3 147 ,54 x 4 156,28 x 5 2,53x 7 1,08 x 8 25,75 x 12 132 ,26 x 13 12,41x 14 107 ,78 x 15 397 x 16 Исходя из расчетов, прогнозное значение продаж подъемников на второй год продаж составит ориентировочно 1010 штук, с вероятностью 0,95 можно утверждать, что объем продаж будет лежать в границах [695, 1332] штук. Задание по лабораторной работе №6: Предполагается, что объем предложения товара y линейно зависит от цены товара х1 и зарплаты сотрудников х2 : . Статистические данные собраны за 10 месяцев. Оценить по МНК коэффициенты уравнения регрессии. у Х1 Х2 75 43 6 90 35 4 105 38 4 110 55 5 120 50 3 130 35 1 130 40 2 130 55 3 135 45 1 140 65 2