Эконометрика Жукова Людмила Вячеславовна Каф. Математическая экономика(315 каб.) E-mail: [email protected] 1 ТРЕБОВАНИЯ по курсу и доступные материалы: 1. 1) 2) 3) 4) 5) 2. 3. Взять в электронном виде: Методичку Задание к контрольным работам (трем) Задание по вариантам к первой и третьей к.р. Примеры выполнения к.р Лекции в электронном виде Выполнить три к.р. Объяснить полученные результаты для получения зачет а и сдачи экзамена 2 Определение Эконометрика – наука, объединяющая различные статистические методы, используемые для наблюдения за ходом развития экономики, ее анализа и прогнозов, а также для выявления взаимосвязей между экономическими явлениями. Задачи: 1) Изучить экономическое явление 2) Прогнозирование явлений 3) Выявление взаимосвязи явлений 3 ТЕЗИСЫ: Основная задача – ЗАЧЕМ все это? Данные – выборка, калькулятор погрешности от размера выборки Сбор – статистика Первичный анализ – мат. статистика Теория для случайных величин, практика - для реальных данных Все относительно 4 Данные ВРЕМЕННЫЕ ПЕРЕКРЕСТНЫЕ •Котировки акций •Данные о ценах по районам •Цены на бензин и т.п. •Результаты опроса клиентов •Статистика разговоров клиентов в течении дня 5 Характеристики случайной величины I. Математическое ожидание с.в. x. Обозначается E(x). Показывает среднее ожидаемое значение. II. Дисперсия Обозначается D[x]=V(x). Дисперсия – это среднее отклонение от среднего, т.е. на сколько в среднем большинство значений отклонится от математического ожидания III. Ковариация Обозначается Cov(x,y). Показывает однонаправленность двух случайных величин, т.е. ковариация – это мера линейной зависимости с.в. IV. Корреляция. Обозначается Corr(x,y). Показывает силу линейной связи в интервале [-1;1] 6 Характеристики с.в. Замечание: если corr=0, т.е. линейной связи нет, то это не значит, что нет нелинейной связи. V. Медиана Медиана – это альтернатива определения среднего значения. Она считается по упорядоченному по возрастанию ряду из наблюдений (вариационный ряд). Показывает среднее из большинства. Обозначается med. VI. Мода. Мода – это число, делящее выборку пополам, т.е. 50% значений лежит выше нее, а 50% - ниже. Обозначается mod. 7 Модель парной линейной регрессии Пусть Y,X – две выборки объема Т. Возникает вопрос. Связаны ли они между собой? Если да, то как, и как выразить эту связь количественно? 8 Y Парная регрессия 5 4 3 2 1 Х 9 Линейная парная регрессия Y=a+bX Подбор а и b такими, чтобы линия была как можно ближе ко всем значениям. a и b – неизвестные параметры. Необходимо подобрать a и b, минимизировав меру расстояния от точек до получившейся прямой. В качестве меры можно взять сумму квадратов отклонения от среднего T 2 F yi a bx i min i 1 10 Оценки параметров Метод наименьших квадратов T T 1 1 aˆ y i xi bˆ T i 1 T i 1 T x y x y covx, y ˆ b Dx T x x i i i i 2 2 i i 11 Теорема Гаусса-Маркова Основная теорема линейной регрессии. Пусть есть Х и У выборки объема Т. 1) Y a bx 2) xt - детерминированное (т.е. случайная величина) 3) а) E 0,V ( ) 2 б) ~ N (0, 2 ) или к нормальной линейной регрессии Оценки âи ,b̂ полученные методом наименьших квадратов, являются лучшими в классе линейных несмещенных оценок, т.к. обладают наименьшей дисперсией. Замечание: наши оценки являются наилучшими, только если мы оцениваем модель, линейную по 12 параметру. Оценив параметры модели, мы хотим узнать, насколько точно мы оценили коэффициенты, т.е. насколько хорошо подобрали. Точность оценки связана с ее дисперсией. На основе нее и проверяется значимость. Замечание: остатки после построения регрессии должны иметь нормальное распределение с параметрами математическое ожидание=0 и дисперсия=δ, (это значит, что они незначительны и несущественны) т.е., оценив регрессию, мы должны проверить остатки на нормальность. 13 14 Модель множественной регрессии Обобщением двумерной или парной линейной регрессии служит многомерная линейная регрессия Yt a0 a1 x1t a2 x2t ... an xnt t 1, T 15 Dummy – переменные, фиктивные переменные Как правило, независимые переменные в регрессионных моделях имеют непрерывные области распределения. Однако некоторые переменные могут иметь всего два или дискретное множество значений, например: пол, уровень образования, рейтинг, оценка и т.д. Например: рассмотрим в качестве зависимой переменной – заработную плату, а независимой- набор объясняющих переменных. Хотим в модель включить новую бинарную переменную, отвечающую за наличие или отсутствие высшего образования. Тогда необходимо включить в модель новую переменную d (d=1, если t-ый рабочий имеет высшее образование; d=0, если не имеет) 16 Примеры Файл семинар 3. Лист КОТЕДЖИ Файл мотоциклы 17 Классификация временных рядов Моментальные – на определенную дату (курс валюты) 2. Интервальные – за определенный интервал времени (прибыль предприятий) 3. Исходный 4. Производственный (прирост цен, прибыль в расчете на численный состав) Чаще всего работают с исходным рядом, но иногда его преобразуют, получая производственный ряд. Если значения уровня ряда точно определены какой-либо математической функцией, то такой ряд называется детерминированный или неслучайный. 18 Если уровни временного ряда могут быть описаны с помощью функции распределения вероятностей, то такой ряд называется случайным. Временный ряд бывает: - детерминированный (объем, оценка) - случайный (температура, цена нефти, выборы) 19 Анализ временных рядов 1. Визуальный анализ 300000 250000 200000 150000 100000 50000 0 1975 1980 1985 1990 1995 2000 2005 APH 20 Выявление составляющих 1. Тренд – основная долговременная тенденция 2. Сезонность – периодические колебания 3. Оставшиеся случайные составляющие 21 Ряд с сезонностью Прогноз без учета автокорреляции 50 40 30 20 10 0 1975 1980 1985 1990 UCHSOLD_REG 1995 2000 UCHSOLD 2005 22 Выделение тренда Тренд X = f (t) + ɛ - функция от времени Пример файл семинар 3. Лист Котировки Сначала сгладить (метод скользящего среднего), потом выделить тренд 23 ИС УМ 100%, У Анализ сезонности Построить сезонную составляющую Индекс сезонности ИС — Ум / У * 100% Ум — уровень по месяцам (реальный); У — средний уровень ряда за год. 24 Вопросы????? успехов 25