Юргинский технологический институт Томского политехнического университета _______________________________________________________ У Т В Е Р Ж Д А Ю . "____"___________2016 г. ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Методические указания к выполнению контрольной работы по дисциплине "Теория вероятностей и математическая статистика" для студентов направления 09.03.03 «Прикладная информатика» всех форм обучения Юрга 2016 УДК 330.131 ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА: Методические указания к выполнению контрольной работы по дисциплине «Теория вероятностей и математическая статистика» для студентов направления 09.03.03 «Прикладная информатика» - Юрга: Изд. ЮТИ ТПУ, 2016 - 34 с. Составитель доц., к.т.н. Рецензент Т.Ю. Чернышева доц., к.т.н. Методические указания рассмотрены и рекомендованы к изданию методическим семинаром кафедры информационных систем филиала ТПУ « ____»___________ 2016 г. Зав. кафедрой ИС, кандидат тех. наук 2 А.А.Захарова ВВЕДЕНИЕ Одной из основных задач математической статистики является разработка методов анализа статистических данных в зависимости от целей исследования. Сюда относится и оценка параметров распределения, вид которого известен. В данном методическом указании приводятся основные понятия, формулы и методы нахождения оценок параметров распределения, даны решения типовой задачи. Предназначается для практических занятий и самостоятельной работы студентов. Номер варианта задачи определяется по последней цифре номера зачетной книжки студента. КОНТРОЛЬНАЯ РАБОТА №1 Статистические оценки характеристик выборочных данных Цель: найти оценки неизвестных параметров генеральной совокупности, предположить вид распределения признака. Ход работы: 1. По данному вариационному ряду решить следующие подзадачи: Вычислить относительные частоты и накопленные частости; Составить эмпирическую функцию распределения; Построить график эмпирической функции распределения; Вычислить числовые характеристики вариационного ряда: выборочные среднее, дисперсию, стандартное отклонение; Построить полигон и гистограмму относительных частот; Найти интервальные оценки параметров генеральной совокупности; Сделать предположение о виде распределения. 2. Считая выборки пробными, определить минимальный объем выборки n для нахождения доверительного интервала среднего значения а длины 2 и доверительной вероятностью = 0,95. (= номер варианта/10) Индивидуальные задания 1 X ni 5,7-10,7 6 10,7-15,7 15,7-20,7 20,7-25,7 25,7-30,7 30,7-35,7 35.7-40,7 5 9 20 21 16 11 2 X ni -30 – -23 40 -23 – -16 35 -16 – -9 20 -9 – -2 25 -2 – 5 15 5 – 12 10 12 – 19 2 X 0.5-1.0 1.0-1.5 1.5-2.0 2.0-2.5 2.5-3.0 3.0-3.5 3.5-4.0 3 3 ni 4 X 10 -2 – -1.75 2 ni 5 15 -1.75 – -1.50 5 X ni 0-15 80 X ni -100 – -80 3 X 13 -1.50 – -1.25 7 15-30 61 30-45 53 12 17 10 14 -1.25 – -1.0 15 -1.0 – -0.75 12 -0.75 – -0.50 10 -0.5 – -0.25 4 45-60 49 60-75 42 75-90 30 90-105 10 -80 – -60 -60 – -40 -40 – -20 -20 – 0 10 22 51 42 0 – 20 15 20 – 40 1 7.17.102 7.1027.104 7.1047.106 7.1067.108 7.1087.11 7.117.112 7.1127.114 ni 30 18 14 7 2 1 1 X 6,3-9,3 9,3-12,3 ni 10 15 12,315,3 12 15,318,3 14 18,321,3 13 21,324,3 10 24,327,3 14 1.661.74 50 1.741.82 48 1.82-1.9 1.9-1.98 42 15 -10 – -13 15 -13 – -16 12 -16 – -19 10 -19 – -22 1 6 7 8 9 X 1.42-1.5 1.5-1.58 ni 30 31 1.581.66 40 X -1 – -4 -4 – -7 -7 – -10 ni 4 6 8 10 Возможно задание интервалов и соответствующих частот студентами. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ ДЛЯ ВЫПОЛНЕНИЯ КР №1 1 ТОЧЕЧНЫЕ СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 1.1 Статистические оценки параметров распределения Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. Точечной называют статистическую оценку, которая определяется одним числом * f ( x1 , x2 ,, xn ) , где x1 , x2 ,, xn – результаты п наблюдений над 4 количественным признаком Х. 1.2 Выборочная средняя. Оценка генеральной средней по выборочной средней Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объёма n. Выборочной средней xB называют среднее арифметическое значения признака выборочной совокупности. Если все значения x1, x2, …, xn признака выборки объёма n различны, то: xB ( x1 x2 xn ) / n . Если же значения признака x1, x2, …, xk имеют соответственно частоты n1, n2, …, nk, причём n1 + n2 + …+ nk = n, то xB (n1 x1 n2 x2 nk xn ) / n , или xB ( k n x )/ n, i 1 i i т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам. Пусть из генеральной совокупности (в результате независимых наблюдений над количественным признаком X) извлечена повторная выборка объема п со значениями признака x1, x2, …, xn. Не уменьшая общности рассуждений, будем считать эти значения признака различными. Пусть генеральная средняя xг неизвестна, и требуется оценить ее по данным выборки. В качестве оценки генеральной средней принимают выборочную среднюю xB ( x1 x2 xn ) / n . Выборочная средняя есть несмещенная оценка генеральной средней. 1.3 Выборочная дисперсия. Оценка генеральной дисперсии по выборочной. Среднее квадратическое отклонение Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения xB , вводят сводную характеристику – выборочную дисперсию. Выборочной дисперсией DB называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения xB . Если все значения x1 , x2 ,, xn признака выборки объема п различны, то D B ( ( xi x B ) 2 ) / n . Если же значения признака x1 , x2 ,, xk имеют соответственно частоты n1 , n2 ,, nk причем n1 n2 nk n , то DB ( ni ( xi x B ) 2 ) / n , т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам. 5 Кроме дисперсии для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением. Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии: B DB . Пример. Дана совокупность равноотстоящих вариант: Таблица 1 * * xi ni 13,088 2 18,304 0 23,520 4 28,736 5 33,952 16 39,168 28 44,384 18 49,600 20 54,816 5 60,032 2 Для вычисления выборочной средней и выборочной дисперсии воспользуемся методом произведений. Воспользуемся расчетной таблицей, которая составляется так: 1) в первый столбец таблицы записывают выборочные (первоначальные) варианты, располагая их в возрастающем порядке; 2) во второй столбец записывают частоты вариант; складывают все частоты и их сумму (объём выборки n) помещают в нижнюю клетку столбца; 3) в третий столбец записывают условные варианты Ui = (xi - C)/h, причем в качестве ложного нуля C выбирают варианту 39,168, которая расположена примерно в середине вариационного ряда, и полагают h равным разности между любыми двумя соседними вариантами - 5,2160; практически же третий столбец заполняется так: в клетке строки, содержащей выбранный ложный нуль, пишут 0; в клетках над нулем пишут последовательно –1, -2, -3 и т.д., а под нулем – 1, 2, 3 и т.д.; 4) умножают частоты на условные варианты и записывают их произведения niUi в четвертый столбец; сложив все полученные числа, их сумму niUi помещают в нижнюю клетку столбца; 5) умножают частоты на квадраты условных вариант и записывают их произведения niUi2 в пятый столбец; сложив все полученные числа, их сумму niUi2 помещают в нижнюю клетку столбца; 6) умножают частоты на квадраты условных вариант, увеличенных каждая на единицу, и записывают произведения ni(Ui+1)2 в шестой контрольный столбец; сложив все полученные числа, их сумму ni(Ui+1)2 помещают в нижнюю клетку столбца. 6 Шестой столбец служит для контроля вычислений: если сумма ni(Ui+1)2 окажется равной сумме niUi2 + 2 niUi + n , то вычисления произведены правильно. После того как расчетная таблица заполнена и проверена правильность вычислений, вычисляют условные моменты: M1*= ( niUi)/n, M2*= ( niUi2)/n. Наконец, вычисляют выборочные среднюю и дисперсию по формулам: хв = M1*h + C, Dв = [M2* - (M1*)2]h2. Составим расчетную таблицу 2. Таблица 2 x*i 13,088 18,304 23,520 28,736 33,952 39,168 44,384 49,600 54,816 60,032 ni 2 0 4 5 16 28 18 20 5 2 100 Ui -5 -4 -3 -2 -1 0 1 2 3 4 niUi -10 0 -12 -10 -16 0 18 40 15 8 33 niUi2 50 0 36 20 16 0 18 80 45 32 297 ni(Ui+1)2 32 0 16 5 0 28 72 180 80 50 463 Контроль: niUi2 + 2 niUi + n = 297 + 233 +100 = 463. ni(Ui+1)2 = 463. Вычисления произведены правильно. Вычислим условные моменты первого и второго порядков: M1* = ( niUi)/n = 33/100 = 0,33; M2*= ( niUi2)/n = 297/100 = 2,97. Вычислим искомые выборочные среднюю и дисперсию: х в = M1*h + C = 0,335,216 +39,168 = 40,8893; Dв = [M2* - (M1*)2]h2 = [2,97 – 0,332]5,21602 = 77,8411. B DB 8,82 . Полигон и гистограмма Для наглядности строят различные графики распределения и, в частности, полигон и гистограмму. статистического 7 Полигон, как правило, служит для изображения дискретного вариационного ряда, и представляет собой ломаную, в которой концы отрезков имеют координаты (xi, ni) или (xi , wi), i= 1, …, k. Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты ni. Точки (хi; пi) соединяют отрезками прямых и получают полигон частот. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (xi , wi), i= 1, …, k. Для, построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им относительные частоты Wi. На рис. 1 изображен полигон относительных частот распределения: i / n 2 / n 1 / n x1 x2 xk x Рис.1. Полигон относительных частот В силу закона больших чисел в схеме Бернулли относительные частоты сходятся при n к теоретическим вероятностям pi P( X xi ), i 1,2, ... , k. Поэтому полигон относительных частот является статистическим аналогом многоугольника распределения. Кроме того, что полигон обеспечивает наглядность представления дискретного статистического ряда, он позволяет сравнивать визуально и делать предположения о близости распределения исследуемого признака к тому или иному закону распределения. В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала ni – сумму частот вариант, попавших в i–й интервал. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты) (рис.2). Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h. р i* 8 Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, Площадь i–ro частичного прямоугольника равна hni/h=ni, n – сумме частот вариант i–гo интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т. е. объему выборки. Из этого следует, что площадь гистограммы относительных частот равна единице. Следовательно, гистограмму относительных частот можно рассматривать как статистический аналог плотности распределения исследуемого признака X. Рис.2 – Гистограмма частот 2 ИНТЕРВАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 2.1 Точность оценки, доверительная вероятность, доверительный интервал Пусть найденная по данным выборки статистическая характеристика Θ * служит оценкой неизвестного параметра Θ. Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность γ, с которой осуществляется неравенство | Θ – Θ* | < δ, δ0. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999. Пусть вероятность того, что | Θ – Θ* | < δ, равна γ: P [| Θ – Θ* | < δ] = γ. Заменив неравенство | Θ – Θ* | < δ равносильным ему двойным неравенством – δ < Θ – Θ* < δ, или Θ* – δ < Θ < Θ* + δ, имеем 9 P [Θ* – δ < Θ < Θ* + δ] = γ. Это соотношение следует понимать так: вероятность того, что интервал (Θ* – δ , Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ. Доверительным называют интервал (Θ* – δ , Θ* + δ), который покрывает неизвестный параметр с заданной надежностью γ. 2.2 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ неизвестно. Требуется оценить неизвестное математическое ожидание а с помощью доверительных интервалов. Оказывается, что по данным выборки можно построить случайную величину (ее возможные значения обозначим через t): T X a S/ n , которая имеет распределение Стьюдента с k n 1 степенями свободы; здесь Х – выборочная средняя, S – «исправленное» среднее квадратическое отклонение, п – объем выборки. После ряда преобразований, получим P ( X t S / n a X t S / n ) , где tγ находят по таблице приложения 1 по заданным n и γ. Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал ( x t s / n , x t s / n ) , покрывающий неизвестный параметр а с надежностью γ. Здесь случайные величины X и S заменены неслучайными величинами x и s, найденными по выборке. Пример. По данной выше выборке построим доверительный интервал для оценки математического ожидания при неизвестном . Найдем «исправленное» среднее квадратическое отклонение S: S S 2 , где S2 – «исправленная» дисперсия. S2 n D B 78,6272 , S 8,8672 n 1 Найдем t ( примем равным 0,95, n = 100). t = 1,984. Найдем доверительные границы: x t S n 40,8893 1,984 8,8672 100 39,13 ; x t S n 40,8893 1,984 8,8672 100 42,6485 . Итак, с надежностью 0,95 неизвестный параметр а заключен в доверительном интервале 39,13 < а < 42,6485. 2.3 Доверительные интервалы для оценки среднего квадратического отклонения генеральной совокупности нормального распределения 10 Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение по «исправленному» выборочному среднему квадратическому отклонению s. Найдем доверительные интервалы, покрывающие параметр с заданной надежностью . Потребуем, чтобы выполнялось соотношение P( s ) , или P(s s ) . Для того, чтобы можно было пользоваться готовой таблицей, преобразуем двойное неравенство: s(1 / s) s(1 / s) , s(1 q) s(1 q) . положив / s q , получим Практически для отыскания q пользуются специальной таблицей значений q q( , n) (таблица приложения 2 ). При q > 1 (учитывая, что σ > 0) доверительный интервал находят по 0 s(1 q) . формуле: Пример. Построим доверительный интервал для оценки среднего квадратического отклонения. По = 0,95 и n = 100 найдем q = 0,143. Искомый доверительный интервал таков: 8,8672 (1 – 0,143) < < 8,8672 (1 + 0.143) или 7,599 < < 10,135. КОНТРОЛЬНАЯ РАБОТА №2 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Цель: научиться применять принцип проверки статистических гипотез, находить теоретические частоты, исходя из вида распределения; уяснить сущность критерия Пирсона. Задача: По выборке из КР №1 проверить гипотезу о предполагаемом виде распределения генеральной совокупности. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ ДЛЯ ВЫПОЛНЕНИЯ КОНТРОЛЬНОЙ РАБОТЫ №2 ПРОВЕРКА ГИПОТЕЗЫ О РАВНОМЕРНОМ РАСПРЕДЕЛЕНИИ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ Задано эмпирическое распределение непрерывной случайной величины Х в виде последовательности интервалов xi 1 xi и соответствующих им частот ni, причем ni n (объем выборки). Требуется проверить гипотезу о том, что случайная величина Х распределена равномерно. Правило. Для того, чтобы проверить гипотезу о равномерном 11 распределении Х, то есть по закону 1 /(b a) в интервале (a, b) f ( x) вне интервала (a, b) 0 надо: 1. Оценить параметры a и b – концы интервала, в котором наблюдались возможные значения Х, по формулам (через a* и b* обозначены оценки параметров): a * x B 3 B , b * x B 3 B . 2. Найти плотность вероятности предполагаемого распределения f ( x) 1 /(b * a * ) . 3. Найти теоретические частоты: n1' nP1 n[ f ( x) ( x1 a * )] n n 2' n3' n s 1 n 1 ( x1 a * ); * * b a 1 ( x i xi 1 ), (i 2,3, , s 1); * * b a 1 (b * xs 1 ). * b a 4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k s 3 , где s – число интервалов, на которые разбита выборка. По заданной выборке проверим гипотезу о равномерном распределении генеральной совокупности: Таблица 2.1 Границы интервала i xi xi+1 ni 1 10,48 15,696 2 2 15,696 20,912 0 3 20,912 26,128 4 4 26,128 31,344 5 5 31,344 36,56 16 6 36,56 41,776 28 7 41,776 46,992 18 8 46,992 52,208 20 9 52,208 57,424 5 10 57,424 62,64 2 ns' n * 1. Найдем оценки параметров a и b равномерного распределения по формулам: a * x B 3 B , b * x B 3 B . a * 40,8893 1,732 8,8228 25,6078 , 12 b* 35,1633 1,732 4,43 56,1707 . 2. Найдем плотность предполагаемого равномерного распределения: f ( x) 1 /(b * a * ) 1 (56,1707 25,6078 ) 0,0327 3. Найдем теоретические частоты (предварительно объединим малочисленные эмпирические частоты): n1 n f ( x) ( x3 a * ) 100 0,0327 (26,128 25,6078 ) 1,7 ' n2 100 0,0327 ( x4 x3 ) 100 0,0327 5,216 17,07 ' Длины четвертого – девятого интервалов равны длине второго интервала, поэтому теоретические частоты, соответствующие этим интервалам и теоретическая частота второго интервала одинаковы, т.е. n3 n4 n5 n6 17,07 ' ' ' ' n7 n f ( x) (b * x6 ) 100 0,0327 (56,1707 52,208) 10,9 ' 4. Сравним эмпирические и теоретические частоты, используя критерий Пирсона, приняв число степеней свободы k = S – 3 = 7 – 3 = 4. Для этого составим расчетную таблицу 2.2. Таблица 2.2 ’ ’ ’ 2 ’ 2 i ni ni ni- ni (ni- ni ) (ni- ni ) / ni’ 1 6 1,7 4,3 18,49 10,88 2 5 17,07 -12,07 145,68 8,53 3 16 17,07 -1,07 1,14 0,07 4 28 17,07 10,93 119,46 7,00 5 18 17,07 0,93 0,86 0,05 6 20 17,07 2,93 8,58 0,50 7 7 10,9 -3,9 15,21 1,40 набл2= 28,43 Из расчетной таблицы получаем набл2 = 28,43. Найдем по таблице критических точек распределения 2 по уровню значимости = 0,01 и числу степеней свободы k = 4 критическую точку правосторонней области кр2 (0,01;4) = 13,3. Так как набл2 > кр2 – отвергаем гипотезу о равномерном распределении генеральной совокупности. ПРОВЕРКА ГИПОТЕЗЫ О ПОКАЗАТЕЛЬНОМ РАСПРЕДЕЛЕНИИ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ Задано эмпирическое распределение непрерывной случайной величины Х в виде последовательности интервалов xi xi 1 и соответствующих им частот ni, причем ni n (объем выборки). Требуется проверить гипотезу о том, что случайная величина Х имеет показательное распределение. 13 Правило. Для того, чтобы при уровне значимости а проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо: 1. Найти по заданному эмпирическому распределению выборочную среднюю xB . Для этого, приняв в качестве «представителя» i–го интервала его середину xi* ( xi xi 1 ) / 2 , составляют последовательность равноотстоящих вариант и соответствующих им частот. 2. Принять в качестве оценки параметра λ показательного распределения величину, обратную выборочной средней: * 1 / x B . 3. Найти вероятности попадания Х в частичные интервалы ( xi , xi 1 ) по формуле Pi P( xi X xi 1 ) e xi e xi 1 4. Вычислить теоретические частоты: ni' ni Pi , где n ni – объем выборки. 5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k s 2 , где s – число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s – число интервалов, оставшихся после объединения. По заданной выборке проверим гипотезу о показательном распределении генеральной совокупности: 1. x B 40,8893 . 2. Найдем оценку параметра предполагаемого показательного * распределения: 1 / x B 0,02. Таким образом, дифференциальная функция предполагаемого показательного распределения имеет вид f ( x) 0,02e 0.02 x ( x 0) 4. Найдем вероятности попадания Х в каждый из интервалов по формуле Pi P( xi X xi 1 ) e xi e xi 1 Например, для первого интервала P0 P(0 X 10,48) e 0, 020 e 0, 0210 , 48 1 e 0, 2096 1 77,39 0,2261 Аналогично вычислим вероятности попадания Х в другие интервалы: 14 P1 e 0, 0210 , 48 e 0, 0215 , 696 0,0927 ; P2 e 0, 0215 , 696 e 0 , 0220 ,912 0,0816 ; P3 e 0 , 0220 ,912 e 0, 0226 ,128 0,0718 ; P4 e 0, 0226 ,128 e 0, 0231,344 0,0632 ; P5 e 0, 0231,344 e 0 , 0236 ,56 0,0556 ; P6 e 0 , 0236 ,56 e 0 , 0241, 776 0,0490 ; P7 e 0, 0241, 776 e 0, 0246 , 992 0,0431; P8 e 0 , 0246 ,992 e 0, 0252 , 208 0,0379 ; P9 e 0, 0252 , 208 e 0 , 0257 , 424 0,0334 ; P10 e 0 , 0357 , 424 e 0, 0362 , 24 0,0294 ; P e 0 , 0362 , 24 e 0,2161 . 4. Найдем теоретические частоты: ni' n Pi 100 Pi , где Рi – вероятность попадания Х в i-ый интервал. n0 100 P0 22,61; n6 100 P6 4,90; n1 100 P1 9,27; n7 100 P7 4,31; n2 100 P2 8,16; n8 100 P8 3,79; n3 100 P3 7,18; n9 100 P9 3,34; n4 100 P4 6,32; n10 100 P10 2,94; n5 100 P5 5,56; n 100 P 21,61 . ' ' ' ' ' ' ' ' ' ' ' ' 5. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу 2.3, причем объединим малочисленные частоты и соответствующие им теоретические частоты. Таблица 2.3 ’ ’ ’ 2 ’ 2 ’ i ni ni ni- ni (ni- ni ) (ni- ni ) / ni 6 1 47,22 -41,22 1698,88 35,9800 5 2 6,32 -1,32 1,75 0,2762 16 3 5,56 10,44 108,90 19,5719 28 4 4,90 23,10 533,71 108,9664 18 5 4,31 13,69 187,38 43,4624 20 6 3,79 16,21 262,60 69,1974 7 7 27,89 -20,89 436,43 15,6477 набл2=293,1020 15 Из таблицы 1.7 находим набл2 = 293,1020. По таблице критических точек распределения 2, по уровню значимости = 0,01 и числу степеней свободы k = s-2 = 7-2 = 5 критическую точку правосторонней области кр2 (0,01;5) = 15,1. Так как набл2 > кр2 – отвергаем гипотезу о показательном распределении генеральной совокупности. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПО КРИТЕРИЮ ПИРСОНА Пусть эмпирическое распределение задано в виде последовательности интервалов ( xi xi 1 ) и соответствующих им частот ni (ni – сумма частот, которые попали в i-й интервал): ( x1 , x2 ) ( x2 , x3 ) ( x s , x s 1 ) ns n1 n2 Требуется, используя критерий Пирсона, проверить гипотезу о том, что генеральная совокупность Х распределена нормально. Правило. Для того, чтобы при уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности, надо: 1. Вычислить, например методом произведений, выборочную среднюю x и выборочное среднее квадратическое отклонение B , причем в качестве * вариант xi принимают среднее арифметическое концов интервала: xi* ( xi xi 1 ) / 2 . 2. Пронормировать Х, то есть перейти к случайной величине и вычислить концы интервалов: z i ( xi x * ) / * , Z (X x* ) / * , z i 1 ( xi 1 x * ) / * , причем наименьшее значение Z, то есть z1, полагают равным – , а наибольшее, то есть zs+1, полагают равным . 3. Вычислить теоретические частоты ni' n Pi , где п – объем выборки (сумма всех частот); Pi Ф( z i 1 ) Ф( z i ) – вероятности попадания Х в интервалы ( xi , xi 1 ) ; Ф (Z) – функция Лапласа. 4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого: а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия Пирсона 2 2 набл ( ni ni' ) / ni' ; б) по таблице критических точек распределения 2, по заданному уровню значимости и числу степеней свободы k s 3 (s – число интервалов выборки) находят критическую точку правосторонней критической области кр2 ( ; k ). 2 2 Если набл – нет оснований отвергнуть гипотезу о нормальном кр 16 распределении генеральной совокупности. Если отвергают. 2 2 набл кр – гипотезу Проверим гипотезу нормальном распределении генеральной совокупности с использованием критерия Пирсона: 1. x B 40,8893 . 2. Найдем интервалы (zi, zi+1). Для этого составим расчетную таблицу 2.4 (левый конец первого интервала примем равным -, а правый конец последнего интервала ). Таблица 2.4 Границы интервала Границы интервала i 1 2 3 4 5 6 7 8 9 10 xi x * xi x * xi 1 x zi * xi xi+1 10,48 15,696 -25,1933 15,696 20,912 -25,1933-19,9773 20,912 26,128 -19,9773-14,7613 26,128 31,344 -14,7613 -9,5453 31,344 36,56 -9,5453 -4,3293 36,56 41,776 -4,3293 0,8867 41,776 46,992 0,8867 6,1027 46,992 52,208 6,1027 11,3187 52,208 57,424 11,3187 16,5347 57,424 62,64 16,5347 - - -2,8555 -2,2643 -1,6731 -1,0819 -0,4907 0,1005 0,6917 1,2829 1,8741 z i 1 x i 1 x * -2,8555 -2,2643 -1,6731 -1,0819 -0,4907 0,1005 0,6917 1,2829 1,8741 3. Найдем теоретические вероятности Рi и теоретические частоты n n Pi 100 Pi . Для этого составим расчетную таблицу 2.5. ' i 17 Таблица 2.5 Границы интервала i 1 2 3 4 5 6 7 8 9 10 zi -2,8555 -2,2643 -1,6731 -1,0819 -0,4907 0,1005 0,6917 1,2829 1,8741 zi+1 -2,8555 -2,2643 -1,6731 -1,0819 -0,4907 0,1005 0,6917 1,2829 1,8741 - Ф(zi) -0,5000 -0,4979 -0,4881 -0,4525 -0,3599 -0,1879 0,0398 0,2549 0,3997 0,4693 Pi= Ф(zi+1)Ф(zi+1) Ф(zi) ni’=100Pi -0,4979 0,0021 0,21 -0,4881 0,0098 0,98 -0,4525 0,0356 3,56 -0,3599 0,0926 9,26 -0,1879 0,1720 17,2 0,0398 0,2277 22,77 0,2549 0,2151 21,51 0,3997 0,1448 14,48 0,4693 0,0696 6,96 0,5000 0,0307 3,07 1,0000 100 4. Сравним эмпирические и теоретические частоты, используя критерий Пирсона: а) вычислим наблюдаемое значение критерия Пирсона. Для этого составим расчетную таблицу 2.6. Таблица 2.6 ’ ’ ’ 2 ’ 2 ’ 2 i ni ni ni- ni (ni- ni ) (ni- ni ) / ni ni ni2/ ni’ 1 6 4,75 1,25 1,5625 0,3289 36 7,5789 2 5 9,26 -4,26 18,1476 1,9598 25 2,6998 3 16 17,2 -1,2 1,4400 0,0837 256 14,8837 4 28 22,77 5,23 27,3529 1,2013 784 34,4313 5 18 21,51 -3,51 12,3201 0,5728 324 15,0628 6 20 14,48 5,52 30,4704 2,1043 400 27,6243 7 7 10,03 -3,03 9,1809 0,9153 49 4,8853 2 набл =7,1661 107,1661 Столбцы 7 и 8 служат для контроля вычислений по формуле 2 набл ( ni ni' ) / ni' 2 Контроль: (ni ni' ) n 107 ,1661 100 7,1661 набл . Вычисления произведены правильно. б) По таблице критических точек распределения 2, по уровню значимости = 0,01 и числу степеней свободы k = s-3 = 7-3 = 4 критическую точку правосторонней области кр2 (0,01;4) = 13,3. Так как набл2 < кр2 – нет оснований отвергнуть гипотезу о равномерном распределении генеральной совокупности. Данные наблюдений согласуются с гипотезой о нормальном распределении. 2 18 2 КОНТРОЛЬНАЯ РАБОТА №3 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ Цель: применить формулу функции регрессии для прогноза изменения одного признака пи изменении другого; научиться выявлять зависимости между признаками по значению выборочного коэффициента корреляции. Задача: 1. Найти линейные функции регрессии (предварительно отыскав выборочный коэффициент корреляции) и построить их графики. 2. Проверить гипотезу о значимости выборочного коэффициента корреляции (при = 0,05). Индивидуальные задания 1. Результаты рост Х (см) и веса Y (см) 136 школьников младших классов приведены в следующей таблице: Y X 117,5122,5 122,5127,5 127,5132,5 132,5137,5 137,5142,5 142,5147,5 147,5152,5 Всего 22,5-25,5 25,5-28,5 4 8 4 28,5-31,5 31,5-34,5 34,5-37,5 Всего 12 6 14 4 24 4 12 12 28 4 14 16 6 40 4 10 6 20 4 4 8 4 4 20 136 22 44 46 Предполагая, что между Х и Y существует линейная корреляционная зависимость, требуется: а) вычислить коэффициент корреляции и проанализировать степень тесноты и направление связи; б) составить уравнения прямых регрессии и построить их графики; в) используя соответствующее уравнение регрессии, определить рост школьника при весе в 45 кг. 19 2. Результаты рост Х (см) и веса Y (см) 86 школьников младших классов приведены в следующей таблице: Y X 117,5122,5 122,5127,5 127,5132,5 132,5137,5 137,5142,5 142,5147,5 147,5152,5 Всего 22,5-25,5 25,5-28,5 3 5 3 28,5-31,5 31,5-34,5 34,5-37,5 Всего 8 4 8 3 15 3 7 7 17 3 8 9 4 24 3 6 4 13 3 3 6 3 3 14 86 15 26 28 Предполагая, что между Х и Y существует линейная корреляционная зависимость, требуется: а) вычислить коэффициент корреляции и проанализировать степень тесноты и направление связи; б) составить уравнения прямых регрессии и построить их графики; в) используя соответствующее уравнение регрессии, определить рост школьника при весе в 42 кг. 3. Данные о распределении 135 предприятий по производительности труда Y (в млн. руб. на одного рабочего) и уровню автоматизации производства Х (в процентах) даны в следующей таблице: Y 1-2 2-4 4-6 1-20 20-40 40-60 60-80 80-100 Всего 3 4 2 3 4 7 9 5 3 8 12 5 12 285 28 6-8 8-10 10-12 Всего 5 5 4 14 10 26 48 363 18 1385 X 20 7 14 8 5 34 6 7 9 22 Предполагая, что между Х и Y существует линейная корреляционная зависимость, требуется: а) вычислить коэффициент корреляции и проанализировать степень тесноты и направление связи; б) составить уравнения прямых регрессии и построить их графики; в) используя соответствующее уравнение регрессии, определить среднюю производительность труда одного рабочего при уровне автоматизации производства, равном 72%. 4. Взаимосвязь между стоимостью активной части основных фондов и затратами на производство работ по 35 строительным фирмам представлена следующей таблицей: Затраты на производство строительно-монтажных работ, % к стоимости активной части основных фондов 1-5 5-9 9-13 13-17 17-21 Итого Стоимость активной части основных фондов, Тыс. руб. 50100150200100 150 200 250 2 4 2 6 4 5 3 2 2 5 7 9 11 8 Всего фирм 6 12 8 4 5 35 Построить эмпирическую линию регрессии. Найти стоимость активной части основных фондов (тыс. руб.), если затраты на производство строительномонтажных работ увеличатся до 23 % к стоимости активной части основных фондов. (Предварительно найти уравнение регрессии) 5. Дано распределение 74 однотипных предприятий по величине их основных производственных фондов Х (в млн. руб.) и суточной выработке продукции У (в тыс. руб.) Х У 25-30 30-35 35-40 40-45 45-50 Всего 11-15 4 5 9 15-19 19-23 7 5 12 4 16 21 23-27 27-31 9 8 3 20 5 3 8 Всего 4 19 28 17 6 74 Считая, что между Х и У существует линейная корреляционная зависимость, требуется: 1) вычислить коэффициент корреляции и проанализировать степень тесноты и направление связи между Х и У; 21 б) составить уравнения прямых регрессии и построить их графики; в) используя соответствующее уравнение регрессии, определить среднюю суточную выработку продукции при основных фондах в 60 млн. рублей. 6. По выборке объема n, извлеченной из двумерной нормальной совокупности (X,Y): а) найти выборочный коэффициент корреляции; б) найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y; X Y 53-58 58-63 63-68 68-73 73-78 78-83 ny -321 -304 3 3 -304 -287 -287 -270 7 24 1 7 25 -270 -253 -253 -236 4 11 9 9 18 15 -236 -219 1 5 -219 -202 4 6 4 nx 5 9 20 33 8 3 78 Вычислить значение Х, если значение Y увеличится до -200. 7. По выборке объема n, извлеченной из двумерной нормальной совокупности (X,Y): а) найти выборочный коэффициент корреляции; б) найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y; X Y 53-58 58-63 63-68 68-73 73-78 78-83 ny -320 -305 3 3 -305 -290 -290 -275 7 24 2 7 26 -275 -260 -260 -245 4 11 10 9 19 15 -245 -230 1 5 -230 -215 4 6 4 nx 5 9 21 33 9 3 80 Вычислить значение Х, если значение Y увеличится до -180. 8. По выборке объема n, извлеченной из двумерной нормальной совокупности (X,Y): а) найти выборочный коэффициент корреляции; б) найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y; Y 5 22 10 15 20 X 25 30 35 40 ny 100 2 1 — — — — — — 3 120 3 4 3 — — — — .— 10 140 — — 5 10 8 — — — 23 160 — — — 1 — 6 1 1 9 180 — — — — — — 4 1 5 nx 5 5 8 11 8 6 5 2 n=50 Вычислить значение Х, если значение Y увеличится до 200. 9. По выборке объема n, извлеченной из двумерной нормальной совокупности (X,Y): а) найти выборочный коэффициент корреляции; б) найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y. Y 125 150 175 200 225 250 nx 18 — 1 — — — — 1 23 1 2 3 — — — 6 28 — 5 2 1 — — 8 33 — — 12 8 — — 20 X 38 — — — 7 3 — 10 43 — — — — 3 1 4 48 — — — — — 1 1 ny 1 8 17 16 6 2 n=50 Вычислить значение У, если значение Х увеличится до 50. 10. По выборке объема n, извлеченной из двумерной нормальной совокупности (X,Y): а) найти выборочный коэффициент корреляции; б) найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y. Y X 5 100 120 140 160 180 4 3 10 4 1 15 20 25 9 5 12 5 1 30 6 4 35 1 2 ny 7 6 26 13 5 23 200 2 1 nx 9 6 3 14 13 5 10 3 n=60 Вычислить значение У, если значение Х увеличится до 40. КОНТРОЛЬНЫЙ ПРИМЕР (ОБРАЗЕЦ ВЫПОЛНЕНИЯ). Данные о распределении 144 предприятий по производительности труда Y (в млн. руб. на одного рабочего) и уровню автоматизации производства X (в %) представлены в следующей таблице 3.1: Таблица 3.1. Исходные данные X 1 20 20 40 40 60 60 80 80 100 всего ny Y 1 2 3 4 4 7 2 4 4 7 9 8 4 6 3 8 12 5 18 28 28 6 8 8 10 7 14 8 5 34 6 7 9 22 10 12 5 5 4 14 всего nx 10 26 50 40 18 144 Решение: 1. вычислим коэффициент корреляции: rВ n uv uv n uv . nσ u σ v Перейдем от интервальных значений к серединам этих интервалов: Таблица 3.2 Переход от интервальных значений к серединам Y X 1 3 5 7 9 11 всего nx 10 30 50 70 90 всего ny 24 3 4 4 7 4 7 9 8 3 8 12 5 18 28 28 7 14 8 5 34 6 7 9 22 5 5 4 14 10 26 50 40 18 144 Составим корреляционную таблицу в условных вариантах, выбрав в качестве ложных нулей С1=7 и С2=50:перейдем от интервальных значений к серединам этих интервалов: Таблица 3.3 Переход к условным вариантам v u nu -3 -2 -1 0 1 2 3 4 3 10 -2 4 7 8 7 26 -1 0 1 2 всего nv 4 7 9 8 12 5 18 28 28 14 8 5 34 6 7 9 22 5 5 4 14 50 40 18 144 Найдем nuvuv , для этого составим расчетную таблицу 3.4: Таблица 3.4 Расчетная таблица V v u -3 -2 -9 3 -2 -14 7 0 34 10 -26 0 10 -25 -25 5 8 17 34 0 0 5 5 0 -5 8 6 6 0 -16 8 0 14 7 8 7 8 5 7 5 0 9 5 2 U vU -34 -7 -12 12 0 7 40 7 -8 -18 9 0 -20 0 8 -7 -21 1 -8 7 -12 0 2 -6 -12 4 1 3 -8 -4 0 -3 4 -6 4 -1 -1 -8 uV 10 9 18 4 8 -3 -7 -9 11 25 13 9 14 9 0 25 26 сумма 83 83 Суммируя числа последнего столбца таблицы находим v *U u *V = nuvuv =83 v u Найдём u и v : u =( nu u )/n=(18*(-3)+28*(-2)+28*(-1)+34*0+22*1+14*2)/144=-0,61 v =( nv v )/n=(10*(-2)+26*(-1)+50*0+40*1+18*2)/144=0,21 Найдем вспомогательные величины: 25 u 2 =( nu u 2 )/n=(18*(-3)2+28*(-2)2+28(-1)2+34*02+22*12+14*22)/144=2,71 v 2 =( nv v 2 )/n=(10*(-2)2+26*(-1)2+50*02+40*12+18*22)/144=1,24 Найдем u и v : u = u 2 (u ) 2 = 2,71 (0,61) 2 1,53 v = v 2 (v) 2 = 1 / 24 (0 / 21) 2 1,1 Найдем искомый выборочный коэффициент корреляции: rВ n uv uv n uv 83 144 * (0,61) * 0,21 = =0,42 144 *1,53 *1,1 nσ u σ v Значение ∞ rВ положительное, следовательно зависимость признаками прямая. Связь между признаками средняя, так как 0,3< rВ < 0,7. между 2. Составим уравнения прямых регрессии и построим их графики: Выборочное уравнение прямой линии регрессии Y на X: y x y rВ y ( x x) x Выборочное уравнение прямой линии регрессии X на Y: x y x rВ x ( y y) y Найдем шаги h1 и h2 (разности между соседними вариантами): h1 =5-3=2 h2 =50-30=20 Найдем x и y , учитывая, что С1=7, С2=50: x = u * h1+ С1=-0,61*2+7=5,78 y = v * h2+ С2=0,21*20+50=54,2 Найдем x и y : x = h1* u =2*1,53=3,06 y = h2* v =50*1,1=55 Подставив найденные величины в уравнение y x y rВ искомое уравнение прямой линии регрессии Y на X: y x -54,2=0,42*55/3,06*(x - 5,78) y x =82,1x - 420,6 26 y ( x x) , получим x Подставив найденные величины в уравнение x y x rВ x ( y y ) , получим y искомое уравнение прямой линии регрессии X на Y: x y -5,78=4,57*3,06/55*(y-54,2) x y =0,25y+8 Построим графики прямых регрессии (рис.3). 3. Используя соответствующее уравнение регрессии, определим среднюю производительность труда одного рабочего при уровне автоматизации производства, равном 72%: y x =82,1*72-420,6=5490,6 YX 8 12 XY 5y +8 Y=82,1x - 420,6 4 8 4 X= 0,2 0 12 Рисунок 3. Графики прямых регрессии 4. Проверим гипотезу о значимости выборочного коэффициента корреляции (при =0,05) В качестве критерия проверки гипотезы принимают случайную величину, распределенную по закону Стьюдента: Тнабл = rВ n 2 1 rВ2 27 Тнабл = 0,42 144 2 1 0,42 2 =5,55 =144-2=142 tкр( ; ) = 1,96 Вывод: |Тнабл |> tкр ( ; ) следовательно, отвергаем нулевую гипотезу, т.е. генеральный коэффициент корреляции значимо отличается от нуля. 28 Приложение №1 х Таблица значений функции Ф(х)= x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 Ф(х) 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,1179 0,1217 x 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 Ф(х) 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,2257 0,2291 0,2324 0,2357 x 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 1 е z2 2 dz 2П 0 Ф(х) 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 X 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 Ф(х) 0,3315 0,3340 0,3365 0,3389 0,3413 0,3438 0,3261 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 0,3849 0,3869 0,3883 0,3907 0,3925 0,3944 29 Продолжение приложения 1 x 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 30 Ф(х) 0,3962 0,3980 0,3997 0,4015 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 X 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91 Ф(х) 0,4441 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 0,4554 0,4564 0,4573 0,4582 0,4591 0,5499 0,4608 0,4616 0,4625 0,4633 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 0,4713 0,4719 x 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00 2,02 2,04 2,06 2,08 2,10 2,12 2,14 2,16 2,18 2,20 2,22 2,24 2,26 2,28 2,30 2,32 2,34 2,36 2,38 2,40 2,42 2,44 2,46 2,48 Ф(х) 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 0,4772 0,4783 0,4793 0,4803 0,4812 0,4821 0,4830 0,4838 0,4846 0,4854 0,4861 0,4868 0,4875 0,4881 0,4887 0,4893 0,4898 0,4904 0,4909 0,4913 0,4918 0,4922 0,4927 0,4931 0,4934 x 2,50 2,52 2,54 2,56 2,58 2,60 2,62 2,64 2,66 2,68 2,70 2,72 2,74 2,76 2,78 2,80 2,82 2,84 2,86 2,88 2,90 2,92 2,94 2,96 2,98 3,00 3,20 3,40 3,60 3,80 4,00 4,50 5,00 Ф(х) 0,4938 0,4941 0,4945 0,4948 0,4951 0,4953 0,4956 0,4959 0,4961 0,4963 0,4965 0,4967 0,4969 0,4971 0,4973 0,4974 0,4976 0,4977 0,4979 0,4980 0,4981 0,4982 0,4984 0,4985 0,4986 0,49865 0,49931 0,49966 0,499841 0,499928 0,499968 0,499997 0,499997 Приложение №2 Таблица значений t=t(,n) n 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 0,999 0,95 0,99 2,78 2,57 2,45 2,37 2,31 2,26 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,11 2,10 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88 n 8,61 6,86 5,96 5,41 5,04 4,78 4,59 4,44 4,32 4,22 4,14 4,07 4,02 3,97 3,92 20 25 30 35 40 45 50 60 70 80 90 100 120 0,95 0,99 0,999 2,093 2,064 2,045 2,032 2,023 2,016 2,009 2,001 1,996 1,991 1,987 1,984 1,980 1,960 2,861 2,797 2,756 2,720 2,708 2,692 2,679 2,662 2,649 2,640 2,633 2,627 2,617 2,576 3,883 3,745 3,659 3,600 3,558 3,527 3,502 3,464 3,439 3,418 3,403 3,392 3,374 3,291 0,95 0,99 0,999 0,37 0,32 0,28 0,26 0,24 0,22 0,21 0,188 0,174 0,161 0,151 0,143 0,115 0,099 0,089 0,58 0,49 0,43 0,38 0,35 0,32 0,30 0,269 0,245 0,226 0,211 0,198 0,160 0,136 0,120 0,88 0,73 0,63 0,56 0,50 0,46 0,43 0,38 0,34 0,31 0,29 0,27 0,211 0,185 0,162 Приложение №3 Таблица значений q=q(,n) n 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 0,95 0,99 0,999 1,37 1,09 0,92 0,80 0,71 0,65 0,59 0,55 0,52 0,48 0,46 0,44 0,42 0,40 0,39 2,67 2,01 1,62 1,38 1,20 1,08 0,98 0,90 0,83 0,78 0,73 0,70 0,66 0,63 0,60 5,64 3,88 2,98 2,42 2,06 1,80 1,60 1,45 1,33 1,23 1,15 1,07 1,01 0,96 0,92 n 20 25 30 35 40 45 50 60 70 80 90 100 150 200 250 31 Приложение №4 Критические точки распределения 2 Число степеней свободы k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 32 Уровень значимости 0,01 0,025 0,05 0,95 0,975 0,99 6,6 9,2 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9 5,0 7,4 9,34 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,5 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0 3,8 6,0 7,8 9,5 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8 0,0039 0,103 0,352 0,711 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,1 10,9 11,6 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5 0,00098 0,051 0,216 0,484 0,831 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8 0,00016 0,020 0,115 0,297 0,554 0,872 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0 Число степеней свободы k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 Приложение №5 Критические точки распределения Стьюдента Уровень значимости (двусторонняя критическая область) 0,10 0,05 0,02 0,01 0,002 0,001 6,31 12,7 31,82 63,7 318,3 637,0 2,92 4,30 6,97 9,92 22,33 31,6 2,35 3,18 4,54 5,84 10,22 12,9 2,13 2,78 3,75 4,60 7,17 8,61 2,01 2,57 3,37 4,03 5,89 6,86 1,94 2,45 3,14 3,71 5,21 5,96 1,89 2,36 3,00 3,50 4,79 5,40 1,86 2,31 2,90 3,36 4,50 5,04 1,83 2,26 2,82 3,25 4,30 4,78 1,81 2,23 2,76 3,17 4,14 4,59 1,80 2,20 2,72 3,11 4,03 4,44 1,78 2,18 2,68 3,05 3,93 4,32 1,77 2,16 2,65 3,01 3,85 4,22 1,76 2,14 2,62 2,98 3,79 4,14 1,75 2,13 2,60 2,95 3,73 4,07 1,75 2,12 2,58 2,92 3,69 4,01 1,74 2,11 2,57 2,90 3,65 3,96 1,73 2,10 2,55 2,88 3,61 3,92 1,73 2,09 2,54 2,86 3,58 3,88 1,73 2,09 2,53 2,85 3,55 3,85 1,72 2,08 2,52 2,83 3,53 3,82 1,72 2,07 2,51 2,82 3,51 3,79 1,71 2,07 25,0 2,81 3,49 3,77 1,71 2,06 2,49 2,80 3,47 3,74 1,71 2,06 2,49 2,79 3,45 3,72 1,71 2,06 2,48 2,78 3,44 3,71 1,71 2,05 2,47 2,77 3,42 3,69 1,70 2,05 2,46 2,76 3,40 3,66 1,70 2,05 2,46 2,76 3,40 3,66 1,70 2,04 2,46 2,75 3,39 3,65 1,68 2,02 2,42 2,70 3,31 3,55 1,67 2,00 2,39 2,66 3,23 3,46 1,66 1,98 2,36 2,62 3,17 3,37 1,64 1,96 2,58 2,58 3,09 3,29 0,05 0,025 0,01 0,005 0,001 0,0005 Уровень значимости (односторонняя критическая область) 33 Приложение №6 Критические точки распределения F Фишера-Снедекора (K1 – число степеней свободы большей дисперсии, K2 - число степеней свободы меньшей дисперсии) Уровень значимости =0,01 К1 К2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1 2 3 4 5 6 7 8 9 10 11 12 4052 4999 5403 5625 5764 5889 5928 5981 6022 6056 6082 6106 98,49 99,01 90,17 99,25 99,33 99,30 99,34 99,36 99,36 99,40 99,41 99,42 34,12 30,81 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,54 14,45 14,37 16,26 13,27 12,39 11,39 10,97 10,67 10,45 10,27 10,15 10,05 9,96 9,89 13,74 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 12,25 9,55 8,45 7,85 7,46 7,19 7,00 6,48 6,71 6,26 6,54 6,47 11,26 8,65 7,59 7,01 6,63 6,37 6,19 6,03 5,91 5,82 5,74 5,67 10,56 8,02 6,99 6,42 6,06 5,80 5,62 5,74 5,35 5,26 5,18 5,11 10,04 7,56 6,55 5,99 5,64 5,39 5,21 5,06 4,95 4,85 4,78 4,71 9,86 7,20 6,22 5,67 5,32 5,07 4,88 4,74 4,63 4,54 4,46 4,40 9,33 6,93 5,95 5,41 5,06 4,82 4,65 4,50 4,39 4,30 4,22 4,16 9,07 6,70 5,74 5,20 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 8,86 6,51 5,56 5,03 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,61 3,55 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,45 Уровень значимости =0,05 К1 К2 1 2 3 4 5 6 7 34 1 2 3 4 5 6 7 8 9 10 11 12 161 200 216 225 230 234 237 239 241 242 243 244 18,51 19,00 19,16 19,25 19,30 19,33 19,36 19,37 19,38 19,39 19,40 19,41 10,13 9,55 9,28 9,12 9,01 8,94 8,88 8,84 8,81 8,78 8,76 8,74 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,93 5,91 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,78 4,74 4,70 4,68 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,63 3,60 3,57 8 9 10 11 12 13 14 15 16 17 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,34 3,31 3,28 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,13 3,10 3,07 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,97 2,94 2,91 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,86 2,82 2,79 4,75 3,88 3,49 3,26 3,11 3,00 2,92 2,85 2,80 2,76 2,72 2,69 4,67 3,80 3,41 3,18 3,02 2,92 2,84 2,77 2,72 2,67 2,63 2,60 4,60 3,74 3,34 3,11 2,96 2,85 2,77 2,70 2,65 2,60 2,56 2,53 4,54 3,68 3,29 3,06 2,90 2,79 2,70 2,64 2,59 2,55 2,51 2,48 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,45 2,42 4,45 3,59 3,20 2,96 2,81 2,70 2,62 2,55 2,50 2,45 2,41 2,38 Приложение №7 Критические точки распределения Кочрена (k – число степеней свободы, l – количество выборок) Уровень значимости =0,01 K l 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 1 2 3 4 5 6 7 0,9999 9933 9676 0,9279 8828 8376 0,7945 7544 7175 0,6528 5747 4799 0,4247 3632 2940 0,2151 1225 0000 0,9950 9423 8643 0,78855 7218 6644 0,6152 5727 5358 0,4751 4069 3297 0,2871 2412 1915 0,1371 0759 0000 0,9794 8831 7814 0,6957 6258 5685 0,5209 4810 4469 0,3919 3317 2654 0,2295 1913 1508 0,1069 0585 0000 0,9586 8335 7212 0,6329 5635 5080 0,4627 4251 3934 0,3428 2882 2288 0,1970 1635 1281 0,0902 0489 0000 0,9373 7933 6761 0,5875 5195 4659 0,4226 3870 3572 0,3099 2593 2048 0,1759 1454 1135 0,0796 0429 0000 0,9172 7606 6410 0,5531 4866 4347 0,3932 3592 3308 0,2861 2386 1877 0,1608 1327 1033 0,0722 0387 0000 0,8988 7335 6129 0,5259 4608 4105 0,3704 3378 3106 0,2680 2228 1748 0,1495 1232 0957 0,0668 0357 0000 35 Уровень значимости =0,01 K l 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 8 9 10 16 36 144 0,8823 7107 5897 0,5037 4401 3911 0,3522 3207 2945 0,2535 2104 1646 0,1406 1157 0898 0,0625 0334 0000 0,8674 6912 5702 0,4854 4229 3751 0,33373 3067 2813 0,2419 2002 1567 0,1338 1100 0853 0,0594 0316 0000 0,8539 6743 5536 0,4697 4084 3616 0,3248 2950 2704 0,2320 1918 1501 0,1283 1054 0816 0,0567 0302 0000 0,7949 6059 4884 0,4094 3529 3105 0,2779 2514 2297 0,1961 1612 1248 0,1060 0867 0668 0,0461 0242 0000 0,7067 5153 4057 0,3351 2858 2494 0,2214 1992 1811 0,1535 1251 0960 0,0810 0658 0503 0,0344 0178 0000 0,6062 4230 3251 0,2644 2229 1929 0,1700 1521 1376 0,1157 0934 0709 0,595 0480 0363 0,0245 0125 0000 0,5000 3333 2500 0,2000 1667 1429 0,1250 1111 1000 0,0833 0667 0500 0,0417 0333 0250 0,0167 0083 0000 Уровень значимости =0,05 K l 2 3 4 5 6 7 8 9 10 12 15 36 1 2 3 4 5 6 7 0,9985 9669 9065 0,8412 7808 7271 0,6798 6385 6020 0,5410 4709 0,9750 8709 7679 0,6338 6161 5612 0,5157 4775 4450 0,3924 3346 0,9392 7977 6841 0,5981 5321 4800 0,4377 4027 3733 0,3624 2758 0,9057 7457 6287 0,5440 4803 4307 0,3910 3584 3311 0,2880 2419 0,8772 7071 5895 0,5063 4447 3974 0,3595 3286 3029 0,2624 2195 0,8534 6771 5598 0,4783 4184 3726 0,3362 3067 2823 0,2439 2034 0,8332 6530 5365 0,4564 3980 3535 0,3185 2901 2666 0,2299 1911 20 24 30 40 60 120 3894 0,3434 2929 2370 0,1737 0998 0000 2705 0,2354 1980 1576 0,1131 0632 0000 2205 0,1907 1593 1259 0,0895 0495 0000 1921 0,1656 1377 1082 0,0765 0419 0000 1735 0,1493 1237 0968 0,0682 0381 0000 1602 0,1374 1137 0887 0,0623 0337 0000 1501 0,1286 1261 0827 0,0583 0312 0000 Уровень значимости =0,05 K l 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 8 9 10 16 36 144 0,8159 6333 5175 0,4387 3817 3384 0,3043 2768 2541 0,2187 1815 1422 0,1216 1002 0780 0,0552 0292 0000 0,8010 6167 5017 0,4241 3682 3259 0,2926 2659 2439 0,2098 1736 1357 0,1160 0958 0745 0,0520 0279 0000 0,7880 6025 4884 0,4118 3568 3154 0,2829 2568 2353 0,2020 1671 1303 0,1113 0920 0713 0,0497 0266 0000 0,7341 5466 4366 0,3645 3135 2756 0,2462 2226 2032 0,1737 1429 1108 0,0942 0771 0595 0,0411 0218 0000 0,6602 4748 3720 0,3066 2612 2278 0,2022 1820 1655 0,1403 1144 0879 0,0743 0604 0462 0,0316 0165 0000 0,5813 4031 3093 0,2013 2119 1833 0,1616 1446 1308 0,1100 0889 0675 0,0567 0457 0347 0,0234 0120 0000 0,5000 3333 2500 0,2000 1667 1429 0,1250 1111 1000 0,0833 0667 0500 0,0417 0333 0250 0,0167 0083 0000 37 ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Методические указания для выполнения контрольной работы Составитель Татьяна Юрьевна Чернышева Подписано к печати 15.04.2008 Формат 60х84/16. Бумага офсетная Плоская печать. Усл. печ. л. 1,39 Уч. - изд. л.1,26 Тираж 30 экз. Заказ № . Цена свободная. ИПЛ ЮФ ТПУ. Лицензия ПЛД № 44-55 от 14.12.97. Ризограф ЮФ ТПУ. 652000, г. Юрга, ул. Московская, 17 38