Министерство здравоохранения Российской Федерации Государственное бюджетное образовательное учреждение высшего профессионального образования «Северо-Западный государственный медицинский университет имени И.И. Мечникова» Министерства здравоохранения Российской Федерации Кафедра общественного здоровья и здравоохранения ОСНОВЫ КОРРЕЛЯЦИОННОГО АНАЛИЗА ПРИ КОМПЛЕКСНОЙ ОЦЕНКЕ ЗДОРОВЬЯ НАСЕЛЕНИЯ под ред. з.д.н. РФ, проф. В.С. Лучкевича Учебно-методическое пособие Санкт-Петербург 2015 г. УДК 614.1:614.2 (07) Основы корреляционного анализа при комплексной оценке здоровья населения / под ред. проф. В.С. Лучкевича: учебно-методическое пособие. – СПб: Изд-во СЗГМУ им. И. И. Мечникова, 2015. – 52 с. Авторский коллектив: В.С. Лучкевич, А. Н. Пивоваров, Г. М. Пивоварова, П.Н. Морозько, И.Л. Самодова, Е.А. Абумуслимова, Т.В. Самсонова, С.Н. Носков, Д.С. Тягунов, А.М. Шакиров, Э.В. Миронченко. Рецензент: зав. кафедрой социальной гигиены, управления и экономики здравоохранения ГБОУ ВПО СЗГМУ им. И.И. Мечникова, доктор медицинских наук, профессор Филатов Владимир Николаевич В учебно-методическом пособии изложены основные методики использования коэффициентов корреляции в практической деятельности врача, представлены методики использования рангового метода Спирмена, коэффициента корреляции рангов Кендэла, коэффициента ассоциации и сопряженности (контингенции), коэффициента корреляции Пирсона. В учебно-методическом пособии даны методики регрессионного анализа, методики измерения связи между признаками с помощью корреляционной решетки. Учебно-методическое пособие содержит образцы решения ситуационных задач, вопросы для самоподготовки, тестовые задания и списки литературы. Учебно-методическое пособие предназначено для студентов обучающихся по направлению подготовки (специальности) Лечебное дело, Медико- профилактическое дело, Стоматология. Утверждено в качестве учебно-методического пособия методическим советом ГБОУ ВПО СЗГМУ им. И.И.Мечникова Минздрава России протокол № 3 от «02» октября 2015 г. © В.С. Лучкевич (коллектив авторов), 2015 г. 2 ТЕМА: Основы корреляционного анализа при комплексной оценке здоровья населения. КОНТИНГЕНТ УЧАЩИХСЯ - студенты лечебного, медико- профилактического и стоматологического факультетов медицинских вузов. ПРОДОЛЖИТЕЛЬНОСТЬ ПРАКТИЧЕСКОГО ЗАНЯТИЯ – 4 часа (в академических часах). СТРУКТУРА ЗАНЯТИЯ: Использование коэффициентов корреляции в практической деятельности врача - ранговый метод Спирмена - коэффициент корреляции рангов Кендэла - коэффициенты ассоциации и сопряженности (контингенции) - коэффициент корреляции Пирсона - регрессионный анализ - измерение связи между признаками с помощью корреляционной решетки Решение заданий студентами самостоятельно Решение тестовых заданий студентами 3 ИСПОЛЬЗОВАНИЕ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ В ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ВРАЧА Все существующие в природе связи между признаками и различными явлениями можно подразделить на функциональные и корреляционные. Функциональные связи - это такой вид зависимости между двумя переменными величинами (количественными признаками), когда имеется строгая зависимость одной величины только от одного признака (площадь квадрата зависит от величины стороны квадрата, площадь круга – от радиуса и т.д.). Эти связи постоянны, т.е. проявляются всегда, даже в единичных наблюдениях, изучаются математическими науками и измеряются в соответствии с законами физики. Корреляционные связи. Однако большая группа связей характеризуется такой зависимостью, когда значение одной величины изучаемых явлений (уровень смертности, средняя масса тела, длина тела и др.) определяется влиянием не одного, а многих факторов. Эти связи проявляются только при большом числе наблюдений, так как при единичных они могут не наблюдаться (при большем росте масса тела у отдельных лиц может быть меньше). Эти связи не постоянны, колеблются от нуля до единицы. Ноль означает отсутствие зависимости между признаками, а единица – полную или функциональную связь, когда имеется зависимость только от одного признака. Указанные особенности зависимостей между признаками обусловливают необходимость различных методических подходов к их изучению. Там, где связи постоянны и проявляются всегда, они подлежат изучению точными науками, а там, где наблюдается колеблемость зависимостей между признаками, они становятся предметом изучения статистики. Поэтому корреляционные связи называются также статистическими (например, зависимость уровня заболеваемости (смертности) от возраста населения). Мерой 4 измерения статистической зависимости служат различные коэффициенты корреляции. Оценка этих связей проводится в соответствии с данными, приведенными в табл. 1. Таблица 1 Оценка статистических связей по коэффициентам корреляции Сила связи Прямая Обратная (положительная) связь (отрицательная) связь 1 -1 Сильная (большая) от 1,0 до 0,71 от -1,0 до -0,71 Средняя (умеренная) от 0,7 до 0,31 от -0,7 до -0,31 Слабая (малая) от 0,3 до 0,01 от -0,3 до -0,01 Отсутствует 0 0 Полная (функциональная) Как видно из табл. 1, корреляционные связи могут быть прямыми (положительными) и обратными (отрицательными), в зависимости от того, какая имеется зависимость между признаками. Прямо пропорциональной называется связь, когда при уменьшении одной величины (признака) другая будет увеличиваться, и наоборот, увеличение одной величины (признака) ведет к уменьшению другой. По форме (или направленности) корреляционные связи подразделяются на прямолинейные, когда наблюдается пропорциональное изменение одного признака в зависимости от изменения другого (графически эти связи изображаются в виде прямой линии или близкой к ней), и криволинейные, когда одна величина признака изменяется не пропорционально изменению другой (на графике эти связи имеют вид параболы или иной кривой линии). Таким образом, корреляционные связи различаются по характеру (прямые и обратные), по форме (прямолинейные и криволинейные), по силе (сильная, средняя, слабая) и по достоверности (статистически значимые с высокой вероятностью достоверного прогноза минимум на 95%, максимум – 99% и выше; статистически не значимые, когда достоверность ниже 95%). 5 Существует 3 основных способа представления корреляционных связей: таблицы, графики и коэффициенты корреляции. Наиболее точным, доступным и распространенным способом определения степени параллелизма двух рядов сравниваемых данных является оценка при помощи коэффициентов корреляции. Прежде чем измерить величину корреляционной связи, необходимо определить наличие причинно- следственной связи между изучаемыми явлениями, так как параллельное изменение статистических показателей еще не говорит о наличии связи, так как оно может быть обусловлено случайным совпадением многих обстоятельств, не связанных друг с другом. Цифровые данные, подвергающиеся корреляционному анализу, должны быть сгруппированы с учетом особенностей изучаемых явлений. В противном случае значение полученного коэффициента будет заведомо ошибочным. Подбирать метод определения связи следует с учетом природы или содержания изучаемой статистической информации (схемы 1 и 2). Ранговый метод Спирмена Наиболее простыми и экономичными способами определения корреляции являются непараметрические методы статистического изучения связи между признаками. В то же время они менее точны, применяются при небольшом числе сравниваемых пар (до 30), дают приближенное представление о характере и тесноте связи, поэтому используются для ориентировочной оценки полученных результатов. При этом чаще применяют ранговый коэффициент корреляции Спирмена, который обозначается греческой буквой ρ (“ро”). Этот коэффициент целесообразно использовать: при наличии небольшого числа наблюдений; при сопоставлении как количественных, так и качественных (атрибутивных или описательных) признаков; в случаях, когда сопоставляемые данные носят приближенный характер. 6 Этапы вычисления рангового коэффициента корреляции Спирмена 1. Определение порядковых номеров – рангов (R) изучаемых данных: сначала для одного ряда показателей x, затем в соответствии с проведенной ранжировкой Rx определяются ранговые места (Ry ) для второго показателя y. Порядок ранжирования должен быть выбран один и тот же для ряда x и для ряда y. Он может быть возрастающим, когда ранг № 1 присваивается наименьшему показателю, или убывающим, когда первое место присваивается самому большому показателю, а последнее - самому маленькому. При наличии нескольких равных по величине показателей их порядковые номера (ранги) суммируются, сумма делится на число одинаковых показателей и полученный результат в виде ранга присваивается каждому из определяемых показателей. 2. Вычисление разности d между рангами для каждой пары сравниваемых данных (d= Rx – Ry). 3. Возведение в квадрат каждой разницы d между рангами и определение суммы найденных значений: Σ (Rx – Ry)2 = Σd2. 4. Расчет коэффициента ранговой корреляции по формуле: ρ=1– 6 d2 ; n n2 1 где ρ – коэффициент ранговой корреляции; n – число пар коррелируемых рядов; Σd2 – сумма квадратов разностей между рангами двух коррелируемых рядов; 6 – постоянный коэффициент. 7 ОБРАЗЕЦ РЕШЕНИЯ ЗАДАЧИ Исходные данные и вычисленные параметры для определения коэффициента ранговой корреляции Спирмена Заболеваемость населения брюшным тифом, %оо Охват Ранги населения Разность Квадрат рангов разности d=Rx-Ry d2 прививками, % x Rx Ry y 1,4 14,7 1,5 9 -7,5 56,25 1,4 13,4 1,5 8 -6,5 42,25 2,3 9,6 4 7 -3 9,0 2,1 8,1 3 6 -3 9 6,2 5,5 5 5 0 0 6,9 5,2 6 4 2 4 8,6 4,4 7 2,5 4,5 20,25 10,8 4,4 8 2,5 5,5 30,25 11,0 4,0 9 1 8 64,0 Σd2=235,0 n=9 В формулу из п.4 подставляем вычисленные параметры из задачи: ρ = 1- 6 235 9 81 1 1 1410 1 1,96 720 0,96 Оценку достоверности полученного показателя можно проводить по формуле, а для более точной оценки – по специальной таблице критических значений коэффициентов корреляции Спирмена (см. приложение 1). Так, по таблице при n, равном 9, вероятность 0,05 соответствует коэффициенту 0,6, а вероятность 0,01 соответствует коэффициенту 0,783. В данном случае коэффициент равен 0,96, что позволяет сделать вывод, что между процентом охвата населения прививками и уровнем заболеваемости 8 населения брюшным тифом при наличии соответствующей эпидемической обстановки существует сильная обратная связь с вероятностью безошибочного прогноза ρ<0,01, т.е. связь статистически значима. ОПРЕДЕЛЕНИЕ СВЯЗЕЙ Множественная Парная связь связь Анализ формы связи Анализ степени тесноты связи Линейные связи Нелинейные связи Коэффициент детерминации Индекс детерминации Коэффициент корреляции Индекс корреляции Парный Множественный Частный Схема 1. Анализ определения связей количественными признаками 9 АНАЛИЗ СВЯЗЕЙ МЕЖДУ КАЧЕСТВЕННЫМИ ПРИЗНАКАМИ Парная связь Множественная связь Альтернативные значения Порядковая шкала признаков признаков (ранги) Коэффициент Коэффициент ассоциации конкордации Коэффициент контингенции Порядковая шкала признаков (рангов) Коэффициент корреляции рангов Схема 2. Выбор связей между качественными признаками 10 Коэффициент корреляции рангов Кендэла При проведении углубленных исследований рекомендуется поменять более сложный критерий оценки, который является более чувствительным и при добавлении новой пары наблюдений не требует переранжировки рядов. Алгоритм вычисления коэффициента Кендэла 1.По общим правилам определяют порядковые ранги для каждого варианта ряда x и y. 2.Для каждого ранга второго ряда определяют число последующих рангов, больших по величине, и суммируются полученные числа, определяя величину P. 3.Для каждого ранга второго ряда находят число последующих рангов, которые по величине меньше, чем взятый ранг; найденные величины суммируются и получают величину Q, которая всегда является отрицательным показателем соответствия между рядами рангов и поэтому берется со знаком минус. 4.Вычисляют сумму полученных величин: S= P+Q. 5.Определяют коэффициент Кендэла по формуле, дают ему оценку достоверности: S . 0,5n n 1 Образец решения задачи Исходные данные и параметры для расчета коэффициента корреляции рангов Кендэла 5- летние девочки 11 Ранги Рост, см Масса тела, кг x y Rx Ry 87 13 1 2 89 12 2 1 91 14 3,5 3,5 91 14 3,5 3,5 95 16 5 6 96 15 6,5 5 96 17 6,5 7 97 18 8 8 102 20 9 9 n=9 В соответствии с указанным алгоритмом вычисления для ряда Ry определяют: P = 7 + 7 + 5 + 5 + 4 + 3 + 2 + 1 = 34 Q = 1 + 0 + 0 + 0 +1 + 0 + 0 + 0 = -2 S = P + Q = 34 + (- 2) = 32. Полученную величину S и значение n подставляем в формулу: τ= 32 4,5 9 1 32 36 0,89. По специальной таблице (обычно имеющейся в специальной литературе) значений вероятностей для оценки коэффициентов корреляции рангов Кендэла определяем вероятность ρ, которая должна при достоверной связи быть меньше 0,05. При n=9 и S=32 вероятность соответствует 0,0001 и коэффициент корреляции (τ = 0,89) признается значимым, т.е. между ростом 5-летних девочек и массой тела существует прямая, сильная и достоверная зависимость. Таблица рассчитана для числа наблюдений от 4 до 10, если число наблюдений больше, то оценку значимости коэффициента Кендэла лучше проводить по формуле: 12 t= S 1 1 n n 1 2n 3 18 , где t – доверительный критерий. Для вычисления использовать коэффициентов программируемые ранговой корреляции микрокалькуляторы или рациональнее специальные компьютерные программы определения коэффициентов на языке Бейсик. Коэффициенты ассоциации и сопряженности (контингенции) При изучении зависимости качественных признаков, когда имеют место так называемые альтернативные признаки, т.е. вариация двух противоположных возможностей (“заболел – не заболел” или “привит – не привит” и др.), измерение связи может быть проведено в четырехпольной таблице путем вычисления коэффициентов ассоциации и сопряженности (контингенции). Когда получены статистические данные, характеризующие связь между двумя альтернативными признаками, то используются четырехклеточные таблицы сопряженности двух дихотомических признаков (разделенных надвое) с альтернативными значениями (“+”, “-”) (табл. 2). Таблица 2 Таблица сопряженности признаков Значение признака В (да) В (нет) Суммарные значения А (да) a b a+b А (нет) c d c+d Итого a+c b+d a+b+c+d Коэффициент ассоциации является показателем оценки тесноты связи между двумя альтернативными признаками и вычисляется по формуле: Q= 13 ad bc . ad bc Коэффициент сопряженности (современное название – коэффициент контингенции) вычисляется по формуле: ad bc C1 = a c b d a b c d . Если известен критерий согласия χ2 (хи- квадрат), то при небольшом числе (до 100 единиц) наблюдений коэффициент контингенции можно определить по формуле: 2 C1 = a b c d . Образец решения задачи Значение признака Заболели Не заболели Всего рабочих гриппом Иммунизированы 32 a 1388 b 1420 a+b Не иммунизированы 82 c 1088 d 1170 c+d Итого 114 a+c 2476 b+d 2590 a+b+c+d 32 1088 82 1388 32 1088 82 1388 34816 113816 34816 113816 79000 148632 32 1088 82 1388 79000 114 2476 1420 1170 46895340600 Q= C'1 = 79000 684801,7 0,53 0,115. При χ2, равном 34,4, получаем: C '' 1 = 34,4 2590 0,115. Коэффициент контингенции всегда имеет меньшее значение, чем коэффициент ассоциации; если он не менее 0,3, то это свидетельствует о наличии связи между качественными признаками. 14 Коэффициенты сопряженности и ассоциации оцениваются аналогично коэффициенту корреляции (от +1 до - 1). Рассчитанные в задаче коэффициенты свидетельствуют о наличии связи между рассматриваемыми признаками, т.е. прививки против гриппа влияют на заболеваемость. Знак «минус» указывает на обратную связь. Коэффициент корреляции Пирсона При наличии прямолинейной связи между взаимосвязанными количественными признаками, особенно при большом числе наблюдений, рациональнее прибегать к параметрическим методам оценки, которые требуют вычисления определенных параметров: средней величины, средне- квадратического отклонения ( ), средней ошибки. При этом вычисление связи проводится по методу квадратов на основании корреляционной решетки (таблицы сопряженности), если имеется большое число наблюдений. При числе наблюдений менее 30 сравниваемых пар коэффициент линейной корреляции К. Пирсона определяется по формуле: dx rxy = d x 2 dy dy 2 , где rxy - коэффициент линейной корреляции между двумя признаками x и y; d отклонения от средних арифметических данных ряда x и ряда y. Образец решения задачи Исходные данные и параметры расчета коэффициента линейной корреляции Охват Номера населения региона прививками,% x 15 Заболеваемость на 10 000 человек населения y dx dy dx2 dy2 dxdy 1 15,0 22,0 10 - 3,6 100,0 12,96 - 36 2 20,0 28,0 5 - 9,6 25,0 92,16 - 48 3 25,0 18,0 0 0,4 0 0,16 0 4 30,0 14,0 -5 4,4 25,0 19,36 - 22 5 35,0 10,0 - 10 8,4 100,0 70,56 - 84 Всего 25,0 18,4 250 195,2 - 190 Порядок вычисления 1. Находят усредненные данные для обоих рядов (x и y), т.е. средние величины по формуле (для коэффициентов определяют общие коэффициенты): М= V p n . 2. Определяют отклонения от этих усредненных величин (dx = Mx – x, dy = My -y) с обозначением соответствующего отрицательного знака. В данном случае: dx ' = 25 - 15 =10; dx '' = 25 -20 =5 и т.д. Для ряда y : dy ' =18,4 – 22,0 = - 3,6; dy '' = 18,4 – 28 = - 9,6 и т.д. 3. Возводят полученные результаты в квадрат и получают суммы этих квадратов ( dx 2 и dy 2 ). 4. Находят произведения каждого dx на dy и получают их сумму ( d x d y ). 5. Подставляют полученные данные в формулу: rxy = 190,0 250 195,2 0,86. При определении коэффициента линейной корреляции Пирсона на программируемых калькуляторах надо иметь два основных документа: специальную программу вычисления и инструкцию по ее применению. Для персональных компьютеров разработаны также специальные программы вычисления на языке Бейсик. Так как полученные коэффициенты определяются, как правило, на материалах выборочного исследования, то всегда необходимо убеждаться в 16 степени их коэффициента надежности. линейности Представительность корреляции также (репрезентативность) может определяться по специальным таблицам (приложение 2) или ориентировочно – по средним ошибкам, которые должны для обоснования значимости связи быть в 3 раза меньше своего коэффициента корреляции. Коэффициент считается представительным, если полученная величина его превышает критическое значение при p< 0,05 и заданном числе степеней свободы n ' , которое равняется n – 2. Полученная в задаче величина 0,86 превышает критический уровень 0,75 при n ' = 5 и p< 0,05. При отсутствии таблицы критических значений коэффициентов корреляции представительность коэффициента может быть определена по величине средней ошибки m (при числе парных наблюдений менее 100): 1 rxy mr xy = n 2 2 . Можно для определения средней ошибки использовать и более упрощенную формулу: mr xy = 1 rxy 2 1 0,86 n 5 0,14 2,2 0,064. Коэффициент корреляции будет достоверен лишь в том случае, когда он превышает свою ошибку в 3 – 4 раза. Оценку значимости проводят и по t- критерию, его величину определяют по формуле: t =r xy n 2 1 rx 2 при n<100. Для нашей задачи: t = 0,86 5 2 1 0,86 2 2,92. Так как t > 2, то это говорит о достаточной достоверности влияния прививок на уровень заболеваемости и о значимости полученных результатов. Оценку критерия t можно давать и по специальным оценочным таблицам, в Соответствии с которыми при уровне значимости p , равном 0,05 (5%), и числе 17 степеней свободы 4 и 5 этот критерий должен равняться соответственно 2,776 или 2,571. В данном случае доверительный критерий t табличных значений, следовательно, получены больше указанных хорошие результаты. Достоверность корреляции доказана, нулевая гипотеза предусматривает отсутствие корреляционной связи. Если полученный коэффициент корреляции не удовлетворяет принятому уровню значимости, т.е. его вероятность ниже 0,95, то это является основанием для признания нулевой гипотезы правильной. Правильная трактовка коэффициентов корреляции предполагает нормальное распределение сопряженных величин коррелируемых рядов x и y. Однако при малом числе наблюдений и сравнительно сильной корреляции вычисленный коэффициент корреляции не всегда будет точной оценкой для генеральной совокупности. В этих случаях коэффициент r xy целесообразно заменить преобразованной величиной Z (преобразование Фишера). Форма распределения величины Z почти не отличается от формы нормального распределения, так как мало зависит от численности выборки и значения r xy в генеральной совокупности. Только с помощью величины Z можно определить достоверность различий между двумя коэффициентами корреляции, а также объединить данные по нескольким корреляциям. Преобразование r xy в Z проводится по специальным таблицам, имеющимся в различных пособиях по статистике. В заключение следует обратить внимание на возможность пользования следующих наиболее доступных и простых формул определения средних ошибок коэффициентов корреляции. 1. Ошибка коэффициента корреляции, вычисленного по методу Спирмена: m = 1 p2 . n 2 2. Ошибка коэффициента корреляции, вычисленного обычным методом Пирсона: 18 1 Z xy mr xy = n 2 2 . Регрессионный анализ Иногда при анализе корреляционных связей важно установить, как количественно меняется один признак по мере изменения другого на единицу. В этих случаях регрессионный анализ осуществляется на основании вычисления и оценки коэффициентов регрессии (R). Поскольку изменчивых величин две (x и y) и регрессия является двусторонней, то соответственно будут и два коэффициента Rxy и Ryx , которые вычисляются по формулам: Rx/y = rxy и Ry/x = rxy x y Как видно, для . x y определения значения коэффициента регрессии необходимо вычислить среднее квадратическое отклонение, т.е. знать: сигму ряда x ( x ); сигму ряда y ( y ) ; величину коэффициента линейной корреляции (rxy) . Образец решения задачи Вычисление коэффициентов регрессии Девочки 5 лет Рост, см x 19 Отклонения от М Квадраты отклонений Масса тела, кг y dx= x-Mx dy= y-My dx2 dy2 dxdy 87 13 -6,8 -2,4 46,24 5,76 16,32 89 12 -4,8 -3,4 23,04 11,56 16,31 91 14 -2,8 -1,4 7,84 1,96 3,92 91 14 -2,8 -1,4 7,94 1,96 3,92 95 16 1,2 0,6 1,44 0,36 0,72 96 15 2,2 -0,4 4,84 0,16 -0,88 96 17 2,2 1,6 4,84 2,56 3,52 97 18 3,2 2,6 10,24 6,76 8,32 102 20 8,2 4,6 67,24 21,16 37,72 ∑x= 844 ∑y= 139 Мx= Мy = 15,44 ∑dx2 ∑dy2 93,77 см кг = 173,56 = 52,24 ∑= 90,76 n= 9 Расчет средних величин Мx и Мy (M = V n проводят по общепринятой формуле ), а отклонений – по формуле d =M-V. Полученные данные (из таблицы задачи) подставляют в формулу: rxy= 90,76 173,56 52,24 90,76 95,22 0,95. Далее определяют среднюю ошибку коэффициента и критерий t : 2 mr xy = 1 0,95 1 0,9025 7 9 2 t=0,95 9 2 1 0,952 7 0,0975 0,01393 0,118. 71,79 8,47 . По таблице значений t-критерия при p <0,005 и числе степеней свободы 7 доверительный критерий должен быть равен 2,37, а при решении данной задачи получен большее значение. Следовательно, нулевая гипотеза отвергается, т.е. связь между ростом и массой тела сильная, прямая, достоверная. Величины коэффициентов регрессии в этой задаче могут быть вычислены и без определения средних квадратических отклонений и коэффициента линейной корреляции (rxy) по формулам: Rx/y= 20 dx dy dy 2 90,76 1,737 1,74кг 52,24 dx dy Ry/x= dx 90,76 173,56 2 0,523см. Для оценки репрезентативности данных, полученных в результате выборочных исследований, необходимо сначала определить сначала ошибку для коэффициента регрессии по формуле: dx m Rx/y= dx dy 2 dy 90,76 52,24 52,24 9 2 173,56 2 2 dy n 2 0,685. Степень представительности устанавливается по t-критерию при n ' = - 2 и уровне значимости 0,05: txy= Поскольку полученное Rx / y m Rxy 1,74 0,685 значение критическую величину 2,365 при 2,54. t равно 2,54, т.е. превышает p<0,005 (определяемую по специальной таблице) и числе степеней свободы, равному 7 (n ' =9–2=7), выборка признается репрезентативной. Это дает основание считать, что увеличение роста на 1 см приводит к увеличению массы тела на 1,74 кг у девочек в возрасте 5 лет. Коэффициент регрессии, равный 0,523 см, говорит о том, что увеличение массы тела на 1 кг происходит при увеличении роста на 0,523 см. Коэффициент регрессии характеризует только линейную зависимость и имеет знак «плюс» при положительной или знак «минус» - при отрицательной связи. В медицинской практике регрессионный анализ находит применение в случае, когда надо оценить количественное изменение одного показателя по мере изменения количественной характеристики другого, в то время как коэффициент корреляции служит общим критерием оценки сопряженности признаков. Между коэффициентами корреляции и регрессии имеется определенная связь, выражающаяся формулой: 21 r xy = Rx / y R y / x . Зная коэффициенты регрессии, можно легко определить коэффициенты корреляции: r xy = 1,74 0,523 0,91 0,95 . Измерение связи между признаками с помощью корреляционной решетки Коэффициент линейной корреляции Пирсона наиболее быстро определяется по вышеприведенной формуле на небольшом числе наблюдений по данным, которые представлены в виде простых вариационных рядов, где частоты, как известно, равны единице. Прямой путь вычисления коэффициента корреляции при парной связи осуществляется при небольшом числе наблюдений на основе использования средних величин и отклонений от них. Однако когда имеется большое число наблюдений и данные сгруппированы с определенным интервалом, т.е. представлены сгруппированных вариационных рядов, вычисление в виде взвешенных производится по другой формуле и является более трудоемким. Техника вычисления осуществляется непрямым способом на основе метода Бравэ. Для вычисления коэффициента корреляции при этих условиях необходимо строить корреляционную решетку, или таблицу сопряженности. Такие условия на практике чаще всего встречаются при изучении и оценке физического развития отдельных групп населения. Рассмотрим методику вычисления коэффициента корреляции на примере определения связи между ростом и массой тела у 8-летних девочек (см. образец решения задачи). Результаты исследования в таблице сопряженности могут быть представлены в одинаковом числе групп для подлежащего и сказуемого таблицы. В данной задаче сведения, приведенные в подлежащем, распределены по росту на 11 групп, а данные, содержащиеся в сказуемом, разделены по массе тела на 9 групп. Можно выделить следующие этапы вычисления. 22 1. Сначала полученные в исследовании результаты записывают по общепринятым правилам в виде двух сопряженных сгруппированных рядов: по росту – 106-107,9 см ит.д.; по массе тела – 16-16,9 кг, 17-17,9 кг и т.д. 2. Затем для каждой группы определяют середину интервала (V1). В случае непрерывных вариационных рядов середина интервала определяется как полусумма начальных вариантов двух соседних групп. Так, в ряду x первой группы (строки подлежащего) V i = группы V i = 23 108 110 109 и т.д. 2 для 106 108 107см; для следующей 2 Образец решения задачи по вычислению коэффициента корреляции с помощью корреляционной решетки Рост, см (x) Vx Vix 106-107,9 108-109,9 110-111,9 112-113,9 114-115,9 116-117,9 118-119,9 120-121,9 122-123,9 124-125,9 126-127,9 107 109 111(Ax) 113 115 117 119 121 123 125 127 Py ay Py · ay Py · ay2 Масса тела, кг (y) 16- 17- 18- 19- 20- 21- 22- 23- 2416,9 17,9 18,9 19,9 20,9 21,9 22,9 23,9 24,9 Px axi* Px · ax Середина интервала (Viy) 16,5 17,5 18,5 19,5 20,5 21,5 22,5 23,5 24,5 (Ay) 2 3 1 6 -2 2 2 5 4 13 -1 8 9 7 19 1 1 1 46 0 4 5 5 1 3 2 1 21 1 1 3 11 4 2 19 2 3 2 2 2 9 3 1 6 1 2 1 4 1 16 4 2 8 8 18 5 2 2 1 5 6 2 2 7 1 1 8 11 -3 -33 99 19 -2 -38 76 24 -1 -24 24 48 0 0 0 8 1 8 8 18 2 36 72 15 3 45 135 6 4 24 96 7 Σ156 5 35 Σ53 175 Σ685 - Px · ax2 Px · ay Px · ay · ax 24 13 0 21 76 81 256 450 180 98 64 -6 -15 -41 5 2 16 28 36 13 10 5 12 15 0 5 4 48 112 180 78 70 40 Σ267 Σ1263 Σ53 Σ564 -12 -13 0 21 38 27 64 90 30 14 8 * axi – сокращенные на величину интервала вычисленные условные отклонения (пояснения см. в тексте). В сказуемом ряду (ряду y) для первой группы второй группы V i = Vi = 16 17 2 16,5кг , для 17 18 17,5кг и т.д. 2 Дальнейшие вычисления можно производить непосредственным 3. методом, но лучше одним из ускоренных способов. Рассмотрим вычисление по способу условной средней (или способу моментов). Для этого любая середина интервала выбирается за условную среднюю (А). В задаче среди данных по росту за условную среднюю (Аx) выбрана середина интервала, наиболее часто (P i -46) встречающаяся и равная 111 см, а по массе тела за условную среднюю (A y ) принята середина интервала, равная 19,5 кг. Определяют 4. x i Ax 107 111 '' a '' y x 17,5 19,5 условные отклонения по формуле: a ' x=V 4; 1 0 19 1 12; и т.д., для ряда y: V i y Ay 16,5 19,5 3; a 2 и т.д. Для данных по р осту величины середины интервалов получаются кратными 2: 0, 2, 4, 6, 8, 10, 12, 14, 16, так как варианты объединены в группы с интервалом, равным двум единицам. Рационально в этом случае полученные условные отклонения ax сократить на 2, т.е. сократить на интервал, и записать сокращенные данные, которые и приведены в условии задачи (таблица, столбец “a ' x ” ). Таким образом: для первой группы по росту a'x ai 2 4 2 2 , для второй a'x ai 2 2 2 1 и т.д. Для данных по массе тела этих сокращений делать не надо, так как интервал равен 1. 5. Далее для каждого ряда производят в указанной последовательности умножение полученных данных, как показано в условии задачи (в таблице), и определяют сумму вычисленных произведений: а) отклонения умножаются на частоты ( a x Px ) и ( a y Py ) и определяются суммы: a x Px 267 ; a y Py 53 ; б) перемножают условные отклонения ( a x и a y ) произведения Px a x 2 ( Px a x ; 1263; Py a y Py a y ), 2 суммируют произведения ( Px на a y и суммируют полученные Px a y a x и находят их сумму: 53 ; Px a y г) определяют произведения Px a y a x полученные 685 ); в) для каждой группы умножают результаты: на соответствующие 564 . На основании вышеуказанных расчетов, которые проводятся обязательно с помощью таблицы сопряженности и заносятся в нее, далее осуществляется вычисление соответствующих параметров отдельно для ряда x (по росту) и для ряда y (по массе тела). 6. Производят расчет для данных ряда x (по росту), где n=156, условная средняя Ax =111 см, ix =2 (другие параметры имеются в таблице). По способу моментов сначала определяют среднюю арифметическую: Mx Ax ix Px a x n 111см 2 267 111см 2 1,17 114,4см. 156 Затем вычисляют среднее квадратическое отклонение: ч н x v2 v1 н Px a x 2 n = 2 8,1 2,89 Px a x 2 2 n 2 5,21 1263 156 2 2,28 267 156 2 4,56см , где v1 («ню») – момент (или поправка) в первой степени v1 - момент или поправка) во второй степени 26 v2 Px a x n 2 8,1 1,7 2 2 . Px a x n ; v2 Аналогично рассчитывают параметры для ряда y (по массе тела), в 7. котором n также равняется 156 единицам наблюдения, А y =19: кг, интервал iy = 1, а момент первой степени равен: Py a y v1 53 156 n 0,34кг. Вычисляют среднюю массу тела: My Ay Py a y iy 19,5 0,34 19,84кг. n Определяют момент второй степени: Py a y v2 685 156 n 4,39кг. Рассчитывают среднее квадратическое отклонение для этого признака: y 8. Py a y iy 2 2 Py a y n 4,39 0,34 2 n Определяют коэффициент 4,39 0,12 корреляции Пирсона 4,27 2,07кг. на основе вышепроведенных вычислений и исходных величин: Px a y a x rxy n 1 1 n vx v y 1 x 1 , y где v1 x - момент первой степени для ряда x ; v1 y - момент первой степени для ряда y ; 1 x и 1 - соответствующие этим рядам средние квадратические y отклонения, деленные на i (на интервал): 1 x x ix и 1 y y iy . Подставляя имеющиеся данные в эти формулы, получают: 1 x 4,56см 2 2,28см, 1 y 2,07кг 1 2,07кг. Подставляя необходимые величины в формулу, получают коэффициент корреляции: 27 rxy 564 156 1,7 0,34 156 2,28 2,07 564 90,2 736,3 473,8 736,3 0,64. Полученный коэффициент корреляции свидетельствует, что между ростом и массой тела у 8-летних девочек существует прямая зависимость средней силы. Достоверность коэффициента при большом числе наблюдений (ориентировочно 30 – 100 единиц) определяется при помощи средней ошибки по формуле: mr 1 rxy 2 1 0,64 2 n 156 1 0,41 12,5 0,04. Так как средняя ошибка коэффициента меньше его величины более чем в 3 раза, то полученные статистические данные и сделанные на основе их выводы являются не случайными, а репрезентативными, о чем свидетельствует и доверительный критерий t : t rxy mr 0,64 16. 0,04 Имея данные, рассчитанные по корреляционной решетке, можно определять и другие параметры – коэффициенты вариации и коэффициенты регрессии. Коэффициент вариации Сv по росту равен: Cv x x Mx 100% 4,56 100% 114,4 100% 2,07 100% 10,41%. 19,88 3,99%; по массе тела равен: Сv y y My Полученные коэффициенты свидетельствуют, во-первых, о том, что колеблемость результатов измерений роста и массы тела низкая, т.е. данные получены на статистически однородной совокупности в том и другом случае, Во-вторых, по массе тела колеблемость данных является относительно большей, чем по росту ( С v y > C v x ), следовательно, признак роста у 8-летних девочек является более стабильным, а второй признак (масса тела) является более вариабельным, т.е. может колебаться в больших пределах. 28 Коэффициент регрессии для массы тела по росту определяют по формуле: Rx / y rxy x 0,64 y 4,56 2,07 0,64 2,2 1,4. Это означает, что с увеличением роста на 1 см масса тела у 8-летних девочек увеличивается в среднем на 1,4 кг. СИТУАЦИОННЫЕ ЗАДАЧИ Задача 1. Определите с помощью коэффициента корреляции рангов Спирмена размер связи между суточным потреблением йода организмом и заболеваемостью зобом. Оцените достоверность полученных результатов, сделайте выводы. Город Количество потребляемого Заболеваемость зобом, йода, мг ‰ Бордо 200 0 Париж 100 3 Эффинген 70 1 Утрехт 40 50 Берн 20 85 Задача 2. Рассчитайте коэффициент ранговой корреляции между стажем (X) работы во вредных условиях труда и длительностью (Y) нетрудоспособности по болезни у рабочих завода. 29 Стаж работы, лет Длительность нетрудоспособности, дни 1-3 16 4-6 15 7-9 17 10-12 19 13-15 20 15 и более 24 Задача 3. Установите связь между уровнем загрязненности атмосферного воздуха и численностью населения в городах. Показатель Численность населения, тыс. 10-25 25-50 50-100 100- 400-700 400 Более 700 Содержание взвешенных 63 62 96 101 113 119 веществ в воздухе, мг/м3 Задача 4. В районах Ленинградской области были получены данные о доле сельского населения и уровнях рождаемости. Определите характер и размер связи между этими явлениями путем вычисления коэффициента ранговой корреляции. Оцените его достоверность, сделайте выводы. Район Сельское Рождае- Район Сельское Рожда- населе- мость, население,% емость, ние,% %o Бокситогорский 38,6 10,2 Лодейнопольский 29,4 11,6 Волосовский 77,0 10,2 Ломоносовский 46,9 12,0 Волховский 38,4 10,7 Лужский 54,6 9,7 Всеволожский 53,6 9,6 Подпорожский 37,4 11,7 Выборгский 28,9 15,8 Приозерский 62,9 12,1 Гатчинский 47,6 10,5 Тосненский 21,5 10,3 Кингисеппский 46,3 12,7 Тихвинский 46,6 11,7 Киришский 28,9 9,9 %o Задача 5. Докажите наличие зависимости изменения стекловидного тела глазного яблока у рабочих от стажа их работы на химическом производстве, где имеется возможность воздействия ртути. Показатель, % Стаж работы Менее года 30 1 год 2 года 3 года 4 года и более Рабочие с изменениями 6,1 6,3 10,0 25,0 23,0 стекловидного тела глазного яблока Задача 6. У ткачих по мере увеличения стажа работы в профессии заметно ухудшается слух. Определите характер и размер связи между этими явлениями, используя коэффициент ранговой корреляции Спирмена. Оцените его достоверность, сделайте выводы. Стаж работы, лет менее 1-4 5-9 10-14 15-19 20-24 25-29 30 года и более На 100 ткачих имели 1 10 25 50 55 70 75 75 пониженный слух Задача 7. С помощью коэффициента ранговой корреляции определите размер и направленность связи между количеством бактерий в 1 мл водопроводной воды и дозой хлора для ее обеззараживания. Оцените его достоверность, сделайте выводы. Доза хлора, мг/л Число бактерий в 1 мл 0,5 29 500 1,2 115 4,2 50 5,0 40 5,5 41 31 Задача 8. Установите связь между числом послеоперационных осложнений и временем, прошедшим от начала острого приступа холецистита до операции. Оцените ее достоверность, сделайте выводы. менее 3 3-5 ч 6-8 ч 9-11 ч 12-14 ч 15-17 ч 12 11 24 28 ч Число 6 8 осложнений Задача 9. Определите силу и характер связи между заболеваемостью детей болезнями органов пищеварения на первом году жизни и наличием раннего искусственного вскармливания. Город % детей, получавших ранний Число детей первого года жизни прикорм на первом году жизни с болезнями органов пищеварения (на 1000) А 7,8 150,0 Б 8,0 158,3 В 12,0 213,8 Г 12,3 209,5 Д 15,0 364,2 Е 16,7 227,2 Ж 17,2 300,8 Задача 10. Определите силу и характер зависимости между степенью загрязнения атмосферного промышленных воздуха предприятий и сернистым уровнем газом SO2 заболеваемости в районе бронхитами работающих на них. Оцените достоверность полученных результатов, сделайте выводы. Предприятие Концентрация SO2 , мг/м3/сут Заболеваемость бронхитами на 100 рабочих 32 1 0,059 1,8 2 0,066 2,0 3 0,079 2,9 4 0,082 3,3 5 0,089 3,8 6 0,113 4,0 7 0,124 4,2 8 0,148 5,0 9 0,150 5,3 Задача 11. На одном из промышленных предприятий проводилась иммунизация рабочих против гриппа. Определите направление и силу взаимосвязи между уровнем временной нетрудоспособности по поводу гриппа и процентом иммунизированных рабочих в различных цехах. Рассчитайте коэффициент корреляции. Оцените его достоверность и сделайте выводы. Цех Охват иммунизацией, % Заболеваемость гриппом на 100 рабочих (случаи) 1 90 2,1 2 75 2,8 3 60 3,6 4 50 4,1 5 40 5,0 6 40 5,3 7 35 5,9 8 25 6,4 9 10 7,2 10 0 7,2 33 Задача 12. Определите характер и силу взаимосвязи между стажем работы на химкомбинате и заболеваемостью рабочих. Оцените достоверность полученных результатов, сделайте выводы. Стаж работы, лет Среднее число заболеваний на 1 рабочего в год 1 4,3 2 3,8 3 2,1 4 2,0 5 2,2 6 2,7 7 2,8 8 2,6 9 3,0 10 3,1 11 3,2 Задача 13. Докажите корреляционную зависимость между интенсивностью курения и длительностью течения острого бронхита у курильщиков. Число выкуриваемых сигарет в день Длительность заболевания, дни 5 7 10 6 15 9 20 9 25 11 30 10 35 12 40 11 45 14 34 Задача 14. Рассчитайте коэффициент корреляции между длительностью нетрудоспособности рабочих в течение года и стажем работы их на предприятии. Оцените его достоверность, сделали выводы. Стаж, Длительность Стаж, Длительность лет нетрудоспособности, дни лет нетрудоспособности, дни 1 6 8 11 2 11 9 13 3 7 10 14 4 7 11 15 5 9 12 19 6 10 13 18 7 11 Задача 15. Определите характер и размер связи между величинами систолического и диастолического давления у рабочих- прессовщиков в возрасте от 25 до 45 лет с помощью коэффициента линейной корреляции Пирсона. Систолическое 101 106 106 106 116 118 111 115 120 116 126 71 74 74 76 76 АД Диастолическое 61 61 63 65 66 68 АД Задача 16. При определении суточной потребности в белках 7-летних девочек получены следующие результаты: Масса тела, кг 20 22 23 25 26 27 28 Суточная потребность 62 66 62 75 75 78 82 в белках, г 35 Дайте характеристику связи на основе рассчитанного коэффициента корреляции. Задача 17. В результате измерения роста и массы тела у девочек в возрасте 6 лет были получены следующие данные: Рост, см Масса тела, кг Рост, см Масса тела, кг 87 13 96 16 89 12 97 15 91 14 97 18 91 14 101 18 95 16 103 20 95 15 103 21 Определите коэффициенты корреляции и регрессии. Дайте оценку связи между ростом и массой тела. Задача 18. Вычислите коэффициенты регрессии по росту и массе тела у 15летних девочек, если при обработке данных были получены: по массе тела σx = ± 6,9 кг; по росту σy = ± 5,6 см; rxy = 0,75. Сделайте выводы. Задача 19. Рассчитайте коэффициент ранговой корреляции между курсом обучения и уровнем патологической пораженности студентов вузов СанктПетербурга. Курс обучения Уровень патологической случаев на 1000 студентов) I 514,6 II 477,5 III 545,7 IV 585,9 36 пораженности (число V 703,2 VI 519,9 Задача 20. В результате измерения роста и массы тела у 18- летних студенток медицинского вуза на последней неделе беременности были получены следующие данные: Рост, см Масса тела, кг 156 63 161 51,3 162 63,7 163 82,6 169 69 173 70 175 79 Определите коэффициенты корреляции и регрессии. Дайте оценку связи между ростом и массой тела обследованных студенток. Задача 21. В одном из родильных домов Санкт- Петербурга в результате измерения длины и массы тела новорожденных (детей студенток в возрасте 20 лет) были получены следующие данные: Длина, см Масса тела, г 48 2980 49 3000 50 3100 50 3100 51 3390 52 3440 53 3500 37 Определите коэффициенты корреляции и регрессии. Дайте оценку связи между длиной и массой тела новорожденных. Задача 22. Динамика роста доли городского населения и рождаемости в России. Годы Показатель Доля 1913 1937 1939 1950 1960 1962 1970 1980 1990 городского 18 28 32 39 49 51 52 70 74 38,7 36,5 26,7 24,9 22,4 21,3 15,9 13,4 населения, ‰ Рождаемость, ‰ 47,0 Определите характер и размер связи между этими явлениями путем вычисления коэффициента ранговой корреляции, оцените его достоверность и сделайте соответствующие выводы. Задача 23. Определите характер и размер связи между числом детей в семье и количеством пропущенных женщиной рабочих дней (в связи с уходом за больным ребенком) путем вычисления коэффициента ранговой корреляции Кендэла. Оцените его достоверность и сделайте соответствующие выводы. Число детей в семье Количество пропущенных рабочих дней (в показателях наглядности), % нет 100 1 108 2 112 3 128 4 125 5 и болеее 130 Задача 24. Определите характер и размер связи между заболеваемостью шахтеров гипертонической болезнью и высотой тоннеля, в котором идет добыча угля. Вычислите коэффициент ранговой корреляции, оцените его достоверность и сделайте выводы. 38 № шахты Высота тоннеля, м Заболеваемость гипертонической болезнью (на 1000 шахтеров) 1 0,6 3,5 2 0,8 4,2 3 1,0 5,6 4 1,2 6,3 5 1,4 7,4 6 1,5 8,9 7 1,6 10,0 Задача 25. Определите характер и размер связи между долей родов на дому в сельской местности и расстоянием до ближайшего ЛПУ, имеющего родильные койки. Вычислите коэффициент ранговой корреляции, оцените его достоверность и сделайте выводы. Расстояние, км Доля родов на дому (% к общему числу родов в данной местности) До 2 0,2 2-4 1,0 5-7 4,0 8-10 6,2 11-12 7,5 13-15 9,1 16-18 8,5 19-20 9,3 Более 20 11,0 Задача 26. Определите коэффициент корреляции между содержанием кальция в воде и ее жесткостью. Вычислите коэффициент регрессии жесткости воды по 39 количеству в ней кальция. Определите содержание кальция при жесткости воды 15˚, 20˚, 25˚ и 30˚. Жесткость воды, градусы Содержание Са в воде, мг/л 4 28 8 56 11 77 27 191 34 241 37 262 Задача 27. В результате определения суточной потребности в белках 8-летних девочек были получены следующие данные: Масса тела, кг 20 22 23 25 26 27 28 Суточная потребность, г 62 66 62 75 75 78 82 Определите коэффициент корреляции, оцените его достоверность. Вычислите коэффициент регрессии суточной потребности в белках по массе тела. Определите суточную потребность в белках девочек с массой тела 21, 24 и 29 кг. Задача 28. Определите коэффициент корреляции между возрастом и частотой выхода на инвалидность по каждой группе инвалидности. Оцените его достоверность. Вычислите коэффициент регрессии выхода на инвалидность по возрасту, определите ожидаемый выход на инвалидность при I, I I и I I I группе инвалидности в возрасте 30 лет, 40 лет. Частота выхода на инвалидность на 10 000 работающих: Группа Возраст, лет инвалидности 25 35 45 50 55 60 I 0,3 0,6 0,7 1,8 4,1 4,2 II 5,6 3,2 5,5 10,3 13,8 13,8 40 III 2,2 3,8 4,6 6,4 7,5 7,6 Задача 29. В результате измерения систолического и диастолического давления у 9 здоровых юношей 18 лет получены следующие результаты: Систолическое 110 110 115 120 120 120 125 130 120 60 65 65 70 70 75 80 АД Диастолическое 70 75 АД Определите коэффициент корреляции, оцените его достоверность. Вычислите коэффициент регрессии систолического давления по диастолическому. Определите ожидаемый уровень систолического АД при диастолическом, равном 85, 90, 95 мм.рт.ст. Задача 30. Определить с помощью коэффициента корреляции рангов Спирмена имеется ли зависимость между температурой тела и частотой сердечных сокращений. Определить достоверность полученных результатов. Сделать выводы. Температура тела (х) Частота сердечных сокращений в минутах (у) 36 60 36 70 38 80 40 90 40 100 Задача 31. Определить с помощью корреляционного метода Пирсона, имеется ли влияние частоты раннего прикорма и искусственного вскармливания на частоту болезней органов пищеварения у детей первого года жизни. 41 Определить достоверность полученных результатов. Сделать выводы. Частота раннего прикорма и Частота возникновения искусственного вскармливания (х) органов пищеварения (у) 14 24 16 25 18 27 20 28 22 30 болезней Задача 32. Определить с помощью коэффициента корреляции рангов Спирмена имеется ли влияние непрерывной работы за персональным компьютером на снижение зрительной функции подростков в возрасте 11-13 лет. Определить достоверность полученных результатов. Сделать выводы. Среднее время непрерывной работы Снижение зрительной функции у за персональным компьютером, мин. подростков, на 100 детей (у) (х) < 20 5 21-30 15 31-40 30 41-50 35 51-60 45 60 75 Задача 33.Расчитайте коэффициент ранговой корреляции между стажем работы (х) на заводе в цехе №1 и длительностью нетрудоспособности по болезни у рабочих цеха. Определить достоверность полученных результатов. Сделать выводы. Стаж работы, лет 42 Длительность нетрудоспособности, дни 1-3 8 4-6 7 7-9 9 10-12 12 13-15 14 15 и больше 16 Задача 34. Рассчитать коэффициент ранговой корреляции Спирмена между рождаемостью населения и общим коэффициентом разводимости населения ( на 1000 населения). Определить достоверность полученных результатов. Сделать выводы. Рождаемость в %о Разводимость в %о 10,3 4,5 11,3 4,8 12,0 4,9 12,3 4,9 12,5 4,5 12,6 4,7 ТЕСТОВЫЕ ЗАДАНИЯ Выберите правильный ответ: 1) ПО ХАРАКТЕРУ СУЩЕСТВУЮЩИХ СВЯЗЕЙ МЕЖДУ ПРИЗНАКАМИ В ШИРОКОМ ПОНИМАНИИ СВЯЗИ ПОДРАЗДЕЛЯЮТСЯ НА: А) Прямые Б) Обратные В) Функциональные Г) Косвенные Д) Многофункциональные 43 2) ВСЕ СУЩЕСТВУЮЩИЕ В ЖИВОЙ ПРИРОДЕ ЗАВИСИМОСТИ МЕЖДУ ПРИЗНАКАМИ ИЗУЧАЮТСЯ ПРЕИМУЩЕСТВЕННО: А) Точными физико-математическими науками Б) Статистикой В) Демографический Г) Заболеваемость Д) Биологический 3) ДЛЯ РЕШЕНИЯ ЭЛЕМЕНТАРНОЙ ЗАДАЧИ ПО ОПРЕДЕЛЕНИЮ ЗАВИСИМОСТИ МЕЖДУ ПРИЗНАКАМИ И ЕЕ НАПРАВЛЕННОСТИ РАЦИОНАЛЬНЕЕ ИСПОЛЬЗОВАТЬ: А) Корреляционный анализ Б) Дисперсионный анализ В) Аналитические группировки Г) Достоверность различий Д) Средний уровень признака 4) ДЛЯ ПОЛНОЙ ХАРАКТЕРИСТИКИ СТАТИСТИЧЕСКИХ СВЯЗЕЙ НЕОБХОДИМО ПРИМЕНЯТЬ: А) Дисперсионный анализ данных Б) Вычисление различных коэффициентов корреляции В) Регрессионный анализ Г) Стандартизацию Д) Средний уровень признака 5) КОРРЕЛЯЦИОННАЯ СВЯЗЬ ХАРАКТЕРИЗУЕТСЯ КАК СВЯЗЬ, ПРИ КОТОРОЙ: А) Выявляется полная характеристика особенностей взаимозависимости двух сравниваемых признаков Б) Любому значению одного из признаков соответствует только одно значение другого коррелируемого с ним признака В) Значению каждой величины одного признака может соответствовать нескольким значениям другого взаимосвязанного с ним признака 44 Г) Выявляется полная характеристика особенностей взаимодействия трех признаков Д) Выявляется полная характеристика особенностей взаимодействия пяти признаков 6) КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ИСПОЛЬЗУЕТСЯ С ЦЕЛЬЮ: А) Характеристики IV группового свойства статистической совокупностирепрезентативности данных Б) Оценки распределения изучаемого признака в любой статистической совокупности В) Установления наличия связи между признаками и ее направленности Г) Изучения взаимозависимости между признаками по форме, направленности, силе и достоверности Д) Установление наличия направленности признака 7) СТЕПЕНЬ ВЫРАЖЕННОСТИ КОРРЕЛЯЦИОННОЙ СВЯЗИ ХАРАКТЕРИЗУЮТ КОЭФФИЦИЕНТЫ: А) Соотношения Б) Вариации В) Наглядности Г) Стандартизованные Д) Линейной корреляции Пирсона 8) УСЛОВИЯ ДЛЯ РАСЧЕТА И ИСПОЛЬЗОВАНИЯ КОЭФФИЦИЕНТА РАНГОВОЙ КОРРЕЛЯЦИИ: А) Наличие в изучаемых совокупностях только количественных признаков Б) Необходимость расчета точного уровня взаимосвязи между признаками В) Необходимость достаточно ориентировочной оценки Г) Расчет изменения величины одного признака при изменении величины другого признака на единицу Д) Наличие в изучаемых совокупностях только средних признаков 45 9) ПО НАПРАВЛЕННОСТИ ИЗМЕНЕНИЙ ИЗУЧАЕМЫХ ДАННЫХ ЗАВИСИМОСТЬ МЕЖДУ СРАВНИВАЕМЫМИ ПРИЗНАКАМИ МОЖЕТ БЫТЬ: А) Прямая Б) Частичная В) Непрямая Г) Касательная Д) Геометрическая 10) ПО ФОРМЕ ВСЕ КОРРЕЛЯЦИОННЫЕ СВЯЗИ ПОДРАЗДЕЛЯЮТСЯ НА: А) Прямолинейные Б) Обратные В) Касательные Г) Вариабельные Д) Геометрические 11) НАИБОЛЕЕ ПРОСТЫМ МЕТОДОМ ОПРЕДЕЛЕНИЯ СТЕПЕНИ СИЛЫ СВЯЗИ МЕЖДУ ПРИЗНАКАМИ ЯВЛЯЕТСЯ МЕТОД: А) Спирмена Б) Пирсона В) Стьюдента Г) Кэнделла Д) Критерий Вилкоксона 12) НАИБОЛЕЕ ТОЧНЫМ СПОСОБОМ ОПРЕДЕЛЕНИЯ СВЯЗИ МЕЖДУ ПРИЗНАКАМИ ЯВЛЯЕТСЯ МЕТОД: А) Спирмена Б) Пирсона В) Стьюдента Г) Кэнделла Д) Критерий Вилкоксона 46 СТЕПЕНИ 13) КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ, РАВНЫЙ ЕДИНИЦЕ, СВИДЕТЕЛЬСТВУЕТ О СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ: А) Функциональной Б) Слабой В) Средней силы Г) Частичной Д) Отсутствием связи 14) ВЕЛИЧИНА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ, РАВНАЯ СВИДЕТЕЛЬСТВУЕТ О СИЛЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ: А) Слабой Б) Средней В) Полной Г) Частичной Д) Неполной 47 0,6, ЭТАЛОН ОТВЕТОВ НА ТЕСТОВЫЕ ЗАДАНИЯ 1) В 2) Б 3) В 4) А 5) Б 6) Г 7) Д 8) В 9) А 10) А 11) А 12) Б 13) А 14) Б 48 Вопросы для самоподготовки 1. Назовите виды связей, которые существуют между явлениями или признаками. 2. Назовите основные особенности функциональных связей между двумя переменными величинами. Приведите примеры. 3. Что такое корреляционная связь? Ее использование в практической деятельности врача. 4. Каковы основные критерии оценки силы корреляционной связи? 5. Какими могут быть корреляционные связи по характеру, по форме, по достоверности? Приведите примеры. 6. В чем заключается анализ корреляционных связей между различными признаками при комплексной оценке здоровья населения? 7. Какие методы анализа применяются для оценки качественных признаков при изучении здоровья населения? 8. Назовите методы вычисления различных коэффициентов корреляции. 9. Перечислите основные условия применения рангового коэффициента корреляции Спирмена при оценке здоровья населения. 10. Каковы основные условия применения метода расчета коэффициента линейной корреляции Пирсона? 11. В каких случаях следует применять коэффициенты регрессии при изучении антропометрических данных? 12. Назовите основные этапы вычисления коэффициента ранговой корреляции Спирмена. 13. Какие основные этапы вычисления коэффициента корреляции рангов Кендэла Вы знаете? 14. Каковы основные условия применения коэффициента ассоциации и сопряженности (контингенции)? 15. Назовите основные этапы вычисления коэффициента корреляции Пирсона. 16. Приведите алгоритм вычисления коэффициента регрессии. 17. Когда в практической деятельности врача используется вычисление коэффициента корреляции на основе корреляционной решетки? 49 ЛИТЕРАТУРА Основная литература Медик В.А., Юрьев В.К. Общественное здоровье и здравоохранение. – 1. М.: ГЭОТАР-Медиа, 2012. – 608 с. Дополнительная литература 1. Голева О.П., Тасова З.Б., Сосновская Е.В. Организация медицинской помощи городскому и сельскому населению: учебное пособие. – 2-е изд., доп. и перераб. / под ред. О.П. Голевой. – Омск: Омская государственная медицинская академия, 2012. – 350 с. 2. Зайцев В.М., Савельев С.И. Практическая медицинская статистика: учебное пособие / под. ред. А.И. Потапова и О.Г. Хурцилава, 2013. – 579 с. 3. Здоровье России: атлас / под. Ред. Л.А. Бокерия. – М.: НЦССХ им. А.Н. Бакулева РАМН, 2013. – 420 с. 4. Кучеренко В.З. Общественное здоровье и здравоохранение. – М.: ГЭОТАР–Медиа, том 1, 2013. – 387 с. 5. Лисицын Ю.П. Общественное здоровье и здравоохранение: учебник для студентов / Ю.П. Лисицын, Г.Э. Улумбекова. – М.: ГЭОТАР-Медиа, 2011. – 544 с. 6. Общественное здоровье и здравоохранение. Национальное руководство / под ред. В. Стародубова, О.П. Щепина и др. – М.: ГЭОТАР-Медиа, 2013. – 624 с. 7. Основы экспертизы качества медицинской помощи и автоматизированная технология его оценки / В.Ф. Чавпецов, С.М. Михайлов, М.А. Карачевцева, П.В. Гуринов. – СПб., 2011. – 57 с. 8. Щепин О.П., Медик В.А. Общественное здоровье и здравоохранение: учебник. – М.: ГЭОТАР-Медиа, 2011. – 592 с. 50 Приложение 1 Критические значения коэффициентов корреляции рангов Спирмена (ρ) Число Уровень значимости Число Уровень значимости коррелируемых (P) коррелируемых (P) пар (n) пар (n) 0,05 0,01 0,05 0,01 4 1,000 16 0,425 0,601 5 0,900 1,000 18 0,399 0,564 6 0,829 0,943 20 0,377 0,534 7 0,714 0,893 22 0,359 0,508 8 0,643 0,833 24 0,343 0,485 9 0,600 0,783 26 0,329 0,465 10 0,564 0,746 28 0,317 0,448 12 0,506 0,712 30 0,306 0,432 14 0,456 0,645 Коэффициент корреляции рангов признается статистически значимым при вероятности ошибки менее 0,05, если фактический коэффициент Спирмена больше табличного значения при уровне значимости 0,05. Приложение 2 Критические значения коэффициентов корреляции rxy Пирсона Число Уровень значимости Число Уровень значимости коррелируемых (P) коррелируемых (P) пар (n) пар (n) 0,05 0,01 0,05 0,01 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0,997 950 878 811 754 707 666 632 602 576 553 532 514 497 482 468 0,99988 990 959 917 874 834 798 765 735 708 684 661 641 623 606 590 19 20 21 22 25 30 35 40 45 50 60 70 80 90 100 456 444 433 423 396 361 332 310 292 277 253 234 219 206 196 575 561 549 537 505 463 435 407 384 364 353 308 288 272 258 Коэффициент корреляции рангов признается статистически значимым при вероятности ошибки 0,05 и менее, если фактический коэффициент rxy больше табличного значения при уровне значимости (P), равном 0,05. 51 Введение 3 Основное содержание 4 Ситуационные задачи 29 Тестовые задания 43 Эталоны ответов 48 Вопросы для самоподготовки 49 Литература 50 Приложения 51 52