Пресловутый регрессионный анализ
Современная психодиагностика России. Преодоление кризиса: сборник материалов III Всероссийской конференции: в 2 т. / редколлегия: Н.А. Батурин (отв. ред.) и др. – Челябинск: Издательский центр ЮУрГУ, 2015. Т.2. – 233 с.
Со стр. 101-104
УДК 519.22-7 + 159.937 ББК Ю9В
ПРИМЕНЕНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ИССЛЕДОВАНИЯХ ПО СПЕЦИАЛЬНОЙ ПСИХОЛОГИИ
Лаптева Н.В.
E-mail: 89229690822@yandex.ru
Вятский государственный гуманитарный университет, г. Киров
Рассматривается применение регрессионного анализа в исследованиях по специальной психологии, показываются возможности его применения для решения задач, связанных с оценкой влияний, определения вклада независимых переменных в вариацию зависимой и предсказанием значения зависимой переменной с помощью независимой.
Ключевые слова: математическая статистика, регрессионный анализ, специальная психология.
Математическая статистика в руках специального психолога должна быть мощным инструментом, позволяющим не только успешно анализировать данные психодиагностики, но и, прежде всего, способствовать становлению его объективного мышления.
Анализ использования методов математической статистики в диссертационных исследованиях по психологии за 2012–2014 гг. показал следующие результаты. Во всех исследованиях используются методы описательной статистики. Остальные методы распределились следующим образом: наибольшей популярностью пользуются методы, позволяющие выявлять различия в уровне исследуемого признака (70,7%, в основном это критерий Манна-Уитни – 62,1%) и корреляционный анализ (65,9%). На втором по популярности месте находятся: методы выявления различий в распределении признака (41,5%, хи-квадрат критерий), методы оценки сдвига значений исследуемого признака (34,1%, Т-критерий Вилкоксона), факторный анализ (31,7%), t-критерий Стьюдента (29,3%). В исследованиях по социальной и педагогической психологии наибольшее внимание уделяется корреляционному анализу, а в работах по коррекционной психологии и психологии развития – методам выявления различия в уровне исследуемого признака. В докторских диссертациях спектр методов математической статистики разнообразнее, внимание в большей степени уделяется сложным методам, таким как факторный, кластерный, дисперсионный анализ.
Регрессионный анализ встречается только в 17,1% работ, в основном в исследованиях по психологии развития, а в исследованиях по педагогической и коррекционной психологии практически не встречается. Однако, считаю, что данный метод незаслуженно игнорируется, поскольку является более простым, чем факторный, кластерный и дисперсионный анализ и позволяет в отличие от них определить вклад независимых переменных в вариацию зависимой и предсказать значение зависимой переменной с помощью независимой. Регрессионный анализ является методом математической статистики, не предполагающим знания функционального вида генеральных распределений, то есть непараметрическим методом, что позволяет использовать его в исследованиях по специальной психологии.
Понятие «регрессионный анализ» ввел Ф. Гальтон [6], установивший факт определенного соотношения между ростом родителей и их взрослых детей:
он заметил, что у родителей самого низкого роста дети оказывались несколько выше, а у родителей самого высокого роста – ниже. Подобную закономерность он назвал регрессией. Регрессионный анализ применяется преимущественно в эмпирических исследованиях при решении задач, связанных с оценкой каких–либо влияний (например, влияния одаренности интеллектуальной на успеваемость, мотивов – на поведение), при конструировании психологических тестов и пр.
Р. Кеттелл [5] при помощи регрессионного анализа получил «профессиональные портреты» для некоторых специальностей: психотерапевт = 0,72A + 0,29B + 0,29H + 0,29N; психодиагност = 0,31A + 0,78B + 0,47N.
Таким образом, для психотерапевта важнее всего общительность (А), а для психодиагноста – интеллект (В).
Для корректного выполнения регрессионного анализа необходимо учитывать ограничения линейной регресии: использование метрических переменных, равенство условных дисперсий (D(Y/X) = const), независимость ошибок от предикторов, независимость предикторов между собой, нормальное распределение предикаторов, достаточное количество наблюдений (обычно > 15) [4].
Приведем пример построения регрессионного уравнения. По данным психологического исследования [2] готовности детей к обучению в школе требуется построить регрессионную модель успешности обучения в 1 классе на основе следующих показателей:
Y – успешность обучения в 1 классе (средний уровневый показатель);
X1 – личностная готовность к обучению в школе (средний уровневый показатель);
X2 – интеллектуальная готовность к обучению в школе (средний уров- невый показатель).
Для примера нами были использованы данные исследования психологической готовности и адаптации к обучению в школе 2010–2011 гг. по всем показателям были рассчитаны средние уровневые показатели (СУП) по 3–уровневой шкале с помощью методики, разработанной В.В. Рыжовым [3]: высокий уровень развития свойства принимается за 3 балла, средний уровень – за 2 балла и низкий уровень – за 1 балл.
Показатель СУП рассчитывается по формуле: СУП = (%выс.×3+%сред.×2+%низ.×1):100.
Анализ матрицы парных коэффициентов корреляции показывает, что результативный показатель и признакиаргументы тесно не связаны. Если же связь присутствует (например, rx1x3=0,88–0,98), то наблюдается явление мультиколлинеарности. Отрицательное влияние мультиколлинеарности будет проявляться в статистической незначимости коэффициентов регрессии и недостоверности полученного уравнения регрессии. В этом случае выполняется алгоритм пошагового регрессионного анализа с исключением переменных и учетом того, что в уравнение должна войти только одна из всех тесно связанных переменных. Получаем окончательное уравнение регрессии:
Ŷ = – 0,342 + 0,769 X1 + 0,295 X4
|
Множественный коэффициент детерминации ry = 0,484 свидетельствует о том, что только 48,4% вариации успеваемости объясняется вошедшими в модель показателями (X1 и X2), то есть личностной и интеллектуальной готовностью. Остальная часть вариации обусловлена действием неучтенных факторов – других видов готовности, учебной мотивации, сложившимися отношениями с учителем и др.
Из уравнения регрессии следует, что увеличение на 1 среднего уровня показателя (СУП) личностной готовности приводит к росту успеваемости в среднем на 0,769 СУП, а интеллектуальной готовности – на 0,295 СУП. На основании регрессионного уравнения можно, таким образом, предсказать успеваемость учащихся в 1 классе.
Таким образом, расчет регрессионного анализа в исследования по специальной психологии может быть весьма полезен. Однако, возможны и некоторые сложности. Специфический характер исходных психодиагностических признаков и критериальных показателей, которые, как правило, измеряются в дихотомических и ординальных шкалах, приводит к тому, что расчетные формулы регрессионного анализа приобретают значительную степень приблизительности. Число исходных признаков, подвергающихся эмпирико-статистическому анализу в психодиагностических исследованиях, велико (может достигать несколько сотен) и между ними, как правило, встречаются объемные группы сильно связанных признаков. В этих условиях возникает явление мультиколлинеарности, приводящее к плохой обусловленности и в предельном случае вырожденности матрицы ковариации. При плохой обусловленности решение системы является неустойчивым – норма вектора оценок коэффициентов регрессии и отдельные компоненты могут стать весьма большими, в то время как, например, знаки коэффициентов могут инвертироваться при малом изменении исходных данных.
В практике конструирования психодиагностических тестов и анализе данных исследования могут применяться, либо более простые алгоритмы определения состава линейной регрессионной модели, либо более сложные.
Среди более простых методов В.А. Дюк [1] называет метод «k» лучших признаков и методы последовательного увеличения и уменьшения группы признаков (ПУВГ) и (ПУМГ). К более сложным методам можно отнести процедуры нелинейного моделирования (SPSS Regression Models [7]), которые позволяют освободиться от ограничений в виде ответов «да/нет», использовать для прогнозирования значения дихотомических переменных, использовать данные, не отвечающие статистическим требованиям, накладываемым обычным методом наименьших квадратов и др.
Литература
1. Вассерман, Л.И. Психологическая диагностика и новые информационные технологии / Л.И. Вассерман, В.А. Дюк, Б.В. Иовлев, К.Р. Червинская – СПб: «СЛП», 1997. – 208 c.
2. Лаптева, Н.В. Психологические основания реализации проектного подхода в начальном образовании / Н.В. Лаптева // Вестник Вятского государственного гуманитарного университета. – 2010. – Т. 1, № 1. – С. 123–131.
3. Рыжов, В.В. Психологическая диагностика способностей к изучению иностранных языков / В.В. Рыжов. – Нижний Новгород: НГЛУ, 2003.
4. Статистика / под ред. И.И. Елисеевой. – М.: Велби; Проспект, 2008. – 448 с.
5. Cattell, R.B. Structured personality learning theory. – New York: Praeger, 1983. – 466 c.
6. Galton, F. Natural inheritance / F. Galton. – London: Macmillan and Co, 1889. – 259 p.
7. SPSS Regression Models – http://www.learnspss.ru/
