m_d_n (m_d_n) wrote in rabota_psy,
m_d_n
m_d_n
rabota_psy

Categories:

Пресловутый регрессионный анализ

Цитируем по книге:

Современная психодиагностика России. Преодоление кризиса: сборник материалов III Всероссийской конференции: в 2 т. / редколлегия: Н.А. Батурин (отв. ред.) и др. – Челябинск: Издательский центр ЮУрГУ, 2015. Т.2. – 233 с.

Со стр. 101-104


УДК 519.22-7 + 159.937 ББК Ю9В

ПРИМЕНЕНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ИССЛЕДОВАНИЯХ ПО СПЕЦИАЛЬНОЙ ПСИХОЛОГИИ

Лаптева Н.В.

E-mail: 89229690822@yandex.ru

Вятский государственный гуманитарный университет, г. Киров

Рассматривается применение регрессионного анализа в исследованиях по специальной психологии, показываются возможности его применения для решения задач, связанных с оценкой влияний, определения вклада независимых переменных в вариацию зависимой и предсказанием значения зависимой переменной с помощью независимой.

Ключевые слова: математическая статистика, регрессионный анализ, специальная психология.

Математическая статистика в руках специального психолога должна быть мощным инструментом, позволяющим не только успешно анализировать данные психодиагностики, но и, прежде всего, способствовать становлению его объективного мышления.

Анализ использования методов математической статистики в диссертационных исследованиях по психологии за 2012–2014 гг. показал следующие результаты. Во всех исследованиях используются методы описательной статистики. Остальные методы распределились следующим образом: наибольшей популярностью пользуются методы, позволяющие выявлять различия в уровне исследуемого признака (70,7%, в основном это критерий Манна-Уитни – 62,1%) и корреляционный анализ (65,9%). На втором по популярности месте находятся: методы выявления различий в распределении признака (41,5%, хи-квадрат критерий), методы оценки сдвига значений исследуемого признака (34,1%, Т-критерий Вилкоксона),   факторный анализ (31,7%), t-критерий Стьюдента (29,3%). В исследованиях по социальной и педагогической психологии наибольшее внимание уделяется корреляционному анализу, а в работах по коррекционной психологии и психологии развития – методам выявления различия в уровне исследуемого признака. В докторских диссертациях спектр методов математической статистики разнообразнее, внимание в большей степени уделяется сложным методам, таким как факторный, кластерный, дисперсионный анализ.

Регрессионный анализ встречается только в 17,1% работ, в основном в исследованиях по психологии развития, а в исследованиях по педагогической и коррекционной психологии практически не встречается. Однако, считаю, что данный метод незаслуженно игнорируется, поскольку является более простым, чем факторный, кластерный и дисперсионный анализ и позволяет в отличие от них определить вклад независимых переменных в вариацию зависимой и предсказать значение зависимой переменной с помощью независимой. Регрессионный анализ является методом математической статистики, не предполагающим знания функционального вида генеральных распределений, то есть непараметрическим методом, что позволяет использовать его в исследованиях по специальной психологии.

Понятие «регрессионный анализ» ввел Ф. Гальтон [6], установивший факт определенного соотношения между ростом родителей и их взрослых детей:

он заметил, что у родителей самого низкого роста дети оказывались несколько выше, а у родителей самого высокого роста – ниже. Подобную закономерность он назвал регрессией. Регрессионный анализ применяется преимущественно в эмпирических исследованиях при решении задач, связанных с оценкой каких–либо влияний (например, влияния одаренности интеллектуальной на успеваемость, мотивов – на поведение), при конструировании психологических тестов и пр.

Р. Кеттелл [5] при помощи регрессионного анализа получил «профессиональные портреты» для некоторых специальностей: психотерапевт = 0,72A + 0,29B + 0,29H +  0,29N;  психодиагност  =  0,31A + 0,78B + 0,47N.

Таким образом, для психотерапевта важнее всего общительность (А), а для психодиагноста – интеллект (В).

Для корректного выполнения регрессионного анализа необходимо учитывать ограничения линейной регресии: использование метрических переменных, равенство условных дисперсий (D(Y/X) = const), независимость ошибок от предикторов, независимость предикторов между собой, нормальное распределение предикаторов, достаточное количество наблюдений (обычно > 15) [4].

Приведем пример построения регрессионного уравнения. По данным психологического исследования [2] готовности детей к обучению в школе требуется построить регрессионную модель успешности обучения в 1 классе на основе следующих показателей:

Y – успешность обучения в 1 классе (средний уровневый показатель);
X1 – личностная готовность к обучению в школе (средний уровневый показатель);
X2 – интеллектуальная готовность к обучению в школе (средний уров- невый показатель).

Для примера нами были использованы данные исследования психологической готовности и адаптации к обучению в школе 2010–2011 гг. по всем показателям были рассчитаны средние уровневые показатели (СУП) по 3–уровневой шкале с помощью методики, разработанной В.В. Рыжовым [3]: высокий уровень развития свойства принимается за 3 балла, средний уровень – за 2 балла и низкий уровень – за 1 балл.

Показатель СУП рассчитывается по формуле: СУП = (%выс.×3+%сред.×2+%низ.×1):100.

Анализ матрицы парных коэффициентов корреляции показывает, что результативный показатель и признакиаргументы тесно не связаны. Если же связь присутствует (например, rx1x3=0,88–0,98), то наблюдается явление мультиколлинеарности. Отрицательное влияние мультиколлинеарности будет проявляться в статистической незначимости коэффициентов регрессии и недостоверности полученного уравнения регрессии. В этом случае выполняется алгоритм пошагового регрессионного анализа с исключением переменных и учетом того, что в уравнение должна войти только одна из всех тесно связанных переменных. Получаем окончательное уравнение регрессии:

Ŷ = – 0,342 + 0,769 X+ 0,295 X4

2


Уравнение значимо при α = 0,05, т.к. Fнабл= 4,055 > Fкр = 2,991, найденного по таблице F-распределения при α = 0,05; ν1 = k + 1 = 3 и ν2=n κ−1=24 (где k – количество переменных, n – количество наблюдений). Значимы и все коэффициенты регрессии β1 и β2 в уравнении t (= 2,274; 2,196) > tкр (α = 0,05; ν = 24) = 2,059.

Множественный коэффициент детерминации ry = 0,484 свидетельствует о том, что только 48,4% вариации успеваемости объясняется вошедшими в модель показателями (X1 и X2), то есть личностной и интеллектуальной готовностью. Остальная часть вариации обусловлена действием неучтенных факторов – других видов готовности, учебной мотивации, сложившимися отношениями с учителем и др.

Из уравнения регрессии следует, что увеличение на 1 среднего уровня показателя (СУП) личностной готовности приводит к росту успеваемости  в среднем на 0,769 СУП, а интеллектуальной готовности – на 0,295 СУП. На основании регрессионного уравнения можно, таким образом, предсказать успеваемость учащихся в 1 классе.

Таким образом, расчет регрессионного анализа в исследования по специальной психологии может быть весьма полезен. Однако, возможны и некоторые сложности. Специфический характер исходных психодиагностических признаков и критериальных показателей, которые, как правило, измеряются в дихотомических и ординальных шкалах, приводит к тому, что расчетные формулы регрессионного анализа приобретают значительную степень приблизительности. Число исходных признаков, подвергающихся эмпирико-статистическому анализу в психодиагностических исследованиях, велико (может достигать несколько сотен) и между ними, как правило, встречаются объемные группы сильно связанных признаков. В этих условиях возникает явление мультиколлинеарности, приводящее к плохой обусловленности и в предельном случае вырожденности матрицы ковариации. При плохой обусловленности решение системы является неустойчивым – норма вектора оценок коэффициентов регрессии и отдельные компоненты могут стать весьма большими, в то время как, например, знаки коэффициентов могут инвертироваться при малом изменении исходных данных.

В практике конструирования психодиагностических тестов и анализе данных исследования могут применяться, либо более простые алгоритмы определения состава линейной регрессионной модели, либо более сложные.

Среди более простых методов В.А. Дюк [1] называет метод «k» лучших признаков и методы последовательного увеличения и уменьшения группы признаков (ПУВГ) и (ПУМГ). К более сложным методам можно отнести процедуры нелинейного моделирования (SPSS Regression Models [7]), которые позволяют освободиться от ограничений в виде ответов «да/нет», использовать для прогнозирования значения дихотомических переменных, использовать данные, не отвечающие статистическим требованиям, накладываемым обычным методом наименьших квадратов и др.

Литература

1.     Вассерман, Л.И. Психологическая диагностика и новые информационные технологии  / Л.И. Вассерман,  В.А. Дюк,  Б.В. Иовлев, К.Р. Червинская  –  СПб: «СЛП», 1997. – 208 c.

2.     Лаптева, Н.В. Психологические основания реализации проектного подхода в начальном образовании / Н.В. Лаптева // Вестник Вятского государственного гуманитарного университета. – 2010. – Т. 1, № 1. – С. 123–131.

3.     Рыжов, В.В. Психологическая диагностика способностей к изучению иностранных языков / В.В. Рыжов. – Нижний Новгород: НГЛУ, 2003.

4.     Статистика / под ред. И.И. Елисеевой. М.: Велби; Проспект, 2008. 448 с.

5.     Cattell, R.B. Structured personality learning theory. – New York:  Praeger, 1983. – 466 c.

6.    Galton, F. Natural inheritance / F. Galton. – London: Macmillan and Co,   1889. – 259 p.

7.    SPSS Regression Models – http://www.learnspss.ru/



Tags: тест
Subscribe
  • Post a new comment

    Error

    Comments allowed for members only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments