m_d_n (m_d_n) wrote in rabota_psy,
m_d_n
m_d_n
rabota_psy

Categories:

Пресловутая альфа Кронбаха

Цитируем по книге:

Современная психодиагностика России. Преодоление кризиса: сборник материалов III Всероссийской конференции: в 2 т. / редколлегия: Н.А. Батурин (отв. ред.) и др. – Челябинск: Издательский центр ЮУрГУ, 2015. Т.1. – 380 с.

Со стр. 232-240


УДК 159.9.072 + 159.9.019
ББК Ю92-2

АЛЬФА КРОНБАХА: КОГДА И ЗАЧЕМ ЕЕ СЧИТАТЬ

Митина О.В.
E-mail: omitina@inbox.ru

Московский государственный университет имени М.В. Ломоносова, г. Москва

Рассматриваются правила подсчета и назначение показателя альфа Кронбаха в психодиагностике. Указываются новые возможности интерпретации значений этого показателя при проведении различных психометрических процедур. Приводятся примеры вычислений в SPSS.

Ключевые слова: Надежность, валидность, достоверность, психодиагностическая методика

Прошло более шестидесяти лет с момента, когда Ли Кронбах в 1951 г. предложил свою формулу для подсчета внутренней надежности – согласованности пунктов опросника, априорно относимых к одной шкале, т.е. являющихся индикатором одного конструкта [3].

После этого были различные обсуждения и дискуссии, высказывания за и   против, предлагались альтернативные способы подсчета внутренней согласованности. Однако на сегодняшний день – это возможно самый распространенный показатель, который приводят в большинстве европейских и    американских публикаций, когда речь идет о создании, адаптации или использовании диагностических тестов. С одной стороны, настоятельная рекомендация Американской психологической ассоциации включать этот показатель в тексты статей, предназначенных для публикации в научных психологических журналах, а с другой – относительная простата вычисления показателя, имеющаяся в большинстве статистических пакетов, используемых психологами, в частности, в самом распространенном – SPSS, а также в Satistica, EQS, R и т.д. [1, 4].

В     отечественных публикациях данный показатель стали приводить «наиболее продвинутые» в психометрике коллеги, когда речь идет о разра-

232


ботке нового инструментария или при адаптации уже готового инструмента в другой культуре. Однако этот показатель имеет смысл измерять и в процессе использования готовой методики.
Так как любой измеренный показатель x может быть представлен в ви-
де:

x=τ+ε, (1)

где τ – истинный балл, который измерить абсолютно точно мы никогда не сможем (основной принцип теории измерений в любой области), а ε – та самая ошибка, с которой измерение произведено. Сравнение дисперсий наблюденных (измеренных) и истинных показателей изучаемой характе-
ристики и является мерой надежности (точности измерения):
, (2)
σxи στесть стандартные отклонения величин x и τ соответственно.
Поскольку τ и ε независимые величины, т.е.
cov15(τ,ε)=0, (3)
то
var16(x) =   =cov(x,x) = cov(τ+ε, τ+ε) =
= cov(τ,τ) + cov(ε,ε) + 2cov(τ,ε)= +   , (4)
т.е.
(5)
Поскольку
cov(x,τ)=cov(τ+ε,τ)=cov(τ,τ)=    , (6)
то
[cor(x,τ)]2= , (7)

Таким образом, можно сказать, что надежность – это квадрат коэффи-циента корреляции между истинными и измеренными баллами.

И так, надежность, трактуемая как точность измерения, определяется через сходство в изменениях истинного и измеренного баллов, и лежит в диапазоне от нуля до единицы. Чем в большей степени совпадают числитель и знаменатель, тем ближе к 1 показатель надежности.

Поскольку истинные баллы абсолютно точно нам не известны, то и надежность можно измерить лишь в некотором приближении.

В течение 20-го века было предложено множество различных способов оценки (т.е. приближенного вычисления) этого показателя. До сих пор развитие новых методов анализа данных приводит к появлению более точных оценок.

15 Обозначение ковариации.

16  Обозначение дисперсии.

233



Ниже мы будем говорить о способах вычисления надежности, когда тестирование каждого респондента происходит только один раз и только по одному набору пунктов (одномоментная надежность). Сюда можно отнести формулу Спирмана-Брауна 1910 года, формулу Кьюдера-Ричардсона, предложенную ими в 1927 году для дихотомических пунктов или пунктов, имеющих единственный правильный вариант ответа, а затем расширенную Кронбахом в 1951 году для случая, когда пункты измеряются с помощью лайкертовой шкалы или даже более сильных интервальных шкал. Между этими событиями свои варианты подсчета опубликовали Хойт (1940) и Гутман (1945).

Показатель α-Кронбаха стал самым популярным. По сравнению с остальными его чаще используют, но и чаще критикуют. Авторы, предлагающие другие варианты одномоментной надежности уже в недавнем прошлом (Raykov 1998; Sijtsma 2009;Bentler 2009; Gadermannetal 2012) [2, 4, 5] полемизируют главным образом именно с Кронбахом. Строго говоря, α-Кронбаха претендует на измерение не самой надежности, а ее нижней границы. Фактическая надежность может быть выше и в некоторых случаях расхождение между реальной надежностью и ее оценкой может быть существенным. Поэтому новые альтернативные меры – это уточнения нижней границы в сторону ее повышения.

К преимуществу α-Кронбаха можно отнести то, что, с одной стороны, его не так сложно подсчитать и в середине прошлого века, в отсутствии современных компьютерных технологий это было существенно. Новые способы оценки требуют более трудоемких способов подсчета, сложнее для понимания, могут быть вычислены далеко не во всех компьютерных программах. С другой стороны, получаемый показатель в сравнении с другими, известными к середине 20-го века был наиболее точен и свободен от случайных искажений.

В настоящее время более корректным и в определенном смысле более плодотворным может быть трактовка α-Кронбаха как меры внутренней согласованности пунктов Sijtsma (2009). Существуют разные мнения о близости понятий «внутренняя согласованность» (все пункты, входящие в шкалу имеют между собой высокие положительные парные корреляции) и «гомогенность» (все пункты в значительной степени детерминированы одним фактором, при кластеризации пунктов не происходит выделения значимо обособленных друг от друга кластеров). Кронбах считал эти понятия синонимами, другие исследователи их в той или иной мере дифференцируют, но, тем не менее, чтобы объяснить основания такой дифференциации, вынуждены изыскивать специальные контр примеры. А это является свидетельством того, что в подавляющем большинстве случаев два понятия достаточно близки.

Но, в таком случае мы можем использовать α-Кронбаха и для проверки конструктной и факторной валидностей.

234



Формула для вычисления показателя α-Кронбаха для шкалы X, в кото-рую входят пункты {Xi}, i=1,…, K выглядит следующим образом:

(8)
где – это дисперсии баллов по пункту Xi, а – это дисперсия по шкале X в целом.

Эту же формулу можно переписать как


(9)
где – это ковариации баллов по пунктам Xi и Xj.

В случае, когда все пункты независимы (ортогональны), т.е. σij=0, то и α=0. Чем больше встречается отрицательных попарных ковариаций, тем ниже общая сумма и итоговый показатель.

Формально, вычисляемый таким образом показатель, может быть меньше нуля, если средний показатель ковариаций по всем парам пере-менных меньше нуля. Предвидя вопрос о противоречии с тем что надеж-ность должна быть неотрицательной (см. формулы 2 и 7), напомним, что α-Кронбаха– это нижняя граница оценки надежности.

Таким образом, в случае отрицательного значения α-Кронбаха следует сделать вывод о том, что данная совокупность пунктов не составляет шкалу.

Чтобы утверждать, что пункты составляют шкалу нужно, чтобы попарные взаимосвязи между пунктами были положительны. Это дает возможность говорить о попарной (для каждой пары пунктов) и как следствие – внутригрупповой согласованности пунктов, входящих в шкалу (образующих конструкт, которому шкала соответствует).

Существуют разные мнения относительно того, какой коэффициент α-Кронбаха является хорошим. Некоторые авторы говорят о том, что он должен быть не менее 0.7, при этом в тестах на знания (где есть правиль-ный и неправильный ответы) показатель должен быть выше. Альтернативное мнение сводится к тому, что слишком высокий показатель свидетельствует об узости измеряемого конструкта, а значит о его чрезмерной специфичности, и, как следствие, о довольно ограниченной применимости. В любом случае не существует однозначно принятых границ диапазона в котором α-Кронбаха должна лежать.

Следует руководствоваться рекомендациями и здравым смыслом: неправомерно ожидать от шкалы, предназначенной для диагностики мотива или эмоции, которые сами по себе весьма динамичны, высокой согласованности ответов на пункты, предназначенные для измерения этих конструктов. α-Кронбаха равная 0.6 в этом случае – хороший показатель. Ответы на вопросы, призванные выявить компетенцию в какой-то области, должны быть высоко согласованными. Ожидаемая согласованность 0,8 и

235



выше. Устойчивые личностные конструкты должны иметь α-Кронбаха 0,65

– 0,75. В этом случае, при слишком высокой α-Кронбаха, можно порекомендовать оценить набор вопросов с точки зрения того, на сколько широко они представляют конструкт.
Tags: тест
Subscribe
  • Post a new comment

    Error

    Comments allowed for members only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 1 comment