m_d_n (m_d_n) wrote in rabota_psy,
m_d_n
m_d_n
rabota_psy

Categories:

Пресловутая альфа Кронбаха

Начало здесь http://rabota-psy.livejournal.com/334199.html Цитируем по книге:

Современная психодиагностика России. Преодоление кризиса: сборник материалов III Всероссийской конференции: в 2 т. / редколлегия: Н.А. Батурин (отв. ред.) и др. – Челябинск: Издательский центр ЮУрГУ, 2015. Т.1. – 380 с.

Со стр. 232-240


Таким образом, если у вас есть набор ответов на пункты опросника, относящиеся согласно ключу к какой-то одной шкале, вычисление α-Кронбаха в любом случае не только дань требованиям, но и полезная для интерпретации результатов процедура. Но эта интерпретация и возможные выводы зависят от статуса методики, а также целей и задач исследования.

При создании новой методики (адаптации, валидизации и пр.), т.е. проверке того, насколько ваши гипотезы о ключе справедливы, можно вычислить α-Кронбаха и посмотреть, какие пункты понижают согласованность.

Если набор пунктов является гомогенным (а для проверки этого факта нужно параллельно выполнить эксплораторный факторный и кластерный анализ), то можно говорить, что процедура удаления плохо согласованных пунктов, повышая согласованность группы пунктов в целом, не суживает конструкт, а удаляет шум. Однако если набор пунктов распадается на обособленные кластеры, имеет многофакторную структуру с прослеживаемыми семантическими различиями, но, тем не менее, описывает один конструкт, то процедура отбрасывания вопросов может привести к неоправданному сужению конструкта, если показатели низкой согласованности будут приписаны вопросам, целиком входящим в какой-то один кластер. Формально в этом случае мы действительно получим более согласованный набор вопросов, но достигнута эта согласованность будет ценой потери общности.

Чтобы обезопасить себя от такой ошибки необходимо параллельно выполнять кластерный и факторный анализ для контроля процесса удаления пунктов. Альтернативным вариантом может быть разделение шкалы на гомогенные субшкалы и работа с каждой из них в отдельности.

При проведении исследования с использованием методики в качестве готового инструмента, определение внутренней согласованности можно рассматривать как проверку репрезентативности выборки.

Если подсчитанная на ваших эмпирических данных согласованность не отличается значимо от указанной авторами в описании методики17, то это может служить обоснованием корректности интерпретации результатов, полученных с применением данной методики. В частности, ваша выборка не отличается существенно от выборки, на которой методика апробировалась, а измеряемый с помощью шкалы показатель соответствует заявляемому методикой конструкту. В этом случае, если необходимо, можно использовать также нормативные показатели.

17 Конечно, речь идет о случае, когда надежности были подсчитаны авторами методики и опубликованы в описании. Иначе вообще нельзя говорить о существовании тестовой методики, хотя, к сожалению, такие случаи пока не являются редкостью.

236



Если у автора методики в описании заявлена высокая надежность шкалы, а ваши результаты существенно ниже, то это значит, что выборка апробации и выборка эмпирического исследования различаются, а потому необходимы дополнительный анализ и рефлексия. В предположении, что выборка апробации соответствует всем требованиям репрезентативности генеральной совокупности, а, вы, основываясь на показателях, не связанных с методикой, можете обосновать, что эмпирическая выборка является более узкой частью этой генеральной совокупности, то использование методики для определения выраженности конструкта с последующим сопоставлением с заявленными в методике нормативными показателями является корректным.

Однако, в большинстве случаев, пункты, согласованные на выборке в полной мере репрезентирующей генеральную совокупность, на более узкой подвыборке так же будут согласованы. Чем больше однородность (т.е. узость выборки) тем меньше и ковариация между переменными и их дисперсия. Т.е. одновременно в формуле (9) должен уменьшаться не только числитель, но и знаменатель.

Низкая согласованность, таким образом, чаще всего является свидетельством того, что методика к данной выборке неприменима. В этом случае исследователь может на базе имеющегося набора вопросов с помощью факторного и кластерного анализа выделить подмножество согласованных вопросов. Исходя из их содержания и из содержания вопросов, которые в это подмножество не вошли обосновать содержательную валидность получаемой методики. Эту процедуру можно назвать «легкой валидизацией». (Конечно, это надо делать с перспективой последующей полноценной валидизации).

Но может возникнуть ситуация, когда в исследовании используется методика, апробированная на выборке, априорно репрезентирующей иную генеральную совокупность. В этом случае хорошая согласованность пунктов подтверждает корректность использования методики. Т.е. мы имеем ситуацию при которой вопросы согласованы исходя из высокого показателя α-Кронбаха, а исходя из их содержания они должны высоко коррелировать с тем же конструктом, что и на первоначальной выборке. Крайне трудно представить себе ситуацию, чтобы от одной генеральной совокупности к другой семантика языка, на котором сформулированы пункт методики, трансформировалась на столько, чтобы не один, а целое множество вопросов согласовано относились к чему-то иному (при условии, что в обоих случаях один и тот же язык является родным).

Такие ситуации достаточно часто возникают, когда диагностическую методику, апробированную на популяции одной культуры, переносят в по-пуляцию другой культуры, в массе своей или в достаточно большой ее части разговаривающую на том же языке.


237


Западные исследователи призывают к осторожности, когда сталкиваются с необходимостью, например, использовать методики, разработанные в США для проведения исследований в англоговорящих странах этим. Подобная ситуация возникает при использовании русскоязычных методик в республиках СНГ. Поскольку во многих из них сильны традиции общей советской психологической школы, проживает много людей, для которых русский язык – родной или язык свободного владения, а методического инструментария на государственном языке еще не создано, то исследования и практическая работа выполняется с помощью методик сделанных или адаптированных в России.

Понятно, что в перспективе нужно адаптировать все методики на государственный язык, но пока этого нет и исследователи уверены в свободном владении респондентами русским языком, определение согласованности пунктов может служить подтверждением того, что формулировки вопросов за пределами России понимаются так же, как и в России (если α-Кронбаха в двух случаях совпадают).

Если же согласованность при переносе понижается, то можно посмотреть, какие пункты оказываются «посторонними» для данной шкалы. Такие показатели могут быть полезны для выявления различий в понимании семантики пунктов, а значит и семантики конструкта.

Таким образом, подсчет α-Кронбаха (наряду с показателями описательной статистики) позволяет убедиться, что выборка исследования их той же генеральной совокупности, а в случае принципиально иной генеральной совокупности обосновать конструктную валидность.

Конечно это лишь достаточное условие. Если вдруг оказалось, что на ваших данных (иной генеральной совокупности) не воспроизводятся показатели, которые указаны авторами при описании методик, то вы оказываетесь фактически перед задачей адаптации методики.

В наиболее популярной на сегодняшний день среди психологов программе статистического анализа SPSSпроцедура вычисления α-Кронбаха очень проста. Поэтому, в качестве примера сошлемся именно на эту программу.

Обратим внимание на то, что при подсчете согласованности пунктов с помощью α-Кронбаха, как впрочем и других показателей надежности которые в SPSS можно вычислить, необходимо перекодировать пункты, имеющие обратный ключ таким образом, чтобы ответы на них соответствовали ответам на пункты с прямыми ключами.

Для каждого респондента i, имеющего балл xi по пункту xс обратным ключом мы переводим его в балл уi с использованием формулы:

yi = (max + min) –xi (10) max – это максимальный возможный балл для пунктов, входящих в шкалу,

а min – это минимальный возможный балл для пунктов, входящих в шкалу.


238


Предполагается, что все пункты, входящие в одну шкалу имеют один и тот же диапазон баллов, присваиваемых за ответ.

Такое преобразование можно сделать в EXCEL, если данные первоначально хранятся в файле EXCEL, и потом перенести их в файл SPSS. Но если данные уже являются файлом для SPSS, то можно воспользоваться

командой Compute (Вычислить). Приведем здесь синтаксис данной процедуры18.

COMPUTE y = С – x . EXECUTE .

В    результате выполнения этих команд в файле с данными, в который входит столбец x, возникнет еще один столбцеy, в котором значение yi, находящееся в i-ой строке, соотносится со значением xi, находящимся в i - ой строке столбца xпо формуле (10).

Иногда использовать командный файл оказывается более удобным, чем выполнять все операции с помощью меню. Особенно это актуально, когда нужно выполнить подряд несколько одинаковых команд для разных переменных. Создав один раз список необходимых команд в файле, имеющем расширение «sps», можно последовательно скопировать его несколько раз, заменить имена переменных, а затем выбрать команду Run (Выполнить).

В   результате в файле с данными дополнительно будут приписаны вычисленные, т.е. перекодированные переменные, имеющие уже прямой ключ. Получив «правильный» для подсчета согласованности массив данных, в котором пункты составляющие шкалу имеют прямой ключ, а значит можно предположить, что они положительно коррелируют друг с другом, мы должны подсчитать α-Кронбаха, выявить пункты, удаление которых повышает надежность.

Это также можно делать с помощью меню команд [1], а можно составить командный файл.

RELIABILITY /VARIABLES=xyzw

/SCALE('ALL VARIABLES') ALL/MODEL=ALPHA /STATISTICS=CORR
/SUMMARY=TOTAL .

Спомощью этого набора команд определяем согласованность пунктов x, y, z, w.19

Помимо общих показателей согласованности для шкалы в целом также по каждому пункту вычисляются гипотетические показатели α-Кронбаха, в предположении, что данный пункт из общего набора удален. Набор этих показателей очень полезен для анализа. Пункт хорошо работает на шкалу, если при его удаление согласованность понижается. Если при удалении пункта согласованность шкалы в целом повышается, то пункт является в данном наборе лишним.

18C=max + min

19 В общем случае переменных может быть произвольное количество, не менее двух.

239



Как уже отмечалось факторный и кластерный анализ необходимы для установления гомогенности шкалы и для контроля конструкта при отбрасывании посторонних пунктов. Если два разных метода приводят к одному и   тому же результату, то можно считать это доказательством достоверности.

Таким образом, при работе с методикой, имеющей хорошие психометрические показатели, проверка согласованности на конкретной эмпирической выборке в случае высокого значения α-Кронбаха позволяет не только подтвердить надежность шкалы, но и обосновать ее валидность.

Если оказывается, что психометрический анализ эмпирических данных полученных по тестовой методике, прошедшей психометрический анализ

и    имеющей хорошие показатели валидности и надежности, оказывается неудовлетворителен, то, скорее всего причина в том, что выборка эмпирического исследования существенным образом отличается от выборки апробации. В этой ситуации необходимо выяснить параметры различий, а также в рамках имеющихся данных попробовать найти подмножество пунктов в максимальной степени согласованных друг с другом и выявить семантический инвариант, который за ними стоит.

Литература

1.   Митина, О.В. Разработка и адаптация психологических опросников / О.В. Митина. – М.: Смысл, 2011. – 240 c.

2.   Bentler, P. Alpha, dimension-free, and model-based internal consistency reliability / P. Bentler // Psychometrika. – 2009. – V. 74. – P. 137–143.

3.   Cronbach, L. J. My current thoughts on coefficient alpha and successor procedures / L.J. Cronbach // Educational and Psychological Measurement. – 2004. –V. 64. P. 391–418.

4.   Gadermann, A. Estimating ordinal reliability for Likert – type and ordinal item response data: A conceptual, empirical, and practical guide / A. Gadermann, M. Guhn, B. Zumbo // Practical Assessment, Research & Evaluation. – 2012. – V. 17, N 3 – http: //pareonline.net/getvn.asp?v=17&n=3. – P. 1–13
5.   Sijtsma,  K.  On  the  use,  the  misuse,  and  the  very  limited  usefulness  of Cronbach’s alpha / K. Sijtsma // Psychometrika. – 2009. – V. 74, N. 1. – P. 107–120.
Tags: тест
Subscribe
  • Post a new comment

    Error

    Comments allowed for members only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments