20. Надежность частей теста. Уравнение Спирмена-Брауна. Определение коэффициента надежности с помощью формул Фланагана и Рюлона

Надежность частей теста – характеристика надежности психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных пунктов (заданий) теста. Наиболее простым и распространенным способом определения надежности частей теста является метод расщепления, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста.

Разделение объема заданий теста на сопоставимые части достигается:

а) распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степени субъективной трудности);

б) распределением пунктов по принципу близости или равенства значений индексов трудности. Такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на все пункты;

в) распределением задач по времени решения каждой из частей (для тестов скорости).

Для испытуемых в выборке определения надежности вычисляются оценки успешности решений, среднеквад-ратические отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов.

Уравнение Спирмена-Брауна отражает влияние изменения количества заданий на коэффициент надежности теста:

rt = nr't / 1 + (n – 1) r't,

где rt – коэффициент надежности для полного объема заданий;

r't – его значение после изменения числа заданий;

n – отношение нового числа заданий к первоначальному (если число заданий полного теста – 100, а его части, полученной методом расщепления на половины, – 50, то n = 0,5). Отсюда для полного теста:

rt = 2r't / 1 + r't.

Приведенные формулы справедливы для случаев равных стандартных отклонений обеих половин теста (?xl = ?х2). Если (?xl отличается от (?х2, для определения коэффициента надежности применяется формула Фланагана:

rt = 4?xl?х2r't / ?xl+ ?х2+ 2?xl?х2r't.

При определении rt целого теста можно воспользоваться формулой Рюлона:

rt = 1 ??2?/ ?2x,

где ?2? – дисперсия разностей между результатами каждого испытуемого по двум половинам теста;

?2x – дисперсия суммарных результатов. В данном случае коэффициент надежности рассчитывается как доля «истинной» дисперсии результатов теста.

Характеристика надежности по типу надежности частей теста имеет серьезные преимущества по сравнению с надежностью ретестовой и надежностью параллельных форм главным образом благодаря отсутствию необходимости в повторном обследовании.