Глава 1 ПРОИСХОЖДЕНИЕ ДИФФЕРЕНЦИАЛЬНОЙ ПСИХОЛОГИИ


...

ТЕСТИРОВАНИЕ В ПСИХОЛОГИИ

Наряду со статистикой, психологическое тестирование является важным средством дифференциальной психологии3. Мы уже говорили, что первоначальные тесты, содержавшиеся в новаторских работах Гальтона, были простыми сенсомоторными опытами. Следующий этап в развитии психологического тестирования связан с именем американца Джеймса Маккина Кэттелла. В своих работах Кэттелл объединил два параллельно развивавшихся течения: экспериментальную психологию и психологию, основанную на измерении индивидуальных различий. У Вундта в Лейпцигской докторантуре Кэттелл написал диссертацию о проявлении индивидуальных различий времени наступления реакции. После этого он читал лекции в Англии, где его интерес к индивидуальным различиям получил развитие в процессе общения с Гальтоном. Возвратившись в Америку, Кэттелл организовал лаборатории для занятий экспериментальной психологией, активно распространял методики психологического тестирования.


3 Для более детального изучения вопросов, связанных как с возникновением тестирования, так и с самим психологическим тестированием мы рекомендуем студенту ознакомиться с последними работами в этой области, такими как, например, исследования Анастази (2).


Первые тесты на интеллект. Понятие «интеллектуальный тест» впервые появилось в статье Кэттелла, написанной им в 1890 году (9). В этой статье описывались серии тестов, проводившиеся ежегодно на студентах колледжа с целью определения их интеллектуального уровня. Тесты, которые предлагались в индивидуальном порядке, включали измерение мускульной силы, веса, скорости передвижения, чувствительности к боли, остроты зрения и слуха, времени реакции, памяти и т.п. Своим выбором тестов Кэттелл поддержал точку зрения Гальтона, согласно которой измерение интеллектуальных функций должно осуществляться через тестирование сенсорной избирательности и времени реакции. Кэттелл предпочитал эти тесты еще и потому, что считал простые функции доступными для точных измерений в отличие от более сложных функций, измерение же сложных функций он считал делом почти безнадежным.

Тесты Кэттелла были обычными для последнего десятилетия девятнадцатого века. Попытки измерения более сложных психологических функций, тем не менее, можно было обнаружить в тестах на чтение, вербальные ассоциации, память и элементарную арифметику (22, 30). Такие тесты предлагались ученикам школ, студентам колледжей и взрослым людям. На Колумбийской выставке, проводившейся в Чикаго в 1893 году, Йастроу приглашал всех желающих испытать свои чувства, моторику, простые перцептивные процессы и сравнить полученные значения с нормативными (ср. 26, 27). Несколько попыток оценить эти первоначальные тесты дали обескураживающие результаты. Индивидуальные показатели были нестабильны (30, 37), они слабо коррелировали или не коррелировали вовсе с независимыми оценками интеллектуального уровня, такими как школьные оценки (6, 16) или академические степени (37).

Множество подобных тестов было собрано европейскими психологами этого периода, в том числе Орном (25), Крайпелиным (20) и Эббингаузом (12) в Германии, Гуччарди и Феррари (17) в Италии. Бине и Генри (4) в своей статье, опубликованной во Франции в 1895 году, подвергли критике большинство известных серий тестов за излишнее внимание к сенсорике и придание слишком большого значения способностям к специальным видам деятельности. Кроме этого, они утверждали, что не следует стремиться к высокой точности при измерениях более сложных функций, поскольку в этих функциях индивидуальные различия проявляются в большей степени. Для подтверждения своей точки зрения Бине и Генри предложили новые серии тестов, охватывающих такие функции, как память, воображение, внимание, сообразительность, внушаемость и эстетические чувства. В этих тестах уже можно распознать то, что в будущем привело к развитию знаменитых «интеллектуальных тестов» Бине.

Интеллектуальные тесты. В 1904 году французский министр народного образования создал комиссию для изучения проблемы отставания в учебе среди школьников. Специально для этой комиссии Бине и Симоном была разработана первая интеллектуальная шкала для вычисления общего коэффициента индивидуального уровня интеллектуального развития (5). В 1908 году Бине доработал эту шкалу, при использовании которой тесты группировались по возрастному признаку и подвергались тщательной эмпирической проверке. Например, для трехлетнего возраста отбирались тесты, которые в состоянии был пройти ребенок трех лет, для четырехлетнего возраста — тесты, доступные для ребенка четырех лет, и так далее, до тринадцатилетнего возраста. Полученные результаты у детей, прошедших тестирование по данной шкале, были затем объявлены нормами, присущими соответствующему «интеллектуальному возрасту», то есть возможностями нормальных детей определенного возраста, определенными Бине.

Тесты Бине — Симона привлекли к себе внимание психологов всего мира еще до того, как в 1908 году шкала была усовершенствована. Они были переведены на многие языки. В Америке эти тесты претерпели различные изменения и модификации, самой известной из которых стала модификация, разработанная под руководством Термена из Стэндфордского университета и получившая известность как тест Стэнфорд — Бине (34). Это была именно та шкала, в рамках которой впервые было введено понятие интеллектуального коэффициента (IQ), или соотношение между интеллектуальным и фактическим возрастом. Современную версию этой шкалы чаще называют шкалой Термена — Меррилла (35), она по-прежнему является наиболее широко используемой системой тестирования интеллекта человека.

Групповое тестирование. Другим важным направлением развития психологического тестирования было развитие групповых шкал. Шкалы Бине и их более поздние модели называются «индивидуальные тесты», т.  е. предназначенные для тестирования только одного испытуемого за один раз. Эти тесты таковы, что проводить их может лишь очень хорошо подготовленный специалист. К групповому тестированию эти условия непригодны. Появление шкал группового тестирования было, вероятно, главным фактором роста популярности психологического тестирования. Групповые тесты не только позволяют тестировать одновременно большие группы людей, но и являются гораздо более легкими в применении.

Стимулом для развития группового тестирования послужила настоятельная потребность исследования полуторамиллионной армии США, возникшая во время первой мировой войны к 1917 году. Военные задачи требовали достаточно простой процедуры для быстрого распределения рекрутов в соответствии с их интеллектуальными способностями. Армейские психологи ответили на запрос тем, что создали две групповые шкалы, получившие известность как «армейская-альфа» и «армейская-бета». Первая предназначалась для общего пользования, вторая представляла собой невербальную шкалу, разработанную для тестирования неграмотных новобранцев и иностранных призывников, которые не владели свободно английским языком.

Последующее развитие. После окончания первой мировой войны происходило бурное развитие множества доступных для использования тестов, разработка все новых методов и их применение к самым разным аспектам поведения. Групповые интеллектуальные шкалы создавались для всех возрастов и типов испытуемых, начиная с тех, кто ходит в детский сад, и до студентов старших курсов. Вскоре к ним добавились дополнительные тесты для выявления специальных способностей, например, к музыке или механике. Еще позже появились многофакторные системы исследования. Эти тесты возникли в результате разностороннего изучения человеческих качеств (они будут рассмотрены в главах 10 и 11). Важным является то, что вместо единственных, общих для всех результирующих значений, таких как IQ, многофакторные системы позволяют получать данные по целому комплексу основных способностей.

Параллельно с этим происходило распространение психологического тестирования неинтеллектуальных качеств, — через использование личных наработок, проективных техник (методик) и других средств. Этот тип тестирования начался с создания во время первой мировой войны «Бланка данных о личности» Вудвортса и стал быстро развиваться, включая в себя измерения интересов, убеждений, эмоций и социальных качеств. Но хотя для создания соответствующих тестов были затрачены огромные усилия, успех был меньше, чем при разработке тестирования способностей.

Тестовые понятия. Как и в статистике, в психологических тестах существуют определенные базовые понятия, которые должны быть известны студенту, изучающему дифференциальную психологию. Одним из них является понятие нормы. Никакие результирующие значения психологических тестов не имеют смысла до тех пор, пока они не сравниваются с тестовыми нормами. Эти нормы возникают в процессе стандартизации нового теста, при прохождении через него большого количества испытуемых, представляющих ту популяцию, для которой данный тест был разработан. Затем полученные данные используются как стандарт для оценки показателей индивидов. Нормы могут выражаться по-разному, например: как интеллектуальный возраст, как проценты или как стандартные значения, — но все они позволяют исследователю, сравнивая результаты испытуемого с результатами стандартизированной выборки, определить его «положение». Соответствуют ли его результаты средним по группе? Являются ли они более высокими или более низкими по сравнению со средними значениями, и если да, то насколько?

Другим важным понятием является надежность теста. Она подразумевает, насколько стабильные результаты он способен давать. Если индивид проходит повторное исследование в другой день или проходит то же самое тестирование в другой форме, то насколько может измениться результат? Надежность обычно определяется корреляцией результатов, полученных в двух случаях одним и тем же индивидом. Необходимо отметить, что надежность теста зависит от одного из типов случайных отклонений, описанных нами прежде. На надежность теста, естественно, не могут не влиять случайные отклонения относительных результатов тестирования конкретного индивида. Влияние же подобных отклонений на групповые результаты не имеет отношения к надежности теста.

Одним из самых главных вопросов, который возникает при психологическом тестировании, является вопрос о валидности теста, то есть о том, насколько он действительно измеряет то, что должен измерять. Валидность можно установить, сравнивая результаты данного теста с многочисленными данными, полученными другими способами, — со школьными оценками, индексом трудовой успешности, или лидерскими рейтингами.

Данные по нормам, по надежности и валидности теста должны быть собраны в то время, когда тест проходит испытания, то есть до того как он может быть передан для всеобщего использования. Доступным тестам не хватает желаемой конкретности и полноты получаемых данных. Чтобы систематизировать проблемы и улучшить положение дел, Американская психологическая ассоциация выпустила в 1954 году сборник «Технические рекомендации по разработке психологических тестов и диагностических процедур («Technical Recommendations for Psychological Testsand Diagnostic Techniques») (39). В нем обсуждались различные типы норм, способы измерения надежности и валидности, а также другие проблемы, связанные с оценкой тестов. Читателю, желающему более подробно изучить современные исследования психологических тестов, необходимо обратиться к данной публикации.