Глава 10 CТРУКТУРА ЧЕРТ: ТЕОРИИ И МЕТОДОЛОГИЯ


...

ФАКТОРНЫЙ АНАЛИЗ

Факторная матрица. Основной целью факторного анализа является упрощение описания данных путем сокращения числа необходимых переменных, или величин. Предположим, мы провели по двадцать тестов на каждом из 100 человек. Результат каждого индивида будет описываться двадцатью величинами, сообразно результатам по каждому из двадцати тестов. Если путем факторного анализа мы обнаружим, что пяти факторов достаточно для столь же полного описания индивида, которое мы получали при помощи двадцати тестов, то мы сможем сократить количество переменных до пяти. После этого возможно будет создать тесты для проведения этих измерений. Более распространенной практикой является выбор из числа имеющихся тестов тех, с помощью которых можно будет наилучшим образом измерять каждый из конечных факторов. Во всяком случае, число необходимых результатов, требуемых для такого же полного отражения поведения индивида, как это делалось при помощи изначальной серии тестов, будет сокращено с двадцати до пяти.

Все техники факторного анализа начинаются с составления полной таблицы интеркорреляций между наборами тестов. Такая таблица называется корреляционной матрицей. Каждый факторный анализ заканчивается построением факторной матрицы, то есть таблицы, показывающей значимость каждого из факторов в каждом тесте. В Таблице 14 содержится факторная матрица, выведенная в одном из терстоунских исследований из интеркорреляций 21 теста, который был дан 437 школьникам седьмых и восьмых классов (56).

Таблица 14 Факторная матрица, основанная на интеркорреляциях между показателями 437 школьников, прошедших 21 тест. (Данные из Терстоуна и Терстоуна, 56, с. 91.)


ris82.jpg

Остаточный фактор* (*) Остаточный фактор является одним из тех, которые не имеют достаточной значимости по любой из переменных, хотя это важно для того, чтобы можно было его психологически идентифицировать по крайней мере в контексте эксперимента. Обычно в процессе факторного анализа выделяются один или два таких остаточных фактора, но никто не пытался интерпретировать их.

Семь факторов, вынесенных в верхнюю часть таблицы, соответствуют терстоуновским «первичным интеллектуальным способностям», описанным выше и обозначенным теми же самыми буквами.

Очевидно, что описание математического базиса или вычислительных процедур факторного анализа выходит за рамки данной книги. Множество разных методов анализа, преобразующего набор переменных в общие факторы, или измерения, было развито Келли (33), Хотеллингом (30), Бартом (9), Холзингером (29), Трионом (60, 61), Терстоуном (55), Гуттманом (27), Ригли (64) и другими. Несмотря на различие исходных позиций, большинство этих методов приводит к результатам, которые не очень отличаются друг от друга. В настоящее время наиболее распространенными техниками являются те, которые были предложены Терстоуном (55). Кратко и сравнительно доступно узнать об этих техниках можно у Гилфорда (25, гл. 16) и у Адкока (1). Более подробное рассмотрение методологии факторного анализа можно найти у Фрухтера (22). На более сложном уровне об этом можно прочесть в классической работе Терстоуна «Мультифакторный анализ» (55).

Однако понимание результатов факторного анализа доступно не только тем, кто овладел специализированной методологией. Даже не зная о том, как вычисляются значимые факторы, студент может узнать, как используется факторная матрица при интерпретации факторов и их наименовании. Это потребует скорее психологического инсайта, чем статистической подготовки. Чтобы понять сущность конкретного фактора, мы просто изучаем тесты, в которых интересующий нас фактор имеет высокую значимость, и стараемся вскрыть общие для них психологические процессы. Чем больше количество тестов, в которых данный фактор имеет высокую значимость, тем точнее мы можем определить сущность фактора.

Процесс интерпретации факторов можно проиллюстрировать на примере таблицы 14. Прежде всего, мы должны отметить, что значимости фактора выражаются на одной и той же шкале корреляционных коэффициентов, то есть от —1,00 через 0 до +1,00. Действительно, значимости факторов можно рассматривать как корреляции каждого теста с фактором (или с тем, что является общим для группы тестов). Очень низкие значимости можно пропускать, поскольку они могут представлять собой лишь случайные отклонения от ноля, — точно так же, как низкая корреляция может быть несущественным отклонением от ноля. Более того, даже будучи статистически значимыми, низкие значимости фактора мало помогают в его идентификации. Мы не сможем проникнуть в сущность фактора, изучая тест, который имеет с ним мало общего.

Соответственно интерпретируя каждый фактор, мы берем во внимание только те тесты, в которых значимость данного фактора превышает некоторое минимальное значение. В таблице 14 необходимо выделить все факторы со значимостью 0,30 или выше. Надо сказать, что первый фактор имеет значимости свыше 0,30 в трех тестах: на идентичные числа, лица и зеркальное чтение. Все эти тесты требуют быстрого распознавания сходств или различий на простом числовом, графическом или вербальном материале. Следовательно, этот фактор проявляет себя как тождественный фактору, идентифицированному в предыдущих исследованиях как скорость восприятия (Р). Следующий фактор обладает высшей значимостью в тестах на идентичные числа, добавление, умножение и «на три больше», в котором испытуемый отмечает в сериях каждое число, превышающее предыдущее только на 3. Очевидно, что это числовой фактор, используемый при вычислениях, хотя даже тест, включающий в себя распознавание идентичных чисел, проявляет его значимость. Анализируя таким способом другие колонки таблицы 14, мы можем проследить то, как раскрывается смысл названий оставшихся факторов: беглости речи, вербального понимания, пространства, ассоциативной памяти, рассуждения. Очевидно, что даже не разбирающийся в статистике читатель может таким образом исследовать любую опубликованную таблицу факторных значимостей и сравнить интерпретацию автора со своей собственной.

Координатные оси. Для наиболее плодотворного изучения сообщений о проведенных факторных исследованиях полезно выразить их в другой форме. Общепринятым является геометрическое представление факторов как координатных осей, в координатной сетке которых каждый тест может найти свое место. Рисунок 64 иллюстрирует эту процедуру.


ris83.jpg

Рис. 64. Значимости факторов 21 переменной из таблицы 14, расположенные в осях N (Числовой фактор) и V (Вербальное понимание).

На данном графике координаты каждого из 21 теста таблицы 14 отмечены по двум факторам, а именно, по отношению к «Числу» (N) и к «Вербальному пониманию» (V). Аналогичным образом 21 тест был выражен через каждую пару факторов. Каждый тест представлен точкой, положение которой относительно осей N и V соответствует значимости данного теста соответственно для N и V факторов. Например, чтобы поставить точку, выражающую тест 1 (идентичные числа), мы продвигаемся на 0,40 вдоль оси N и затем идем вниз на расстояние —0,02 вдоль оси V, чтобы поставить точку, отмеченную как «1». Значимости факторов N и V для каждого другого теста обозначаются аналогичным образом.

Необходимо отметить, что тесты 1, 16, 17 и 18 имеют высокую значимость по оси N, в то время как тесты 7, 8, и 9 имеют высокую значимость по оси V. Все остальные тесты располагаются близко от нулевой точки, имея низкую или отрицательную значимость по обеим осям. Высокие значимости других тестов можно было бы точно так же изобразить соответствующими парами координат.

Важно помнить о том, что положение координатных осей не фиксировано никакими данными. Изначальная корреляционная таблица определяет позиции тестов (точки на рисунке 64) лишь в отношении друг к другу. Одни и те же точки могли быть поставлены в любом месте координатной сетки. По этой причине факторные аналитики обычно изменяют координатные оси до тех пор, пока они не приобретают наиболее удобный для интерпретации вид. Эта процедура в чем-то аналогична измерению расстояния, например, от Чикаго до Гринвича.

Координатные оси, использованные в таблице 14 и на рисунке 64, уже были видоизменены в соответствии с терстоуновскими критериями «позитивного многообразия» и «простоты структуры». Первый критерий требует приведения осей в такое положение, которое бы скрывало все отрицательные значимости. Большинство психологов рассматривают отрицательные значимости как неприменимые к тестам на способности, поскольку из них следует, что чем выше оценка индивида по какому-то конкретному фактору, тем более низкий тестовый результат у него будет. Критерий простоты структуры означает, что каждый тест должен иметь значимости в отношении наименьшего числа факторов. Оба эти критерия способствуют выделению факторов, для которых возможна простая и однозначная интерпретация. Необходимо отметить, что в таблице 14 есть всего несколько отрицательных значимостей и что большинство тестов имеет значимости по одному-единственному фактору.

Координатные оси могут быть ортогональными (расположенными под прямым углом друг к другу) или косоугольными. Когда оси косоугольные, это означает, что факторы коррелируют друг с другом. Некоторые факторные аналитики предпочитают работать с ортогональными, некоррелированными факторами, так как их проще описывать. Другие утверждают, что поскольку такие критерии, как критерий позитивного многообразия и критерий простоты структуры, больше соответствуют косоугольным координатам, то более предпочтительно использование именно таких осей. Терстоун (53), например, отмечает, что он не видит причин, из-за которых психологические факторы не должны быть скоррелированы друг с другом. Измерения телосложения, роста и веса доказали свою пользу, несмотря на то что они сильно коррелируют друг с другом.

Когда сами факторы коррелируют друг с другом, можно подвергнуть интеркорреляции между факторами такому же статистическому анализу, который мы использовали при обработке интеркорреляций между тестами. Иными словами, мы можем «факторизовать факторы» и вывести факторы второго порядка. Эта идея нашла свое воплощение во множестве исследований как способностей, так и личностных переменных. Определенные исследования тестов на способности привели к появлению единственного, генерального фактора второго порядка, который может рассматриваться как эквивалентный спирменовскому фактору g(56). Для американского факторного анализа в целом характерно произведение максимально возможного числа интеркорреляций групповых факторов и затем идентификация фактора g как фактора второго порядка. С другой стороны, британские психологи обычно начинают с фактора g, к которому они относят большую часть тестовых интеркорреляций, и затем обращаются к групповым факторам, чтобы найти причины возникновения оставшихся корреляций. Эти различия в процедурах отражают различия в теоретических акцентах, которые мы рассматривали в самом первом разделе.

Меры предосторожности, необходимые при использовании факторного анализа. Поскольку все техники факторного анализа начинаются с интеркорреляций, какие-либо условия, воздействующие на корреляционные коэффициенты, будут также влиять на значимость факторов. Важнее всего, чтобы для установления стабильных корреляций привлекалось достаточное количество людей. Даже при 100 случаях корреляционный коэффициент должен быть по крайней мере 0,25, чтобы быть на уровне 0,01, то есть существенно больше нуля. В меньших группах разброс корреляций может быть настолько широк, что любые показатели факторных значимостей окажутся недостоверными.

На величину корреляционного коэффициента влияет также гетерогенность группы. Самым простым является пример, связанный с возрастной гетерогенностью. В группе, состоящей из детей в возрасте от 3 до 15 лет, сильная положительная корреляция будет найдена даже между такими разными характеристиками, как размер большого пальца и интеллектуальный возраст по шкале Стэнфорд — Бине, поскольку старшие дети будут в тенденции иметь большие размеры пальцев и больший интеллектуальный возраст. Те же самые два измерения, вероятно, покажут нулевую корреляцию внутри группы, гомогенной в возрастном отношении и состоящей, например, исключительно из 10-летних подростков. Однако гетерогенность не всегда усиливает корреляцию. Она может ослаблять ее или даже приводить к возникновению отрицательной корреляции между переменными, которые никаким иным образом не связаны друг с другом. Таким образом, если группу, состоящую из китайцев и скандинавов, измерить по росту и по склонности к использованию палочек для еды, то между этими двумя измерениями была бы найдена чрезвычайно сильная отрицательная корреляция. Китайцы в целом оказались бы меньше ростом, чем скандинавы, и показали бы определенно большее умение в обращении с палочками для еды. Как бы то ни было, внутри обеих групп мы едва ли можем ожидать проявление корреляции между двумя переменными. Группы, в которых возможно использование факторного анализа, должны быть гомогенными по таким признакам, как пол, возраст, расовое и национальное происхождение, социоэкономический уровень и т.п., иначе окажется, что ни по одной из коррелируемых переменных между субгруппами нет никаких существенных различий.

Тесты, используемые в факторном анализе, должны быть высоконадежными. Ненадежные тесты не смогут помочь в идентификации факторов. Различные результаты, подвергаемые интеркорреляции, должны быть также экспериментально независимыми. Это означает, что из одного и того же набора ответов нельзя вывести две переменные в корреляционной матрице. В таких случаях корреляция между показателями может быть результатом частичного совпадения в показателях специфических и случайных факторов, вследствие чего конечная конфигурация факторов может оказаться искаженной. Примеры экспериментально зависимых результатов включают в себя одновременное определение в одном и том же тесте показателей скорости и точности действий, или определение результатов по таким тестам, как бланк профессиональных интересов Бернрейтера или Стронга, в котором одно и то же задание может иметь неоднозначные решения, или же определение множества показателей Роршаха, основанных на отношениях и различных сочетаниях идентичных ответов.

Еще одним видом измерения, несовместимого с обычным факторным анализом, являются ипсативные показатели, в которых индивидуальный результат выражается со ссылкой на его собственное значение. Показатели в исследовании ценностей Оллпорта — Вернона — Линдзи иллюстрируют эту процедуру. Для индивида невозможно получить только высокие или только низкие результаты по всем шести частям этого теста; высокие показатели в одной части должны уравновешиваться низкими в других частях. Индивидуальный профиль по этому тесту показывает его относительное положение по шести ценностям. Если такие показатели интерколлерированы, то некоторые отрицательные корреляции будут неизбежно являться артефактом оцениваемой системы. Для плодотворного применения факторного анализа должны соблюдаться и другие, технические, условия. Обсуждение этих условий совместно с детальным рассмотрением некоторых из вышеперечисленных пунктов читатель сможет найти у Макнамара (37) и Гилфорда (24).