Глава 7. Научающе — бихевиоральное направление в теории личности: Б. Ф. Скиннер
Респондентное и оперантное поведение
При рассмотрении скиннеровского подхода к личности следует различать две разновидности поведения: респондентное и оперантное. Чтобы лучше понять принципы скиннеровского оперантного научения, мы сначала обсудим респондентное поведение.
Респондентное поведение подразумевает характерную реакцию, вызываемую известным стимулом, последний всегда предшествует первой во времени. Хорошо знакомые примеры — это сужение или расширение зрачка в ответ на световую стимуляцию, подергивание колена при ударе молоточком по коленному сухожилию и дрожь при холоде. В каждом из этих примеров взаимоотношение между стимулом (уменьшение световой стимуляции) и реакцией (расширение зрачка) невольное и спонтанное, это происходит всегда. Также респондентное поведение обычно влечет за собой рефлексы, включающие автономную нервную систему. Однако респондентному поведению можно и научить. Например, актриса, которая очень потеет и у которой «сосет под ложечкой» от страха перед выходом на публику, возможно, демонстрирует респондентное поведение. Для того, чтобы понять, как можно изучать то или другое респондентное поведение, полезно познакомиться с трудами И. П. Павлова, первого ученого, чье имя связывают с бихевиоризмом.
Павлов, русский физиолог, первым при изучении физиологии пищеварения открыл, что респондентное поведение может быть классически обусловленным. Он наблюдал, что пища, помещенная в рот голодной собаки, автоматически вызывает слюноотделение. В таком случае, слюноотделение — это безусловная реакция или, как Павлов назвал это, безусловный рефлекс (БР). Он вызывается пищей, которая является безусловным стимулом (БС). Великое открытие Павлова состояло в том, что если ранее нейтральный стимул многократно объединялся с БС, то в конце концов нейтральный стимул приобретал способность вызывать БР и в тех случаях, когда он предъявлялся без БС. Например, если колокольчик звонит каждый раз непосредственно перед тем, как пища оказывается в пасти собаки, постепенно у нее начнет выделяться слюна при звуке колокольчика, даже если пищи нет. Новая реакция (слюноотделение на звук колокольчика) называется условным рефлексом (УР), а ранее нейтральный, вызывающий ее стимул (звук колокольчика) получил название условный стимул (УС). На рис. 7–1 можно видеть процесс классического обусловливания.
Рис. 7–1. Парадигма классического обусловливания по Павлову.
В более поздних трудах Павлов отмечал, что если он переставал давать пищу после звука колокольчика, у собаки в конце концов совсем прекращалось слюноотделение на этот звук. Этот процесс называется угасание и демонстрирует, что подкрепление (пища) значимо как для приобретения, так и для сохранения респондентного научения. Павлов также обнаружил, что если собаке дают длительный отдых в период угасания, то слюноотделение будет повторяться при звуке колокольчика. Это явление соответственно называется самопроизвольное восстановление.
Несмотря на то, что вначале Павлов проводил эксперименты на животных, другие исследователи начали изучать основные процессы классического обусловливания на людях. Эксперимент, который провели Уотсон и Рейнер (Watson, Rayner, 1920) иллюстрирует ключевую роль классического обусловливания в формировании таких эмоциональных реакций, как страх и тревога. Эти ученые обусловливали эмоциональную реакцию страха у 11–месячного мальчика, известного в анналах психологии под именем «Маленький Альберт». Как и многие дети, Альберт вначале не боялся живых белых крыс. К тому же его никогда не видели в состоянии страха или гнева. Методика эксперимента состояла в следующем: Альберту показывали прирученную белую крысу (УС) и одновременно за его спиной раздавался громкий удар в гонг (БС). После того, как крыса и звуковой сигнал были представлены семь раз, реакция сильного страха (УР) — плач и запрокидывание — наступала, когда ему только показывали животное. Через пять дней Уотсон и Рейнер показали Альберту другие предметы, напоминающие крысу тем, что они были белые и пушистые. Было обнаружено, что реакция страха у Альберта распространилась на множество стимулов, включая кролика, пальто из котикового меха, маску Деда Мороза и даже волосы экспериментатора. Большинство из этих обусловленных страхов все еще можно было наблюдать месяц спустя после первоначального обусловливания. К сожалению, Альберта выписали из больницы (где проводилось исследование) до того, как Уотсон и Рейнер смогли угасить у ребенка страхи, которые они обусловили. О «Маленьком Альберте» больше никогда не слышали. Позже многие резко критиковали авторов за то, что они не убедились в отсутствии у Альберта стойких болезненных последствий эксперимента. Хотя ретроспективно этот случай можно назвать жестоким, он действительно поясняет, как подобные страхи (боязнь незнакомых людей, зубных врачей и докторов) можно приобрести в процессе классического обусловливания.
<Многие детские страхи получаются в результате классического обусловливания.>
Респондентное поведение — это скиннеровская версия павловского, или классического обусловливания. Он также называл его обусловливанием типа С, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Напротив, он делал акцент на поведении, не связанном с какими — либо известными стимулами. Пример для иллюстрации: рассматривая поведение, вы непосредственно сейчас занимаетесь чтением. Определенно, это не рефлекс, и стимул, управляющий этим процессом (экзамены и оценки), не предшествует ему. Наоборот, в основном на ваше поведение чтения воздействуют стимульные события, которые наступят после него, а именно — его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким — то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Р, чтобы подчеркнуть воздействие реакции на будущее поведение.
Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени — это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.
Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления) обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.
И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Например, вы скоро перестанете улыбаться человеку, который в ответ на вашу улыбку всегда бросает на вас сердитый взгляд или вообще никогда не улыбается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их. Если человек постоянно угрюм, вы, вероятно, попытаетесь совсем избегать его. Подобным же образом, если вы паркуете свою машину в том месте, где есть надпись «Только для президента» и в результате на ветровом стекле машины находите штрафной талон, вы, несомненно, скоро прекратите парковаться там.
Для того, чтобы изучать оперантное поведение в лаборатории, Скиннер придумал на первый взгляд простую процедуру, названную свободным оперантным методом. Полуголодную крысу поместили в пустую «свободно — оперантную камеру» (известную как «ящик Скиннера»), где был только рычаг и миска для еды. Сначала крыса демонстрировала множество оперантов: ходила, принюхивалась, почесывалась, чистила себя и мочилась. Такие реакции не вызывались никаким узнаваемым стимулом; они были спонтанны. В конце концов, в ходе своей ознакомительной деятельности крыса нажимала на рычаг, тем самым получая шарик пищи, автоматически доставляемый в миску под рычагом. Так как реакция нажатия рычага первоначально имела низкую вероятность возникновения, ее следует считать чисто случайной по отношению к питанию; то есть мы не можем предсказать, когда крыса будет нажимать на рычаг, и не можем заставить ее делать это. Однако, лишая ее пищи, скажем, на 24 часа, мы можем убедиться, что реакция нажима рычага приобретет, в конце концов, высокую вероятность в такой особой ситуации. Это делается при помощи метода, называющегося научение через кормушку, посредством которого экспериментатор дает шарики пищи каждый раз, когда крыса нажимает на рычаг. Потом можно увидеть, что крыса проводит все больше времени рядом с рычагом и миской для пищи, а через соответствующий промежуток времени она начнет нажимать рычаг все быстрее и быстрее. Таким образом, нажатие рычага постепенно становится наиболее частой реакцией крысы на условие пищевой депривации. В ситуации оперантного научения поведение крысы является инструментальным, то есть оно действует на окружающую среду, порождая подкрепление (пищу). Если далее идут неподкрепляемые опыты, то есть если пища не появляется постоянно вслед за реакцией нажатия рычага, крыса, в конце концов, перестанет нажимать его, и произойдет экспериментальное угасание.
Теперь, когда мы познакомились с природой оперантного научения, будет полезно рассмотреть пример ситуации, встречающейся почти в каждой семье, где есть маленькие дети, а именно — оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей — выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием внимания, все же многие родители упорно подкрепляют последний.
Могут ли родители устранить обусловленное поведение плача или ребенку уготована судьба быть «плаксой» на всю жизнь? Уильямс (Williams, 1959) сообщает о случае, который показывает, как обусловленный плач был подавлен у 21–месячного ребенка. Из — за серьезного заболевания в течение первых 18 месяцев жизни ребенок получал повышенное внимание от своих обеспокоенных родителей. Фактически, из — за его крика и плача, когда он ложился спать, кто — то из родителей или тетя, жившая вместе с этой семьей, оставались в его спальне до тех пор, пока он не засыпал. Такое ночное бодрствование обычно занимало два — три часа. Оставаясь в комнате, пока он не засыпал, родители, несомненно, давали позитивное подкрепление поведению плача у ребенка. Он прекрасно контролировал своих родителей. Чтобы подавить это неприятное поведение, врачи велели родителям оставлять ребенка засыпать одного и не обращать никакого внимания на плач. Через семь ночей поведение плача фактически прекратилось. К десятой ночи ребенок даже улыбался, когда его родители уходили из комнаты, и можно было слышать его довольный лепет, когда он засыпал. Через неделю, однако, ребенок сразу начал кричать, когда тетя уложила его в постель и вышла из комнаты. Она возвратилась и осталась там, пока ребенок не заснул. Этого одного примера позитивного подкрепления было достаточно, чтобы стало необходимым во второй раз пройти через весь процесс угасания. К девятой ночи плач ребенка наконец прекратился, и Уильямс сообщил об отсутствии рецидивов в течение двух лет.
Режимы подкрепления
Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.
Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления — правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве ситуаций повседневной жизни, однако, это либо неосуществимо, либо неэкономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным. В большинстве случаев социальное поведение человека подкрепляется только иногда. Ребенок плачет неоднократно, прежде чем добьется внимания матери. Ученый много раз ошибается, прежде чем приходит к правильному решению трудной проблемы. В обоих этих примерах неподкрепленные реакции встречаются до тех пор, пока одна из них не будет подкреплена.
Скиннер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение. Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами: 1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления); 2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления). В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления.
1. Режим подкрепления с постоянным соотношением (ПС). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций. Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением. Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции. Режим ПС обычно устанавливает чрезвычайно высокий оперантный уровень, так как чем чаще организм реагирует, тем большее подкрепление он получает.
2. Режим подкрепления с постоянным интервалом (ПИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления. На уровне человека режим ПИ действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Подобно этому, еженедельная выдача денег ребенку на карманные расходы образует ПИ форму подкрепления. Университеты обычно работают в соответствии с временным режимом ПИ. Экзамены устанавливаются на регулярной основе и отчеты об академической успеваемости издаются в установленные сроки. Любопытно, что режим ПИ дает низкую скорость реагирования сразу после того, как получено подкрепление — феномен, названный паузой после подкрепления. Это показательно для студентов, испытывающих трудности при обучении в середине семестра (предполагается, что они сдали экзамен хорошо), так как следующий экзамен будет еще нескоро. Они буквально делают перерыв в обучении.
3. Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого — то в среднем предопределенного числа реакций. Возможно, наиболее драматической иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра. Рассмотрим действия человека, играющего в игральный автомат, где нужно опускать монетку или специальной рукояткой вытягивать приз. Эти аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит, чтобы управлять рукояткой. Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты. Далее, угасание поведения, приобретенного в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление. Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвет куш». Такая настойчивость типична для поведения, вызванного режимом ВС.
4. Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал. Подобно режиму ПИ, подкрепление при этом условии зависит от времени. Однако время между подкреплениями по режиму ВИ варьирует вокруг какой — то средней величины, а не является точно установленным. Как правило, скорость реагирования при режиме ВИ является прямой функцией примененной длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость. Также при подкреплении в режиме ВИ организм стремится установить постоянную скорость реагирования, и при отсутствии подкрепления реакции угасают медленно. В конечном итоге, организм не может точно предвидеть, когда будет следующее подкрепление.
В повседневной жизни режим ВИ нечасто встречается, хотя несколько его вариантов можно наблюдать. Родитель, например, может хвалить поведение ребенка довольно произвольно, рассчитывая, что ребенок будет продолжать вести себя соответствующим образом и в неподкрепленные интервалы времени. Подобно этому, профессора, которые дают «неожиданные» контрольные работы, частота которых варьирует от одной в три дня до одной в три недели, в среднем одна в две недели, используют режим ВИ. При этих условиях от студентов можно ожидать сохранения относительно высокого уровня прилежания, так как они никогда не знают, в какой момент будет следующая контрольная работа.
Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.
Условное подкрепление
Теоретики, занимающиеся научением, признавали два типа подкрепления — первичное и вторичное. Первичное подкрепление — это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей — это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения. Вторичное, или условное подкрепление, с другой стороны, — это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.
Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в «ящике Скиннера», сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал. Через какое — то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание. Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения). Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека. Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.
Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги — особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое — либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов — это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Внимание — простой случай. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель — и все это для привлечения внимания. Внимание значимого другого — родителей, учителя, возлюбленного — особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.
Еще более сильный генерализованный условный стимул — это социальное одобрение. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника. И женская, и мужская мода — это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение. Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей. Хорошие отметки в колледже — тоже позитивный подкрепляющий стимул, потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.
Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека (Skinner, 1971). Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы. Например, для кого — то очень сильным подкрепляющим стимулом является успех в качестве антрепренера; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны. Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.
Контроль поведения посредством аверсивных стимулов
С точки зрения Скиннера, в основном поведение человека контролируется аверсивными (неприятными или болевыми) стимулами. Два наиболее типичных метода аверсивного контроля — это наказание и негативное подкрепление. Эти термины часто используются как синонимы для описания концептуальных свойств и поведенческих эффектов аверсивного контроля. Скиннер предложил следующее определение: «Вы можете различать наказание, при котором происходит аверсивное событие, пропорциональное реакции, и негативное подкрепление, в котором подкреплением является устранение аверсивного стимула, условного или безусловного» (Evans, 1968, р. 33).
Наказание. Термин наказание относится к любому аверсивному стимулу или явлению, которое следует или которое зависит от появления какой — то оперантной реакции. Вместо того, чтобы усиливать реакцию, которую оно сопровождает, наказание уменьшает, по крайней мере временно, вероятность того, что реакция повторится. Предполагаемая цель наказания — побудить людей не вести себя данным образом. Скиннер (Skinner, 1983) заметил, что это наиболее общий метод контроля поведения в современной жизни.
По Скиннеру, наказание может быть осуществлено двумя различными способами, которые он называет позитивное наказание и негативное наказание (табл. 7–1). Позитивное наказание встречается всякий раз, когда поведение ведет к аверсивному исходу. Вот несколько примеров: если дети плохо себя ведут, их шлепают или бранят; если студенты пользуются шпаргалками на экзамене, их исключают из вуза или школы; если взрослых ловят на краже, их штрафуют или сажают в тюрьму. Негативное же наказание встречается всякий раз, когда за поведением следует устранение (возможного) позитивного подкрепляющего стимула. Например, детям запрещают смотреть телевизор из — за плохого поведения. Широко используемый подход к негативному наказанию — методика приостановки. В соответствии с этой методикой человека моментально удаляют из ситуации, в которой доступны определенные подкрепляющие стимулы. Например, непослушного ученика четвертого класса, мешающего занятиям, могут выгнать из кабинета.
<Физическая изоляция — это один из способов наказания с целью предотвратить проявления нежелательного поведения.>
Негативное подкрепление. В отличие от наказания, негативное подкрепление — это процесс, в котором организм ограничивает аверсивный стимул или избегает его. Любое поведение, которое препятствует аверсивному положению дел, таким образом чаще повторяется и является негативно подкрепленным (см. табл. 7–1). Поведение ухода — это тот самый случай. Скажем, человек, который прячется от палящего солнца, уходя в помещение, скорее всего снова пойдет туда, когда солнце вновь станет палящим. Следует заметить, что уход от аверсивного стимула не то же самое, что избегание его, поскольку аверсивный стимул, которого избегают, физически не представлен. Следовательно, другой способ бороться с неприятными условиями — научиться избегать их, то есть вести себя так, чтобы предотвратить их появление. Эта стратегия известна как научение избегания. Например, если учебный процесс позволяет ребенку избежать домашнего задания, негативное подкрепление используется для усиления интереса к обучению. Поведение избегания также имеет место, когда наркоманы разрабатывают искусные планы, с тем чтобы сохранить свои привычки, но не довести дело до аверсивных последствий — тюремного заключения.
Таблица 7–1. Позитивное и негативное подкрепление и наказание
Позитивное | Негативное | |
Подкрепление | Предъявление положительного стимула | Удаление аверсивного стимула |
Наказание | Предъявление аверсивного стимула | Удаление положительного стимула |
Как подкрепление, так и наказание могут выполняться двумя способами, это зависит от того, что следует за реакцией: предъявление или устранение приятного или неприятного стимула. Обратите внимание на то, что подкрепление усиливает реакцию; наказание — ослабляет ее.
Скиннер (Skinner, 1971, 1983) боролся с использованием всех форм контроля поведения, основанных на аверсивных стимулах. Он особо выделял наказание как неэффективное средство контроля поведения. Причина в том, что из — за своей угрожающей природы тактика наказания нежелательного поведения может вызвать отрицательные эмоциональные и социальные побочные эффекты. Тревога, страх, антисоциальные действия и потеря самоуважения и уверенности — это только некоторые возможные негативные побочные явления, связанные с использованием наказания. Угроза, внушаемая аверсивным контролем, может также подтолкнуть людей к моделям поведения даже более спорным, чем те, за которые их первоначально наказали. Рассмотрим, например, родителя, который наказывает ребенка за посредственную учебу. Позже, в отсутствии родителя, ребенок может вести себя еще хуже — прогуливать уроки, шататься по улицам, портить школьное имущество. Вне зависимости от исхода ясно, что наказание не принесло успеха в выработке желаемого поведения у ребенка. Так как наказание может временно подавлять нежелательное или неадекватное поведение, основным возражением Скиннера было то, что поведение, за которым последовало наказание, скорее всего вновь появится там, где отсутствует тот, кто может наказать. Ребенок, которого несколько раз наказали за сексуальную игру, совсем необязательно откажется от ее продолжения; человек, которого посадили в тюрьму за жестокое нападение, не обязательно будет меньше склонен к жестокости. Поведение, за которое наказали, может опять появиться после того, как исчезнет вероятность быть наказанным (Skinner, 1971, p. 62). Этому легко можно найти примеры в жизни. Ребенок, которого отшлепают за то, что он ругался в доме, может свободно это делать в другом месте. Водитель, оштрафованный за превышение скорости, может заплатить полицейскому и продолжать свободно превышать скорость, когда поблизости нет патруля с радаром.
Вместо аверсивного контроля поведения Скиннер (Skinner, 1978) рекомендовал позитивное подкрепление, как наиболее эффективный метод для устранения нежелательного поведения. Он доказывал, что, поскольку позитивные подкрепляющие стимулы не дают негативных побочных явлений, связанных с аверсивными стимулами, они более пригодны для формирования поведения человека. Например, осужденные преступники содержатся в невыносимых условиях во многих карательных учреждения (свидетельство тому — многочисленные тюремные бунты в Соединенных Штатах за последние несколько лет). Очевидно, что большинство попыток реабилитировать преступников провалились, это подтверждает высокий уровень рецидивов или повторных нарушений закона. Применив подход Скиннера, можно было бы так урегулировать условия окружения в тюрьме, чтобы поведение, напоминающее поведение законопослушных граждан, позитивно подкреплялось (например, научение навыкам социальной адаптации, ценностям, отношениям). Подобная реформа потребует привлечения экспертов по поведению, имеющих знания о принципах научения, личности и психопатологии. С точки зрения Скиннера, такую реформу можно было бы успешно выполнить, используя уже имеющиеся ресурсы и психологов, обученных методам бихевиоральной психологии
Скиннер показал возможности позитивного подкрепления, и это повлияло на стратегии поведения, используемые в воспитании детей, в образовании, бизнесе и промышленности. Во всех этих областях появилась тенденция к все большему поощрению желательного поведения, а не наказанию нежелательного.
Генерализация и различение стимулов
Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее. Если бы это было не так, то наш поведенческий набор был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула. Этот феномен легко наблюдать в повседневной жизни. Например, ребенок, которого похвалили за утонченные хорошие манеры дома, будет обобщать это поведение в соответствующих ситуациях и вне дома, такого ребенка не нужно учить, как прилично вести себя в новой ситуации. Обобщение стимула также может быть результатом неприятного жизненного опыта. Молодая женщина, изнасилованная незнакомцем, может генерализировать свой стыд и враждебность по отношению ко всем лицам противоположного пола, так как они напоминают ей о физической и эмоциональной травме, нанесенной незнакомцем. Подобно этому, единственного случая испуга или аверсивного опыта, причиной которого явился человек, принадлежащий к определенной этнической группе (белый, черный, латиноамериканец, азиат), может быть достаточно для индивида, чтобы создать стереотип и таким образом избежать будущих социальных контактов со всеми представителями данной группы.
Хотя способность обобщать реакции — важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях. Различение стимула, составная часть обобщения, — это процесс научения реагировать адекватным образом в различных ситуациях окружения. Примеров множество. Автомобилист остается в живых в час пик благодаря тому, что различает красный и зеленый цвета светофора. Ребенок учится различать домашнюю собачку и злобного пса. Подросток учится различать поведение, находящее одобрение у сверстников, и поведение, раздражающее и отчуждающее других. Диабетик сразу обучается различать пищу, содержащую много и мало сахара. В самом деле, практически все разумное поведение человека зависит от способности делать различение.
Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают нам возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях. Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений. Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.
Последовательное приближение: как заставить гору прийти к Магомету
Первые опыты Скиннера в области оперантного научения были сфокусированы на реакциях, обычно изъявляемых со средней или высокой частотой (например, клевок голубя по ключу, нажатие рычага крысой). Однако вскоре стало очевидным, что стандартная методика оперантного научения плохо подходила для большого числа сложных оперантных реакций, которые могли спонтанно встречаться с вероятностью, равной почти нулю. В сфере поведения человека, например, сомнительно, что с помощью общей стратегии оперантного научения можно было бы успешно научить пациентов психиатрического отделения приобретать соответствующие навыки межличностного общения. Для того, чтобы облегчить эту задачу, Скиннер (Skinner, 1953) придумал методику, при которой психологи могли эффективно и быстро уменьшить время, требуемое для обусловливания почти любого поведения в том наборе, которым располагал человек. Эта методика, названная методом успешного приближения, или формированием поведения, состоит из подкрепления поведения, наиболее близкого к желаемому оперантному поведению. К этому приближаются шаг за шагом, и поэтому одна реакция подкрепляется, а затем подменяется другой, более близкой к желаемому результату.
Скиннер установил, что процесс формирования поведения обусловливает развитие устной речи. Для него язык — это результат подкрепления высказываний ребенка, представленных первоначально вербальным общением с родителями, братьями и сестрами. Таким образом, начинаясь с довольно простых форм лепета в младенчестве, детское вербальное поведение постепенно развивается, пока не начинает напоминать язык взрослых. В «Вербальном поведении» Скиннер дает более подробное объяснение тому, как «законы языка», подобно любому другому поведению, постигаются с помощью тех же самых оперантных принципов (Skinner, 1957). И, как можно было ожидать, другие исследователи поставили под сомнение утверждение Скиннера, что язык — это просто продукт вербальных высказываний, выборочно подкрепленных в течение первых лет жизни. Ноэм Хомский (Chomsky, 1972), один из наиболее строгих критиков Скиннера, утверждает, что большую скорость усвоения вербальных навыков в раннем детстве никак нельзя объяснить в терминах оперантного научения. С точки зрения Хомского, особенности, которыми обладает мозг при рождении, являются причиной того, что ребенок приобретает язык. Другими словами, существует врожденная способность усваивать сложные правила разговорного общения.
Мы закончили краткий обзор научающе — бихевиорального направления Скиннера. Как мы увидели, Скиннер не считал необходимым рассматривать внутренние силы или мотивационные состояния человека в качестве причинного фактора поведения. Скорее он сосредотачивался на взаимоотношениях между определенными явлениями окружения и открытым поведением. Далее, он придерживался мнения, что личность — это не что иное как определенные формы поведения, которые приобретаются посредством оперантного научения. Добавляют что — то эти рассуждения к всеобъемлющей теории личности или нет, но Скиннер имел глубокое влияние на наши представления о проблемах научения человека. Философские положения, лежащие в основе системы взглядов Скиннера на человека, четко отделяют его от большинства персонологов, с которыми мы уже познакомились.
Основные положения Скиннера относительно природы человека
Так как Скиннер отрицал интрапсихическое объяснение поведения, его концепция человека радикально отличается от концепций большинства персонологов. Кроме того, его основные положения о человеческой природе четки и определенны. Позиция Скиннера, касающаяся этих положений, показана на рис. 7–2.
Сильная | Умерен — ная | Слабая | Средняя | Слабая | Умерен — ная | Сильная | ||
Свобода | + | Детерминизм | ||||||
Рациональность | Не применимо | Иррациональность | ||||||
Холизм | + | Элементализм | ||||||
Конституционализм | + | Инвайронментализм | ||||||
Изменяемость | + | Неизменность | ||||||
Субъективность | + | Объективность | ||||||
Проактивность | + | Реактивность | ||||||
Гомеостаз | Не применимо | Гетеростаз | ||||||
Познаваемость | + | Непознаваемость |
Рис. 7–2. Позиция Скиннера по девяти основным положениям, касающимся природы человека.
Свобода — детерминизм. По Скиннеру, мы, люди, абсолютно зависимы от нашего прошлого опыта. Более точно, наше поведение есть продукт предшествующих подкреплений, мы делаем то, что уже было подкреплено в прошлом. Индивидуальные различия в поведении происходят исключительно в результате различного прошлого подкрепления, так как свобода в принципе не допускается в экспериментальном анализе поведения. Фактически Скиннер утверждал, что детерминистское положение является абсолютной необходимостью для науки о поведении человека: «Если мы хотим использовать методы науки в сфере изучения человека, мы обязаны предположить, что поведение закономерно и обусловлено» (Skinner, 1953, р. 6).
В системе Скиннера ребенок обладает бесконечным числом возможностей для усвоения поведения. Именно родители первыми подкрепляют и таким образом формируют развитие в определенных направлениях, ребенок будет вести себя соответственно их поощрениям. Поведение, после которого устойчиво отсутствует подкрепление, не будет прочным. Постепенно, по мере развития, поведение ребенка принимает такие формы, которые напрямую зависят от постоянного опыта научения. В более традиционных, «нескиннеровских» терминах — возникает «личность» ребенка.
По мере того как социальный мир ребенка расширяется, существенное влияние на формирование поведения приобретают другие источники подкрепления. Школа, занятия спортом, мнение подростков становятся особенно важными и обычными источниками подкрепления. Принцип бихевиоральной детерминации посредством подкрепления остается тем же самым — меняются только виды и источники подкрепления. Тип подкреплений, относящийся к сексу и карьере, появляется позже. Став взрослым, человек ведет себя в соответствии со своим прошлым уникальным научением; можно предположить, что поведение индивида изменится только вследствие применения соответствующего подкрепления. В процессе развития ранее подкреплявшееся поведение выпадает из репертуара в результате либо неподкрепления, либо наказания, исходящего из актуального социального окружения. Короче, никто не имеет свободы выбора собственного поведения — напротив, поведение формируется исключительно внешними подкреплениями.
Рациональность — иррациональность. Скиннер рассматривал организм человека как «черный ящик». То, что в ящике могут протекать рациональные и/или иррациональные процессы, может быть интересной гипотезой — но ни та, ни другая возможности не имеют ничего общего с объяснением поведения человека. Наоборот, поведение является только функцией его последствий или правомерных отношений стимул — реакция. То, что поступает в ящик, то, что выходит из ящика, и то, что следует за этим — суть единственные релевантные переменные, необходимые в анализе поведения, а не то, что может или не может происходить внутри. Принципы поведения, раскрываемые средствами этого функционального подхода, в равной степени применимы к крысам, голубям и человеку; рассуждения о высоко организованных процессах рационального мышления последнего просто не релевантны для объяснения причинной обусловленности поведения. Так как обе крайности континуума рациональность — иррациональность относятся к гипотетическим внутренним процессам, которые лежат в основе поведения, это положение не играет важной роли в размышлениях Скиннера. Оно просто неприменимо к его позиции.
Холизм — элементализм. Скиннер рассматривал «личность» только как набор форм поведения, которые характерны для данного человека. Эти формы поведения могут быть в дальнейшем редуцированы до специфических реакций — всех, которые приобретены посредством научения. Следовательно, личность индивида состоит из относительно сложных, но тем не менее независимо приобретенных реакций. Чтобы понять поведение, нам нужно только понять опыт прошлого научения человека. В системе Скиннера поведение состоит из специфических элементов (оперантных реакций).
Приверженность элементализму также проявляется в подходе Скиннера к изучению поведения. Он методически изучал условия, при которых отдельные реакции приобретаются и модифицируются (например, крысы, нажимающие рычаг, голуби, клюющие диск). Единицей анализа в экспериментальной работе Скиннера является отдельная реакция. В основе такого подхода, несомненно, находится положение элементализма, из которого вытекает, что поведение можно понять только при детальном анализе составляющих его частей.
С точки зрения Скиннера, личностные различия — это просто — напросто то, что бросается в глаза, то есть индивидуальные различия в поведении. Каждая личность строится во времени — элемент за элементом — и люди отличаются друг от друга только потому, что опыт их прошлого научения разный. Эта элементалистская точка зрения резко отличается от холистических концепций, которые описывают уникальность индивида в терминах некоего единого унифицированного и синкретического фактора, лежащего в основе поведения человека. В противовес гештальт — психологам, Скиннер полагал, что целое — это сумма его частей.
Конституционализм — инвайронментализм. Тот факт, что Скиннер посвятил свою профессиональную жизнь изучению модификации поведения под воздействием окружения, ясно показывает его искреннюю приверженность инвайронментализму. Хотя он признавал, что конституциональные факторы ограничивают человека, он пренебрегал ими при объяснении поведения. С точки зрения Скиннера, человек в высшей степени зависит от непостоянства окружения; характерные способы, с помощью которых он обучается поведению (личность), проистекают исключительно из ситуационно обоснованных возможностей подкрепления (научение). Акцент Скиннера на инвайронментализме неоспорим.
Объясняя, как люди отличаются друг от друга, Скиннер обошел роль конституциональных изменений. Следуя примеру более ранних бихевиористов (например, Уотсона), он полагал, что различие среды является основной причиной индивидуальных различий. Он утверждал: «Переменные, функцией которых является поведение человека, лежат в окружении» (Skinner, 1976, р. 1). Таким образом, Дженни и Сьюзан отличаются друг от друга не благодаря своим уникальным генетическим особенностям, а, в основном, из — за различного окружения, в котором они находились. Если бы их окружение поменять местами при их рождении, то их личности в возрасте 20 лет также поменялись бы.
Изменяемость — неизменность. В утверждениях Скиннера нет двусмысленности: он был строгим приверженцем точки зрения, что поведение человека может меняться в течение жизни. Он не соглашался с большинством психологов — эволюционистов в том, какие условия и факторы провоцируют изменение поведения. «Психологический рост — это не свободно протекающий процесс, проявляющийся у индивида» (АРА Monitor, 1977, р. 6). По Скиннеру, в течение жизни поведение людей может меняться под воздействием меняющегося окружения — так как подкрепляющие особенности в окружении разные, то под их прямым контролем формируется разное поведение. В отличие от теоретиков, пропагандировавших возрастные стадии, например, Эриксона, Скиннер объяснял жизненные кризисы изменением окружения, ставящим индивида в ситуацию, когда его набор поведенческих реакций оказывается неадекватным для получения подкрепления в новой ситуации. С этой точки зрения, возрастные перемены отражают изменения вероятности получения подкреплений в течение жизни.
Несмотря на разницу во взглядах с теоретиками, пропагандировавшими возрастные стадии, Скиннер разделял их акцент на бихевиоральных изменениях. Но, сообразно с остальными его воззрениями, он рассматривал изменения поведения как результат изменений окружения. Как мы неоднократно отмечали, центральным положением бихевиорально — научающей теории является изучение тех явлений, которые порождают изменения в поведении. Таким образом, оказывается, что приверженность Скиннера положению изменчивости очень сильна и лежит в основе всей его научной работы.
Субъективность — объективность. Точка зрения Скиннера на организм как на закрытый ящик предполагает несомненную приверженность положению объективности. Нам не нужно заглядывать в ящик, чтобы объяснить наблюдаемое поведение. Сообразно с теорией бихевиоризма, Скиннер доказывал, что деятельность человека можно объяснить только с позиций объективных отношений стимул — реакция. Происходит ввод информации, далее следует результат, а то, что происходит или не происходит потом (подкрепление), определяет вероятность повторения подобной реакции вслед за подобным вводом информации в будущем. Размышления или чувства человека по поводу входящих стимулов или исходящих реакций не важны при объяснении его поведения. Как писал Скиннер: «Познавательные процессы есть поведенческие процессы; это то, что делают люди» (Skinner, 1989, р. 17).
Субъективный опыт не всегда неуместен в системе Скиннера, но ссылки на него являются основным источником недоразумений в понимании причин наших действий. Он полагал, что гипотетический базис, используемый всеми другими персонологами (например, «эго» у Фрейда, «архетип» у Юнга, «кризис самоопределения» у Эриксона), просто запутывает объяснение поведения. Эти менталистические концепции — поясняющая выдумка, наложенная на реальные внешние причины, заставляющие человека действовать. И наиболее значительной из этих выдумок является сама концепция личности! Поскольку его система позволяет описать и объяснить и схожесть, и различие между индивидами (так же, как все другие теории личности), Скиннер выполнил эти задачи без какой — либо ссылки на «личность». Объективность является крайне важным положением, лежащим в основе системы Скиннера; он довел более раннее уотсоновское отрицание «разума» до логического конца.
Проактивность — реактивность. В описании Скиннером поведения человека в терминах стимул — реакция — подкрепление подчеркивается основополагающее положение реактивности. Реактивность наиболее ясно просматривается в классическом обусловливании, где реакции автоматически запускаются стимулами, непосредственно предшествующими им во времени. Собаки Павлова реагируют (выделяют слюну) на звук колокольчика; люди реагируют почти также на вид и запах рождественской индейки.
Но и в оперантном научении можно ясно увидеть положение реактивности. Оказывается, до тех пор, пока реакции организма не изъявляются «свободно», нельзя предположить, что они проактивно обоснованы. Конечно, когда крыса в «ящике Скиннера» нажимает рычаг, это не свидетельствует о ее внутреннем стремлении выстраивать ориентированное на будущее поведение. Оказывается, оперантные реакции предполагают в большей степени «активную», нежели «проактивную» природу организма. Какой — то стимул, каким бы трудноуловимым он ни был, вызывает все действия индивида, причем большинство этих начальных стимулов — внешние. Тщательное изучение показывает, что люди в системе Скиннера абсолютно реактивны.
Гомеостаз — гетеростаз. Каждая из двух полярных точек этого континуума относится к природе и свойствам внутренних мотивационных состояний, которые, вероятно, являются причиной поведения. Человек действует, чтобы уменьшить внутреннее напряжение или для личностного роста и самоактуализации. По Скиннеру, не нужно размышлять о свойствах таких гипотетических внутренних состояний, потому что они не имеют отношения к объяснению поведения. Только внешние факторы несут ответственность за поведение. Интересоваться природой мотивов — все равно, что интересоваться, какая энергия внутри дерева заставляет его ветви переплетаться на ветру. Скиннер не признавал этого положения — и гомеостаз, и гетеростаз являются понятиями, неприменимыми в его системе.
Как же тогда Скиннер объяснял целенаправленное поведение? Что заставляет поведение человека меняться, в то время как окружение остается относительно постоянным? Чтобы получить ответы на эти вопросы, Скиннер попросил бы вас изучить свое собственное поведение. Для примера предположим, что вы добровольно приняли участие в исследовании, посвященном питанию, и вас лишили пищи на 48 часов. Если вы похожи на большинство людей, то по завершении исследования вы броситесь домой и съедите все, что попадется. «Менталистический» теоретик, без сомнения, объяснит ваше поведение мотивом голода. Для Скиннера, однако, термин «голод» не имеет смысла, он ничего не обозначает, кроме того, что устанавливает взаимоотношения между группой внешних стимулов и наблюдаемыми реакциями. Голод — просто подходящее слово для описания связи определенных объективный действий (лишение пищи) и появлением определенных реакций (увеличение потребления пищи). Голод как возможное мотивационное состояние не побуждает поведение; обстоятельства, относящиеся к окружению, служат ему причиной. Скиннер не признавал как сами собой разумеющиеся особые свойства (гомеостатические или гетеростатические) таких мотивов.
Познаваемость — непознаваемость. То, что Скиннер строго придерживался положения о детерминизме и объективности, логически требует столь же сильной приверженности положению познаваемости. Он настаивал на том, что поведение определяется внешними, объективными факторами, что эти факторы можно выделить с помощью соответствующим образом поставленного эксперимента и что, следовательно, все поведение (природа) человека, в конечном счете, познаваемо научными методами.
Хотя изучать поведение трудно, Скиннер утверждал, что наука все же может это делать, только исследователям нужно избавиться от мифологического представления, что люди свободны и что существуют внутренние факторы, ответственные за их действия. В сущности, основные положения о природе человека, принимаемые многими учеными, препятствуют им изучать поведение. Чтобы успешно применять научную методологию к человеку, необходимо рассматривать людей как объективно детерминированных. Иначе говоря, Скиннер полагал, что истинная наука о поведении появится только в том случае, если другие психологи примут его специфические основные положения о природе человека.
Теперь давайте рассмотрим некоторые эмпирические исследования, иллюстрирующие эту в высшей степени интересную точку зрения.