Глава 11 Бихевиоризм: после основания

Б. Ф. Скиннер (1904–1990)


...

Схема подкрепления

Уже первые исследования в <скиннеровском ящике> с нажатием рычага продемонстрировали значение подкрепления для оперантного поведения. В этой ситуации поведение крысы при каждом нажатии на рычаг получало подкрепление. То есть всякий раз, выполнив правильное действие, крыса получала пищу. Скиннер отмечал, что хотя в реальной жизни подкрепление далеко не всегда бывает последовательным или непрерывным, тем не менее, научение все — таки происходит и поведение сохраняется, даже если подкрепление было случайным или редким.

Не всегда, отправляясь кататься на коньках или на лыжах, мы попадаем на хороший лед или снег… Не всегда, приходя в ресторан, мы получаем хорошую пишу. потому что повара непредсказуемы. Звоня друзьям по телефону. мы не всегда получаем ответ, потому что друзья могут отсутствовать. …Подкрепляющие характеристики деятельности и обучения почти всегда являются прерывистыми. так как просто не имеет смысла контролировать подкреплением каждую реакцию. (Skinner. 1953. P. 99.)

Даже если вы проводите исследования постоянно, вы не при каждом эксперименте получаете реакцию А. На работе вас не каждый день хвалят и не каждый день повышают заработную плату. Каким образом на поведении сказывается такое непостоянное подкрепление? Является ли та или иной режим подкрепления94 лучшим, чем остальные, с точки зрения ее воздействия на поведение? Скиннер и его коллеги посвятили годы исследованию этих вопросов (Ferster & Skinner 1857; Skinner.1969).


94 режимы подкрепления — условия, развивающиеся степенью и временем подкрепления.


Потребность в этих исследованиях возникла не из — за чисто научного любопытства, но на основе практической целесообразности — что, кстати, иллюстрирует тот факт, что наука нередко существенно отличается от той идеализированной модели, которая представляется в некоторых учебниках. Как — то раз в субботу вечером Скиннер обнаружил, что у него почти закончился запас корма. В то время (тридцатые годы) еще нельзя было купить корм у специальных компаний по снабжению исследовательских лабораторий; экспериментатор должен был делать шарики вручную, что являлось достаточно длительным и трудоемким процессом.

Вместо того, чтобы потратить свои выходные на изготовление кормовых шариков, Скиннер задал себе вопрос: что произойдет, если он будет давать подкрепление своим крысам один раз в минуту, независимо от того, какое будет количество ответных реакций? При таком подходе ему потребуется намного меньше корма, и на выходные дни должно хватить. Скиннер решил провести длительную серию экспериментов, чтобы проверить различные варианты системы подкреплений.

В одном таком исследовании Скиннер сравнил частоту реакции у животных, которые получали подкрепление при каждой реакции, с частотой реакций тех животных, которые получали подкрепление только по истечении некоторого интервала времени. Последнее условие получило название схемы подкрепления с фиксированным интервалом. Подкрепление могло выдаваться, например, один раз в минуту или каждые четыре минуты. Важным моментом в данном случае является то, что подопытное животное получало подкрепление только по истечении определенного отрезка времени. (Например, работа, когда деньги выплачиваются раз в неделю или раз в месяц, представляет собой схему подкрепления с фиксированным интервалом; работники получают заработную плату не за количество произведенной продукции — то есть не за количество обусловленных реакций — а за количество прошедших дней недели.) Исследование Скиннера показало, что чем короче интервал между подкреплениями, тем чаще животное проявляет обусловленную реакцию. И наоборот, по мере того, как увеличивается интервал между подкреплениями, частота реакции снижается.

Частота подкрепления также оказывает влияние на угасание условной реакции. Проявление условной реакции угасает с большей скоростью, если имело место непрерывное подкрепление, которое затем резко было прекращено, чем в том случае, когда подкрепление выдавалось с перерывами. Некоторые голуби демонстрировали до десяти тысяч реакций без подкрепления, если исходно у них был сформирован условный рефлекс па основе периодичного, прерывистого подкрепления.

Психология bookap

Скиннер исследовал также схему подкрепления с фиксированной частотой. В этом случае подкрепление выдается не по истечении определенного отрезка времени, а после выполнения определенного количества условных реакций. Само поведение животного определяет, насколько часто будет выдаваться подкрепление. Например, требуется совершить десять или двадцать обусловленных ответных реакций, чтобы получить новое подкрепление. Животные, получающие поощрение по схеме с фиксированной частотой, реагируют намного интенсивнее, чем те, которые получают подкрепление по схеме с фиксированным интервалом. Ведь очевидно, что высокая частота реагирования при схеме с фиксированным интервалом не приводит к получению дополнительного подкрепления; животное может нажать на рычаг пять раз или пятьдесят, но подкрепление появится только тогда, когда истечет заданный отрезок времени.

Самые высокие показатели реагирования при схеме подкрепления с фиксированной частотой наблюдались и у крыс, и у голубей, и у людей. Пример тому: сдельная оплата труда, когда заработок работника на его рабочем месте зависит от количества произведенной продукции, а комиссионные зависят от количества продаж. Правда, такая схема подкрепления успешно работает только тогда, когда требуемый уровень обусловленной реакции не слишком высок (так, нормы дневной выработки должны быть реальными) и если ожидаемое подкрепление стоит затраченных усилий.