ПРЕДИСЛОВИЕ

...

СТРУКТУРЫ основных типов

ПРИСПОСОБИТЕЛЬНОГО ПОВЕДЕНИЙ (продолжение)

2. СТРУКТУРА НАВЫКОВ

Теперь попробуем разобраться в механизме обучаемого поведения или навыков.

Основным звеном, из которого вырастает обучаемое поведение, является механизм условных рефлексов. Что это такое?

Рассказывают, что одна собака объясняла это другой в институте физиологии следующим образом: «Смотри, я сейчас нажму на этот звонок, и тогда вот тот чудак в белом халате прибежит и принесет мне кушать. Вот это и называется условный рефлекс».

Это, конечно, шутка. Но сама обстановка, в которой изучают условные рефлексы, здесь довольно точно передана.

Мысль о таком типе рефлексов возникла у Павлова в связи с его исследованиями деятельности желудка и различных желез пищеварения — поджелудочной железы, слюнной и др. В ходе экспериментов он обратил внимание на одну странную деталь. Слюна у собак выделялась не только когда пища попадала им в рот, но и от одного вида пища. А иногда, стоило собаке услышать шаги служителя, который ее должен накормить, и у нее уже начинала капать слюна.

На первый взгляд — чего же здесь странного? Собака по опыту «знает», что служитель идет, чтобы ее покормить. Вот у нее и «потекли» слюнки. Тысячи людей, замечавших этот факт, так его и объясняли и проходили мимо.

Но ведь, если вдуматься, то это никакое вовсе не объяснение, а просто слова, лишенные предметного содержания.

Действительно, откуда мы знаем, что собака что-то «знает»? И вообще, что это означает — «знает»?

Вот эти «детские» вопросы, на которые способен отважиться только гений, поставил И.П. Павлов. И отыскивая ответы на них, он открыл целую новую область науки — физиологию высшей нервной деятельности.

Итак, проанализируем поведение собаки. Во-пер-вых, ясно, что в основе его лежит безусловный рефлекс. Пища во рту вызывает возбуждение в мозгу, которое в свою очередь вызывает слюноотделение. Механизм этого процесса вам уже знаком. Это — безусловный рефлекс, потому что связь между ощущением, получаемым от пищи, положенной на язык, и между командой к выделению слюны является врожденной. Это доказывается тем, что едва щенок родился, как только ему в рот попадает молоко матери, сейчас же у него начинает выделяться слюна. Он этому не учится — рефлекс врожденный.

Теперь предложим, что обстановка усложняется. Не будем гонять каждый раз служителя, чтобы наблюдать, как собака реагирует на его шаги. Возьмем искусственный сигнал. Например, давая собаке пищу, одновременно будем зажигать лампочку. Достаточно 10-12 повторений, чтобы одна вспышка лампочки вызывала у собаки бурную пищевую реакцию. У нее начинает течь слюна, она бросается к лампочке, виляет хвостом, пытается облизнуть лампочку и даже схватить ее в рот, т.е. обращается с лампочкой так, как если бы это был кусок мяса. Иначе говоря, возбуждение от вспышки лампочки, возникшее в зрительном поле, каким-то образом связалось с раздражением от пищи.

Имелась ли у собаки такая врожденная связь? Нет, до опыта собака не реагировала на те же вспышки пищевым поведением.

Значит, эта связь возникла, создалась, замкнулась в ходе эксперимента. Она была приобретена благодаря многократному совпадению во времени зажигания лампочки с последующим появлением пищи. Поэтому такую связь называют «временной связью» в отличие от врожденной. Пищу в данном случае называют подкреплением или безусловным раздражителем. Вспышку лампочки называют сигналом или условным раздражителем.

Весь же этот механизм замыкания временных связей именуют условным рефлексом.

Почему условным? Потому что он не врожден, а возникает лишь при определенных условиях. А именно, когда подкрепление достаточно быстро следует за условным раздражителем, причем безусловный раздражитель сильнее условного.

Величина самого условного рефлекса в определенных пределах зависит от силы условного раздражителя, но в целом он все же всегда слабея соответствующего безусловного рефлекса.

Как показали многочисленные опыты, условные рефлексы могут быть выработаны с любых органов чувств, т.е. на любые ощущения — зрительные, вкусовые, обонятельные, слуховые, кожные, мышечные, с желудка, мочевого пузыря, кишечника и т.д.

В зависимости от безусловного рефлекса, который лежит в их основе, они могут быть пищевыми, половыми, обонятельными, ориентировочными и т.д.

Условный рефлекс, который мы с вами рассмотрели, является искусственным. Он создан в лаборатории с помощью специальных приборов и условий. В жизни для животного сигналами становятся естественные свойства соответствующих безусловных раздражителей: запах пищи, рычание хищника и т.п. Эти сигналы, связавшись через безусловные рефлексы с врожденными реакциями на соответствующие раздражители, начинают управлять поведением животного.

Таким образом, в условном рефлексе мы имеем механизм, с помощью которого «связи вещей» отражаются в связях между состояниями и действиями организма.

Вы спросите: ну и что такого? Все и так знают, что когда подумаешь о еде — слюнки текут или, когда вспомнишь о былой любви — грусть набегает. Так что ж тут открыл Павлов такого выдающегося?

Павлов открыл действительно замечательную сторону этого дела. Если, когда мы думаем о пище, у нас текут слюнки, то, что мы думаем, наблюдать невозможно, а вот что текут слюнки — наблюдать можно. Значит, если мы нашли связь между внутренними психофизиологическими процессами и внешней реакцией, можно через эти наблюдаемые проявления проникнуть в то, что происходит в голове. Мы получаем метод, как от внешнего наблюдаемого поведения проникать к тому, что происходит в мозгу животного или человека.

Используя этот метод, Павлову удалось выяснить существенные свойства и закономерности механизма обучаемого поведения.

Первое явление, которое он обнаружил, иллюстрируется следующим экспериментом. Вырабатываем условный рефлекс на красный свет, такой прочный, что собака относится к красной лампочке прямо, как к куску мяса. А теперь изменим условия эксперимента — зажжем зеленый свет.

Как вы думается, что произойдет?

Оказывается, собака и на зеленую лампочку бросается.

Эту закономерность Павлов назвал генерализацией эффекта. Она заключается в том, что условный рефлекс сначала обобщается, распространяется на все похожие стимулы. Эта генерализация может распространиться очень широко, вплоть до того, например, что собака, у которой вырабатывают условный рефлекс на стук, начинает реагировать на любой громкий звук тем же рефлексом. Правда, чем менее похож стимул на исходный, тем слабее будет реакция. Например, если условным раздражителем служила красная лампочка, то на зеленую реакция будет довольно сильной, на синюю лампочку — слабее, на тускло синюю — совсем будет слабенькой.

Вот это ослабление рефлекса по мере возрастания несходства стимулов называют градиентом генерализации. (Градиент — означает показатели падения напряжения, напряженности поля).

Градиент генерализации позволяет проанализировать степень сходства различных раздражителей для собаки. Если у нее, например, на красную лампочку выделяется 30 капель слюны в течение минуты, на зеленую — 20 капель слюны, на синюю — 10 капель слюны, на тускло синюю лампочку — 1 капля слюны, то это количество слюны как бы объективно нам говорит: для собаки зеленая лампочка больше похожа на красную, синяя — меньше похожа, а тускло синяя — совсем на нее мало похожа. Т.е. мы проникаем как бы даже в такую невидимую область, как ощущения сходства для собаки.

Как видите, мы извлекли уже куда больше, чем простую истину, что «голодной куме все хлеб на уме», «вспомнил пищу — слюнки текут» и т.п.

Теперь усложним наш эксперимент. Каждый раз, когда зажжена красная лампочка, мы подкрепляем рефлекс, т.е. даем собаке пищу. А каждый раз, когда зажигается зеленая лампочка, мы не подкрепляем рефлекс, т.е. ничего ей не даем. Или, того хуже, она получает удар электрическим током. После нескольких повторений собака реагирует слюновыделением уже только на красную лампочку. На зеленую она никак не реагирует, или если ее зажигание сопровождали ударом тока, рвется, визжит и пытается убежать, когда эта лампочка загорается. Значит у собаки возникло различение между этими двумя похожими стимулами. По-латински, «различать» — дифференцировать, и это второе явление, соответственно, И.П. Павлов назвал дифференцировкой.

С помощью дифференцировки условных рефлексов можно получать ответы на весьма сложные вопросы психической деятельности животных.

Например, мы хотим узнать, различает пчела зеленый и желтый цвет или не различает. Как об этом спросишь пчелу? Мы ставим две чашечки: в зеленой, например, мед, а в желтой — обыкновенная вода. Пчелы, конечно, садятся на чашечку с медом. Через некоторое время изменяют ситуацию. Теперь в желтую чашечку, где была вода, наливаем меду, а в зеленую — воду. Пчела все равно летит на зеленую чашечку, где когда-то был мед. Значит, она различает эти цвета.

Можно еще сложнее вопрос задать. Например, умеет ли собака считать до трех. Как ее спросить? Очень просто. Даем собаке пищу только, когда горят одновременно три лампочки, а когда горят две, одна, четыре — не даем. Если после ряда повторений собака начинает реагировать выделением слюны только на три лампочки, горящих одновременно, значит, до трех она «считать» умеет. (Разумеется, зажигать разное число лампочек надо в случайном порядке, чтобы рефлекс выработался именно на число, а не порядок зажигания.)

Как видите, метод дифференцировки позволяет заглядывать в самые глубинные свойства психики животных.

Наконец, третье свойство механизма условных рефлексов, которое открыл И.П. Павлов, заключается в следующем. Предположим, у собаки выработали прочный условный рефлекс на красную лампочку и четко его отдифференцировали. Она сразу и однозначно «узнает» красную лампу, энергично выделяет слюну, машет хвостом и вообще «ждет», что ее сейчас покормят. А теперь мы начинаем бедную собаку «обманывать»: мы зажигаем раз за разом красную лампочку, но кормежки ей не даем.

Что происходит?

Чем чаще мы «обманываем», т.е. чем чаще не подкрепляем условный раздражитель, тем слабее становится рефлекс. Например, на втором «пустом» зажигании лампочки выделяются те же 15 капель слюны, на 10-м «пустом» зажигании — только 5 капель, на 20-м — уже ни одной капли, т.е. собака вообще не реагирует.

Такой процесс Павлов назвал угасанием условного рефлекса. Это и есть третье его основное свойство —не подкрепляемый условный рефлекс угасает.

Это очень существенное и полезное свойство. Ведь важно не только научиться правильному действию, но и отучаться от него, когда оно перестает давать эффект, теряет свою целесообразность.

Чем вызвано это угасание условного рефлекса? Вы, наверное, скажете: очень просто, связь не подкрепляется, вот она и разрушается, распадается, примерно так, как разрушится любой механизм, если его не ремонтировать, т.е. не восстанавливать вовремя.

В том-то и дело, что нет. Оказывается, сама связь сохраняется. Вот мы 30 раз подряд «обманули» собаку. Она на красную лампочку уже не обращает внимания. Но через недельку попробуем снова зажечь красную лампочку и что такое — собака опять к ней тянется и выделяет слюну!

Значит, связь-то у нее в мозгу осталась. Она еще многие и многие месяцы сохраняется, иногда многие годы. Иногда, дрессированных животных списывают по старости «на покой», и вот, известны случаи, когда такой бывший четвероногий артист через многие годы под влиянием подходящего стимула вдруг начинает выкидывать разные фокусы, которые когда-то показывал в цирке, т.е. образованные у него временные связи сохраняются многие годы.

Почему же не работают эти связи, не проявляются при угасании условного рефлекса, если они есть? Объяснить это можно только тем, что при неподкреп-лении в мозгу возникает какой-то особый процесс, который тормозит изнутри реализацию этой связи, не пускает ее срабатывать, поскольку обнаружилось, что она «не годится» в данных условиях.

Вот этот активный процесс временного подавления временной связи Павлов назвал торможением. Его следует отличать от процесса забывания. Забывание — это распад связей, вызванный органическими или функциональными причинами. Это — пассивный процесс. Ведь связь, которой нет, ее и тормозить нечего. А торможение — процесс активный. Он направлен на предупреждение срабатывания имеющихся связей.

Итак, мы видим, что механизм условных рефлексов обеспечивает не просто отражение действительности, а выделение определенных ее свойств (через диффе-ренцировку), их обобщение (через генерализацию), наконец, оценку их значимости для животного (через торможение неподкрепляемых связей), т.е. осуществляет анализ и синтез информации, поступающей из внешнего мира, с точки зрения ее значения для выработки приспособительных реакций организма.

Некоторые ученые считали, что все поведение животных и даже человека представляет собой цепи и сочетания таких условных рефлексов, плюс, разумеется, врожденные инстинктивные действия. Например, другой выдающийся русский физиолог В.М. Бехтерев изучал образование двигательного поведения у животных. Он с козлами работал, не с собаками. Козла ставили в станок и закрепляли, зажигалась лампочка и одновременно он получал в одну ногу удар током. Козел, естественно, отдергивал ногу. После нескольких повторений, стоило только зажечь лампочку, как козел отдергивал ногу. Нетрудно заметить, что здесь имеет место все тот же знакомый нам механизм образования условного рефлекса. (Бехтерев назвал его «сочетательным».) Он полностью подчиняется описанным выше законам. Например, тем же процессам генерализации, а потом дифференцировки. Сначала, как только зажигается лампочка, животное начинает метаться, рваться, блеять, дергаться, чтобы спастись. Уже после 15—20 повторений все эти хаотические движения, все это волнение исчезает. Стоит зажечься лампочке, как козел элегантно поднимает ногу и потом спокойно опускает. Вся избыточная активность тормозится, отсеивается. Так, например, цыгане учили медведей когда-то «плясать». Медведя, привязывая цепью, ставили на железный лист, установленный на нескольких кирпичах. Под листом разводили костер. Лист раскалялся, и одновременно дрессировщик играл на скрипке. Естественно, чем горячей медведю подпаливало пятки, тем он энергичнее прыгал. После нескольких десятков повторений достаточно было заиграть скрипке, чтобы медведь начинал прыгать, подчиняясь образовавшемуся рефлексу, а отнюдь не из любви к музыке.

В.М. Бехтерев полагал, что все формы поведения, усваиваемые в течение жизни животными и людьми, могут быть объяснены такого рода «сочетательными» двигательными рефлексами.

Однако, это не так. Если присмотреться, то можно обнаружить, что описанный тип условных рефлексов (иногда его называют «классическим») не объясняет многое даже в обучаемом поведении животных.

Ну что ж, посмотрим, что новое может усвоить животное с помощью этого типа условных рефлексов?

Возьмем классические опыты И.П. Павлова. У собаки выделяется слюна при зажигании лампочки. До выработки рефлекса такой реакции не наблюдалось. Значит, в результате «обучения» в качестве сигнала к запуску реакции выступает новый раздражитель. Тем самым «освоена» новая связь явлений окружающего мира, которая не предусмотрена врожденными программами животного.

Ну, а сама реакция, т.е. выделение слюны? Эта реакция является врожденным ответом животного на раздражение, сигнализирующее пищу.

То же самое мы видим в опытах Бехтерева. Отдергивание ноги при болевом раздражении — это безусловный рефлекс. Козел не учился ему, это — врожденное действие. А чему он научился? Производить эту врожденную реакцию по новому, не врожденному сигналу — вспышке лампочки.

Значит, при помощи классического условного рефлекса можно извлечь из животного только то поведение, которое у него уже есть, врожденное поведение.

Возникает вопрос, а как же животное усваивает новые действия, новое поведение? Например, как медведи у Филатова научаются ездить на велосипеде? Ведь явно такого врожденного поведения у них нет, в репертуаре безусловных их рефлексов соответствующих действий найти невозможно.

Как же возникают такие новые системы поведения? Иначе говоря, как «научается» животное новым реакциям, не содержащимся в его врожденных программах?

Исследования американского психолога Б.Ф. Скиннера показали, что в основе такого рода научения новым видам поведения лежит другой тип условных рефлексов, получивших название «инструментальных» или «оперантных».

«Оперантные» в переводе означает деятельные, действенные, такие, которым научаются с помощью действий.

Приведем пример формирования оперантного условного рефлекса.

Голодную крысу помещают в клетку. В клетке имеется у стенки педаль. Если на эту педаль нажать, то открывается окошечко и в нем появляются маленькие таблетки спрессованного мяса. Голодная крыса мечется по клетке, толкается во все углы. Совершенно случайно однажды она нажимает на эту педаль. Педаль срабатывает, и появляются таблетки пищи — подкрепление. Крыса, разумеется, ее поедает, но пока никакой связи не образуется. Она продолжает бегать, прыгать и метаться. Вот второй раз она случайно натолкнулась на педаль и опять получила пищу. Она продолжает метаться, но уже довольно скоро возвращается к педали опять. Что происходит дальше, нам уже известно из опытов по научению путем проб и ошибок. После нескольких десятков подкреплений крыса, как только голодна, направляется к педали, нажимает на нее и получает пищу.

Это и есть схема образования оперантного рефлекса. Обратите внимание, в чем его особенность по сравнению с классическим — здесь закрепляются не только врожденные, а любые случайные действия животного, которые получили подкрепление. В классическом условном рефлексе животное как бы пассивно ждет, что с ним сделают, в оперантном рефлексе — животное само активно ищет правильное действие, и когда его находит, то оно его усваивает.

Другое кардинальное различие: классический условный рефлекс не помогает животному найти решение задачи. Зажглась лампочка — начала выделяться слюна. А есть ли от этого какая-нибудь польза для собаки? Никакой! Но вот, если собака научилась, нажимая на педаль, получать пищу, то от этого есть ей польза. Иначе говоря, оперантный рефлекс представляет собою механизм отбора полезных действий, научения полезным действиям, формирования целесообразного поведения.

Не всегда, правда, эти действия оказываются полезными. Вот, например, как ребенок научается сосать палец. Это тоже — чисто оперантный рефлекс. Ребенок манипулирует руками, ногами, он кусает, хватает все на свете. Однажды он совершенно случайно сунул палец в рот, начал его сосать и получил приятное ощущение. Он его и в нос сует, и в ухо сует, и куда угодно, но ощущений приятных не получает. А вот опять в рот попал палец — снова приятно. Почему приятно? Всякое удовлетворение инстинкта сопровождается приятным чувством. Это природа в нас встроила такой индикатор, чтобы мы стремились удовлетворять инстинкты. Один из первых инстинктов ребенка — сосание материнской груди, поэтому в этот период оно сопровождается для ребенка приятным чувством. Палец является для него как бы моделью эвокатора, он его сосет и получает удовольствие. Так закрепляется это действие, и ребенок начинает сосать палец. Некоторые психологи утверждают, что потом отдаленные остатки этого рефлекса проявляются в склонности к курению — сосать папиросу.

Между прочим, Скиннер утверждает, что механизм оперантных рефлексов лежит также в основе всех наших суеверий. Однажды, например, случайно совпала неприятность с тем, что черная кошка перешла дорогу, и черная кошка стала тормозным сигналом.

Скиннер даже демонстрировал экспериментально этот процесс «формирования суеверий» у голубей. На столе помещался ручной голубь и перед ним белый круг.

Голубь должен этот белый круг клюнуть, и тогда он получает несколько зерен. Когда этот рефлекс выработался, вводится маленький вариант в подкрепление. Когда голубь на ходу случайно поднимает голову, ему сейчас же дают пищу. Когда же идет с опущенной головой, ему пищи не дают.

Через несколько десятков повторений голубь движется к кругу, всегда горделиво задрав голову. У него как бы возникла связь между поднятой головой и получением пищи. В действительное™, такой связи нет. Но для него, т.к. это действие сопровождалось несколько раз получением пищи, такая связь внутренне возникла. Вот точно так же, считает Скиннер, возникает для человека, например, оперантная связь между тем, что он помолился и ему повезет в жизни и т.п. Т.е. действия здесь управляются не объективной связью реальности, а случайным совпадением их с приятным или неприятным событием в личном опыте.

Как можно измерить силу оперантного рефлекса? Сила условного рефлекса измеряется, как вы помните, по силе реакции: если выделилось 15 капель слюны, рефлекс сильнее, чем если 10 капель и т.п. В операн-тном рефлексе сила реакции не служит показателем силы рефлекса. Например, голубя можно научить и быстро бегать и медленно, так что его быстрота бега — это не показатель силы оперантного рефлекса. Показателем силы для него является частота соответствующего действия или частота условной реакции.

Например, голубя приучили, что когда он клюнет по белому диску — появляется зернышко. Можно подсчитать, сколько раз за час голубь клюнул по этому белому диску. Количество таких клевков-реакций и будет характеризовать силу рефлекса. Так, в некоторых опытах Скиннера голубь делал за час до 6000 ударов клювом по кругу, прямо как пулеметная дробь.

Используя этот индикатор, удалось установить, что в отношении к оперантным рефлексам справедливы все законы классического условного рефлекса, т.е. генерализация, дифференцировка и угасание неподкрепленного рефлекса.

Но имеют место и некоторые дополнительные законы. Один из них Скиннер назвал законом промежуточных подкреплений. Он заключается в том, что для сохранения оперантного рефлекса его, оказывается, со-всем не нужно непрерывно подкреплять. Например, голубь может сделать сотню «пустых» клевков. Но, если на каждом сто первом мы ему подложим зернышко, то сила рефлекса сохранится. Вот это отношение между подкрепляемыми и неподкрепляемыми действиями, при котором оперантный рефлекс не обнаруживает угасания, Скиннер назвал отношением подкрепления, или пропорцией подкрепления. А для голубя даже пропорция 1/100 вполне достаточная. Скиннер считает, что этот механизм промежуточного подкрепления проявляется и у человека. Например, в азартных играх или лотерее человек 100 раз покупал билет и 1 раз выиграл. Это его уже подкрепляет, чтобы еще 100 раз купил. Это же промежуточное подкрепление, по его мнению, лежит и в основе суеверий. Сто раз у человека не совпадает встреча с черной кошкой и с неприятностью, а один раз совпала. И этого уже достаточно, чтобы еще сто несовпадений на него не действовали, а он ждал сто первого. Неприятностей же у каждого человека немало. Потому шансов, что рано или поздно одна из них совпадет со встречей черной кошки, достаточно, и суеверие подкрепляется.

Второй очень интересный механизм, который был обнаружен еще Павловым, это — явление вторичного подкрепления. Заключается оно в том, что подкрепленный раздражитель, или условный раздражитель сам, в свою очередь, может становиться подкреплением для другого индифферентного раздражителя.

Пусть, например, у собаки выработан условный рефлекс на зажигание лампочки, т.е. она реагирует на нее выделением слюны уже без сопровождения пищи. Теперь делаем так: зажигаем лампочку и одновременно звенит звонок. Достаточно нескольких повторений и уже один только звонок начинает «гнать» у собаки слюну. Здесь, как видим, рефлекс на звонок подкрепляется не самим мясом, а условным раздражителем — лампочкой. Это называют вторичным подкреплением через посредство условного раздражителя. Асам рефлекс называют условным рефлексом второго порядка.

У человека роль такого вторичного подкрепления может выполнять слово, интонация, жест. Так, улыбка учителя, похвала, слово «верно», «молодец» и т.п., сказанные вовремя, активизируют ход научения школьника.

Очень интересные эксперименты на вторичное подкрепление были проведены одним американским ученым с обезьянами. Обезьянам выдали фишки для игры в бридж. Это такие круглые пластмассовые монетки разных цветов — красные, белые, желтые, синие. Бросив монетку в автомат, обезьяна могла за белую — получить апельсин один, за синюю —- два, за красную — глоток воды, за желтую — возвращение в свою клетку и т.д.

Обезьян выдрессировали на это дело, и они совершенно уверенно, когда хотели есть или пить, сейчас же направлялись к нужному автомату, брали соответствующую монету и бросали туда.

Между обезьянами начался обмен монетами. Одна дает другой «апельсинную» монету, та ей дает взамен «водную». Выявились разные характеры. Некоторые обезьяны — транжиры — швыряли сразу все полученные монеты. Половину апельсина съедят, половину разбросают и назавтра «кладут зубы на полку». Другие обезьяны — скаредные — прятали за щеку монеты, копили их там и очень экономно, по одной, только когда хотели кушать, бросали их в автомат и получали пищу.

Заметили несколько случаев, когда самец, обхаживая самку, начинал предлагать ей эти монеты, и самка становилась значительно любезнее.

После этого проделали критический эксперимент. Для того, чтобы получить монеты, обезьяна должна была работать: многократно поднимать довольно с большим трудом тугой рычаг.

Обезьяны между прочим, очень не любят работать, они всячески старались избегать этого колеса. Но когда у обезьяны кончились монеты и хотелось есть, она часами добросовестно трудилась на этом колесе. Получала за это соответствующее количество монет, а потом «покупала» себе на них в автомате бананы.

Рассмотренные механизмы условных рефлексов проливают свет на природу обучаемого поведения, т.е. на навык. Однако, условный рефлекс, все равно классический или оперативный, — это еще не то же самое, что навык.

Рефлекс — это отдельное действие в ответ на раздражитель, а навык — это целая сложная деятельность.

Например, крыса в сложном лабиринте после многократных проб находит, наконец, кратчайший путь и затем всегда бежит уже этим кратчайшим путем. Этот путь может выглядеть так: сначала направо, потом на-лево, потом снова направо, потом прямо, потом — налево и т.д. Ясно, что здесь имеют место не один рефлекс, не одна реакция. Здесь каждый перекресток служит сигналом следующего рефлекса, а в целом развертывается сложная цепь действий. Такими же сложными навыками являются, например, у человека ходьба, речь, письмо, печатание на машинке, вождение автомобиля, управление станком. Короче, почти все виды двигательных действий, которые совершает человек, представляют собой реализацию различных видов навыков.

Как же строится навык?

И здесь, также как в отношении инстинкта, сначала господствовало довольно простое представление. Навык рассматривали просто как цепь условных рефлексов, в которой один условный рефлекс цепляется за другой, завершение одного действия служит сигналом для начала другого.

Иллюстрацией может служить, например, ходьба человека. В рамках приведенной гипотезы механизм ее представляли следующим образом. Прикосновение правой ноги к земле является сигналом, который вызывает действие всего условно-рефлекторного механизма движения левой ноги, и обратно. Так, чередуясь по замкнутому кольцу, действуют несколько двигательных условных рефлексов. Одновременно действует рефлекс сохранения равновесия, связанный с работой вестибулярного аппарата.

Формирование навыка, т.е. научение, с точки зрения этой теории, выглядит, как постепенное «наращивание» условных рефлексов, сцепление их при помощи промежуточных подкреплений.

Эта идея лежит в основе, так называемого, метода последовательных приближений, разработанного Б.Ф. Скиннером. Предположим, что мы хотим выработать у голубя более или менее сложный навык. Например, чтобы он, поставленный на стол, шел к белому экрану, по пути через каждые несколько шагов подпрыгивал, подойдя, кланялся, а затем начинал клевать экран.

Голубя выпускают на стол. Он, естественно, бродит по столу в случайных направлениях. Каждый раз, когда голубь случайно делает шаг, приближающий его к экрану, он получает зернышко. Так вырабатывается оперантный рефлекс приближения к экрану. Затем зернышко начинают давать в тех случаях, когда, направляясь к экрану, голубь случайно подпрыгнет. Затем, когда он случайно опустит голову перед экраном и т.д.

Так оперантные рефлексы у голубя, наращиваясь один на другой, образуют в результате навык довольно сложного поведения.

Итак, по существу, все происходит совершенно случайно. Какие действия из хаотической активности животного закрепятся и как они между собой сцепятся, определяется исключительно воздействиями внешней среды, которая дергает животного, как марионетку, за ниточку подкреплений.

Новейшие исследования показали, однако, что дело обстоит далеко не так просто.

Чтобы определенные действия закрепились, оказалось мало только их подкрепления. Нужна еще врожденная «предрасположенность» животного к такого рода действиям, т.е. соответствие этих действий определенным общим врожденным структурам поведения данного вида животных, определяемым условием их существования.

Так, например, если у собаки брать переднюю лапу и, приговаривая, «дай лапу», подкармливать при этом, то уже после 10—12 подкреплений образуется условный рефлекс. На слова «дай лапу» собака сама поднимает и протягивает ее.

Но если мы попробуем у той же собаки выработать такой же рефлекс с задней ноги, то для этого понадобятся сотни подкреплений.

Почему? Да потому, что в природном поведении собаки движения передней лапы обычно участвуют в добыче пищи, а задней — нет.

Значит, в выработке этого условного рефлекса играют роль не только сами сочетания движения с пищевым подкреплением, но естественная предрасположенность собаки к совершению соответствующих движений при добыче пищи.

Такого рода предрасположения называют диспозициями. Так, например, навык прохождения лабиринтов легко вырабатывается у столь разных организмов как крысы и муравьи, потому что у них по условиям жизни имеется соответствующая диспозиция. Они всю свою жизнь проводят в извилистых сложных ходах, лазах, туннелях. А вот у зайца, который куда ближе к крысе, чем муравей, выработать тот же навык страшно трудно, на сложный лабиринт — вообще невозможно.

Аналогично обстоит дело, например, с усвоением речи. В отличие от всех видов животных, у человека генетически зафиксирована способность научиться говорить. Какой язык и сколько языков он усвоит,^зависит от условий жизни и от обучения. Но сама эта способность научиться говорить определяется врожденной диспозицией, которой нет у других животных. Потому, как показали многочисленные опыты, животные ни при каких условиях не могут научиться речи.

Эта роль врожденных диспозиций особенно наглядно проявляется в некоторых специальных видах научения, открытых в последнее время.

Так, например, известно, что утята везде гуськом следуют за своей мамашей уткой. Ранее считалось, что это инстинкт. Но вот немецкий ученый Лоренц показал, что можно добиться, чтобы утенок повсюду следовал не за матерью, а за любым выбранным нами предметом. Достаточно, чтобы это был первый движущийся предмет, который он увидит после рождения. Поэтому такого рода научение назвали «импринтииг», по-русски — запечатление.

Механизм импринтинга работает только в первые часы или дни жизни. Например, для утят — это первые 14-16 часов жизни. Результаты его необратимы.

Так, утята, которые первым увидели движущегося экспериментатора, после этого ходят только за ним, не обращая внимания на свою мать-утку. Аналогично ягненок, вскармливаемый из бутылочки, реагирует «сыновним» поведением не на овец, а на кормящего его человека. Превращение кошки из неохотящегося животного в охотящееся происходит после первой поимки живой мыши или птицы и является тоже необратимым. Известно, что тигр, однажды попробовавший человеческой крови, навсегда становится людоедом.

Единственный способ прекратить его нападения на людей — это уничтожить.

Результаты импринтинга, как мы говорили, необратимы. Никакие поощрения и заботы уже не способны вернуть к утке утенка, привязанность которого сосредоточилась после рождения, например, на человеке. Этой своей чертой импринтинг сходен с инстинктом, с той только разницей, что обусловленное им поведение запечатляется у организма не в яйце или чреве матери, а почти сейчас же после вылупливания или рождения.

Другая переходная от инстинкта форма обучаемого поведения — это, так называемое, облигаторное (т.е. обязательное) научение.

Под ним понимают усвоение животным определенных форм поведения, которые в естественных условиях обязательно необходимы ему, чтобы выжить и размножаться.

Так, например, пчела может научиться отличать квадрат от круга, но она должна научиться находить дорогу к улью, иначе погибнет.

Установлено, что в соответствующем возрасте у животных наступает определенный «критический» период, когда возникает оптимальная способность к усвоению соответствующих навыков. Так, например, щенки должны познакомиться с человеком в течение первых

14 недель, иначе он станет для них эвокатором страха и бегства.

Пищевая реакция на приложенный к мордочке кусок сырого мяса появляется у них на 18—21 день после рождения, независимо от условий вскармливания. Если в этот период продолжать кормить их только молоком, то реакция угасает и в дальнейшем щенки становятся равнодушны к мясу. Аналогично пищедобывательная деятельность копытных — пастьба формируется на 12-

15 день после рождения. Если новорожденного ягненка или козленка изолировать и до 6 месячного возраста кормить только молоком, то выпущенные затем на пастбище, они могут умирать от голода, но не пасутся. Зяблики научаются основной мелодии своей песенки в первые 2-3 недели жизни, а вариациям — на 1-м месяце. Позже эта способность исчезает и т.п.

По-видимому, у человека тоже существуют такие критические периоды для усвоения основных форм облигатного поведения — ходьбы, родной речи и др.

Еще один врожденный механизм, обеспечивающий усвоение животным основных форм видового поведения — это подражание. Оно, как правило, особо развито у молодых животных и, по-видимому, связано с механизмом импринтинга. Так, известно, что певчие птицы научаются петь на основе подражания. Например, в одном опыте новорожденные птенцы мухоло-вок-пеструшек были пересажены в гнезда других видов птиц. 80% из них, когда выросли, имитировали песню гида-воспитателя (горихвостки, пеночки-трещотки, синицы), хотя и слышали вокруг пение птиц своего вида. И эта «чужая песня» закреплялась навсегда.

Попугаи, сороки, скворцы, вороны и др. перенимают таким путем даже и человеческую речь. Высоко развито звукоподражание у дельфинов. Американский исследователь Дж. Лилли регистрировал, как один из его дельфинов повторял слова за людьми и имитировал их смех.

Ведущее место в поведении занимает подражание у стадных и стайных животных. Например, новорожденный ягненок, следуя за пасущейся овцой, совершает движения, имитирующие поедание травы, хотя в желудке таких ягнят растительного корма не обнаруживается. Наконец, исключительно высоко развито подражание у обезьян («обезьянничание») и у маленьких детей.

В отличие от импринтинга, подражание не обуславливает, какое именно поведение усвоит животное. Но зато оно создает условия для «перенимания» животным целесообразного поведения его сородичей. Так, например, наблюдалось, что достаточно выработать условный рефлекс у одного павиана-гамадрила, чтобы этот рефлекс появился у всех павианов-»зрителей». По той же причине, по-видимому, в местностях, заселенных человеком, все дикие животные убегают, завидев его, особенно, если человек вооружен. Убегающая лисица могла «лично» и не испытать на себе огнестрельного оружия, но рефлекс бегства от охотника она переняла путем подражания своим старшим, более «опытным» сородичам.

Из сказанного видно, что действия, которым научаются животные, т.е. усваиваемые ими навыки, определяются не только случайными воздействиями внешней среды, но и биологической природой, врожденными свойствами, потребностями их организма. В соответствии с этими свойствами и потребностями животное «отбирает» из внешней среды лишь некоторые «значимые» раздражители. И отвечает оно на эти раздражители с самого начала не случайными хаотическими реакциями, а определенным кругом действий, которые содержатся в «репертуаре» соответствующих врожденных программ или его индивидуального опыта.

Более глубокое исследование показывает, что и формы поведения, которые усваивает животное, во многих случаях не могут быть сведены к простой связи: условный раздражитель А условная реакция В, зафиксированная безусловным подкреплением. Сегодня обнаружено, что и здесь дело обстоит значительно сложнее. Вот несколько опытов, которые это иллюстрируют.

1-й тип опытов (психолога Толмена): крыса должна в Т-образном лабиринте найти камеру, в которой находится пища. Опыт идет в двух вариантах. В первом — пищу сразу помещают в камеру. Крыса бегает по лабиринту, случайно натыкается на пищу, после нескольких повторений опыта «научается» сразу добираться до пищи кратчайшим путем. Это обычное обучение через подкрепление.

Во втором варианте опыты построили иначе. Крысу сначала пустили бегать в пустом лабиринте. Она бегала, обнюхивала, так сказать, знакомилась с его топографией. После этого в одной из камер поставили пищу и крысу снова запустили в лабиринт. Оказалось, что в этом случае она значительно быстрее усваивала правильную дорогу, т.е. при первом обследовании лабиринта животное как бы составило в голове какую-то карту, и теперь по этой карте ему легче было уже найти кратчайшую дорогу к той камере, в которой поместили пищу.

2-й тип опытов. Напившуюся и наевшуюся до отвала крысу запускают снова в тот же Т-образный лабиринт. Но теперь уже в нем заранее поставлены в одной камере (например, правой) пища, а в другой — вода. Крыса бегает по лабиринту. Так как она сыта и не ис-гтытывает жажды, она не обращает на эти раздражители ни малейшего внимания.

Однако, если через некоторое время ту же крысу запустить в этот лабиринт в голодном состоянии, она в большинстве случаев безошибочно направляется сразу в правую камеру; если же будет испытывать жажду — соответственно в левую.

Итак, хотя никакого видимого подкрепления не было, нужная связь все же образовалась. Крыса научилась правильно выбирать направление своего движения в лабиринте в соответствии с потребностью. Она как бы «запомнила» на будущее — где пища, а где вода. Это назвали латентным научением.

Напомню, что аналогичное явление мы наблюдали у кошки, которая обследует новое местожительство, «заучивая» входы и выходы, границы «своей территории». Многие животные «заучивают» путь к своему обиталищу и т.д.

В лабиринте обнаруживаются еще интересные особенности научения. В частности, если лабиринт имеет несколько одинаково коротких дорог к выходу, животное иногда избирает одну из них, а иногда другую.

Этот опыт можно поставить еще по-другому. Несколько столов соединяются мостиками. Животное приучают, что на одном из этих столов (например, левом крайнем) находится пища. Затем приманку закрывают и крысу ставят то на второй, то на третий, то на четвертый пустой стол. И что же? Крыса бежит к столу, на котором находится пища, хотя для этого ей каждый раз приходится пробегать новый, ранее не пройденный путь.

Во всех описанных опытах поведение животного никак уже нельзя объяснить воспроизведением цепи заученных движений. Ведь движения эти — выбор поворотов и путей — в каждом варианте разные. Поэтому указанным выбором руководят не стандартные подкрепленные последовательности движений, а соответствующие пространственные отношения. И усваиваются при обучении, следовательно, не двигательные навыки, а расположение путей и мест, где находится пища.

Этот вид научения обозначают термином «пространственное научение».

А вот еще более интересные опыты. На глазах у обезьяны под одну из двух чашек прятали банан. Затем обезьяну выпускали. Она, естественно, бросалась к той чашке, под которой была пища, поднимала чашку и съедала банан. Однажды экспериментатор незаметно подменил банан листком салата. Обезьяна, как обычно, бросилась к чашке. Но, обнаружив менее привлекательный для нее салат, яростно его отшвырнула и начала обследовать чашку, место, на котором она лежала и т.д. Аналогичное поведение наблюдалось у крысы, когда в награду за прохождение лабиринта она нашла семечки, вместо привычной каши из отрубей.

О чем свидетельствуют эти эксперименты?

О том, что кроме самого сигнала к действию в навыке имеет место ожидание или предвидение определенного результата совершаемых действий.

Совершенно определенно входит в навык также контроль достигнутого эффекта.

Например, в опыт с крысой в «проблемном» ящике вводят следующее изменение. В исходном опыте животному достаточно было нажать на педаль, и появлялась пища. А теперь делают так: чтобы пища появилась, педаль нужно нажать три раза. Запущенная в ящик крыса, как обычно, подбегает, нажимает педаль, но пищи нет. Она с некоторым недоумением обнюхивает педаль и опять нажимает ее. Опять нет пищи. Крыса уже с явным раздражением снова жмет. Пища появляется, и, соответствено, это новое рефлекторное пове-Одение закрепляется.

Если бы рефлекс был простым автоматическим срабатыванием соответствующей связи, то крыса нажала бы раз на педаль — есть пища или нет — действие бы прекратилось, ведь рефлекс сработал, и, следовательно, завершился. Но здесь, как видим, поведение управляется не только самим раздражителем — педалью, но и результатом. Нет результата — животное повторяет еще раз свое действие.

Наконец, анализ обучаемого поведения показывает, что развертывание, усвоение и реализация навыка направляются всем опытом животного и, в частности, образом всей ситуации, всей обстановки, в которой достигается поставленная цель. Например, когда Павлов проводил над собаками свои опыты, непосредственным

условным сигналом была лампочка. Но собака реагировала на все, что было связано с экспериментом.

Как только ее вводили в комнату, где проводился эксперимент, у нее уже начинала выделяться слюна. Как только раздавались шаги служителя в коридоре, у нее начиналась пищевая активность. Иначе говоря, не отдельный раздражитель, а вся ситуация, связанная с тем, что ее будут кормить, превращалась в условие реализации рефлекса.

Павлов пытался, между прочим, освободиться от этого ограничения. Была построена специальная, так называемая, «башня молчания», где животное полностью изолировалось от всех звуков и раздражителей внешнего мира. И что вы думаете было результатом — удалось выделить и исследовать в качестве раздражителя только один сигнал? Нет, результатом было то, что как только собаку помещали в эту камеру — она засыпала. Внешне «побочные» раздражители оказались нужны для того, чтобы любая деятельность, в том числе условно-рефлекторная, вообще функционировала.

Итак, навык действительно включает в свою структуру цепи и сочетания условных рефлексов, классических и оперантных. Но было бы ошибкой представлять его как простую цепь таких рефлексов, которая образуется путем «наращивания» подкрепляемых связей сигнала с движением и реализуется путем автоматического развертывания под действием «пусковых» сигналов.

Оказалось, что в формировании навыка участвуют еще такие акты, как латентное научение, усвоение пространственных отношений, предвосхищение результата, контроль эффекта совершенных действий и, наконец, отражение общей ситуации, в которой достигается этот эффект. Кроме того, сама возможность образования соответствующего навыка обуславливается врожденными диспозициями организма, этапом его развития и состоянием в момент научения. А набор действий, при помощи которых он учится, определяется врожденным репертуаром реакций на биологическое «значение» соответствующей ситуации.

Таким образом, навык —это сложная динамическая программа поведения, формирующаяся у организма в ходе его взаимодействия с окружающим миром. Он обеспечивает приспособительную реакцию животного на биологическое значение тех ситуаций, с которыми оно сталкивается в процессе жизнедеятельности. По своему механизму навык представляет собой цепь условных рефлексов, классических и оперантных. Образование каждого из звеньев этой цепи обуславливается, с одной стороны, характером связей реальности, с которыми сталкивается организм, а с другой — его врожденными диспозициями, возрастными репертуарами реакций и текущими состояниями. Наконец, срабатывание каждого звена и их сочетаний вызываются усвоенными условными сигналами, направляются «значением» ситуации, руководствуются образами ее пространственных и временных отношений, движутся к определенной конечной цели — объекту и контролируются достигнутым эффектом каждого действия.

Психология bookap

С помощью описанного механизма признаки ситуации, накопленные в опыте, связываются с состояниями организма и действиями, необходимыми, чтобы эти состояния оптимизировать.

ЛЕКЦИЯ V

ПРЕДИСЛОВИЕ

СТРУКТУРЫ основных типов

Читайте еще:

Психология: