Эпистемология и экология

Кибернетическое объяснение[29]

Описание некоторых особенностей кибернетического объяснения может оказаться полезным.

Каузальное объяснение обычно позитивно. Мы говорим, что бильярдный шар В начал двигаться в таком-то направлении потому, что шар А ударил его под таким-то углом. По контрасту, кибернетическое объяснение всегда негативно. Мы рассматриваем все мыслимые альтернативные возможности, которые могли бы осуществиться, и затем спрашиваем, почему многие альтернативы не осуществились. То есть конкретное событие является одним из нескольких, которые фактически могли бы случиться. Классический пример объяснения такого типа — теория эволюции при естественном отборе. Согласно этой теории, организмы, не обладавшие одновременно физиологической и экологической жизнеспособностью, не могли, по всей видимости, дожить до стадии воспроизведения. Следовательно, эволюция всегда шла путем жизнеспособности. Как отмечал Льюис Кэрролл, эта теория вполне удовлетворительно объясняет, почему сегодня нет "пив-ных-ба-бочек" [у Кэрролла "bread-and-butter-flies"].

На языке кибернетики говорится, что течение событий подвержено ограничениям. При этом подразумевается, что, не будь этих офаничений, траектория изменений управлялась бы только равенством вероятности. Фактически эти "ограничения", от которых зависит кибернетическое объяснение, можно во всех случаях рассматривать как факторы, определяющие неравенство вероятности. Если мы видим, что обезьяна бьет по клавишам пишущей машинки очевидно случайным образом, но фактически пишет осмысленную прозу, то мы должны поискать ограничения либо внутри обезьяны, либо внутри пишущей машинки. Возможно, обезьяна не может ударить несоответствующие буквы; возможно, клавиши не могут двигаться при неправильном ударе; возможно, неправильные буквы не сохраняются на бумаге. Где-то наверняка есть цепь, способная идентифицировать и устранять ошибки.

Как теоретически, так и практически актуальное событие из любой последовательности или совокупности событий имеет уникальное определение в терминах кибернетического объяснения. Для генерирования этого уникального определения могут комбинироваться ограничения самых разных видов. Например, выбор фрагмента для данного пустого места в разрезной головоломке "ограничивается" многими факторами. Его форма должна находиться в соответствии с формой нескольких соседей и, возможно, с границей головоломки; его цвет должен находиться в соответствии с цветовым паттерном области; ориентация краев должна подчиняться топологической схеме, заданной резательной машиной, на которой была сделана эта головоломка, и так далее. С точки зрения человека, пытающегося решить головоломку, все это — ключи, т.е. источники информации, направляющие его в его выборе. С точки зрения наблюдателя-кибернетика, это — ограничения.

С кибернетической точки зрения, и слово в предложении, и буква в слове, и анатомия некоторой части в организме, и роль видов в экосистеме, и поведение некоторого члена в семье — все должно получить (негативное) объяснение в результате анализа ограничений.

Негативная форма этих объяснений в точности сравнима с методом логического доказательства посредством reductio ad absurdum. При этом виде доказательства нумеруется достаточный набор взаимно исключающих альтернативных утверждений, например "П" и "не П", после чего процесс доказательства переходит к демонстрации, что все утверждения из этого набора за исключением одного несостоятельны или "абсурдны". Из этого следует, что выживший член набора, очевидно, является состоятельным в терминах логической системы. Это такая форма доказательства, которую нематематики иногда находят неубедительной. Нет сомнений, что теория естественного отбора также иногда кажется неубедительной людям, далеким от математики, по сходным причинам (какими бы эти причины ни были).

Еще одна тактика математического доказательства, имеющая параллель в конструкции кибернетического объяснения, — это использование "отображения" ("mapping") или строгой метафоры. Например, алгебраическое утверждение может быть отображено в систему геометрических координат и там доказано геометрическими методами. В кибернетике отображение появляется в качестве метода объяснения всегда, когда возникает концептуальная "модель", или, более конкретно, когда для симуляции сложного коммуникативного процесса используется компьютер. Но это не единственный случай появления отображения в этой науке. Формальные процессы отображения, трансляции и трансформации принципиально присущи каждому шагу любой последовательности тех феноменов, которые стремится объяснить кибернетик. Эти отображения или трансформации могут быть очень сложными, например, если выход некоторой машины рассматривается как трансформа входа; или они могут быть очень простыми, например, если поворот стержня в каждой точке вдоль его оси рассматривается как преобразование, тождественное его повороту в некоторой предыдущей точке.

Отношения, остающиеся постоянными при таких трансформациях, могут иметь любой умопостижимый вид.

Эта параллель между кибернетическим объяснением и тактикой логического или математического доказательства более чем просто интересна. Мы ищем объяснений и вне кибернетики, но мы определенно не искали способа моделирования логического доказательства. Эта имитационная модель доказательства — нечто новое. Мы можем, однако, сказать задним числом, что объяснения посредством моделирования логического или математического доказательства следовало ожидать. В конце концов, предметом кибернетики являются не события или объекты, а информация, "переносимая" событиями или объектами. Мы рассматриваем объекты и события только как представления фактов, утверждений, сообщений, перцептов и тому подобное. А раз предмет касается представлений, то следует ожидать, что объяснение будет имитировать логическое объяснение.

Кибернетики сделали своей специальностью те объяснения, которые имитируют reductio ad absurdum и "отображение". Существуют, возможно, целые области объяснений, ожидающие своего открытия теми математиками, которые сумеют различить в информационных аспектах природы последовательности, моделирующие другие типы доказательств.

Поскольку предмет кибернетики — это представляющий (информационный) аспект событий и объектов природного мира, эта наука вынуждена использовать процедуры, сильно отличающиеся от процедур других наук. Например, то различение карты и территории, которое, как настаивают семантики, ученые должны уважать в своих описаниях, в кибернетике требуется отслеживать в тех самых феноменах, которые ученые описывают. Следует ожидать, что организмы в состоянии коммуникации и плохо запрограммированные компьютеры будут ошибочно принимать карту за территорию. Язык ученого должен быть способен иметь дело с подобными аномалиями. В системах человеческого поведения, особенно в религии, ритуале и вообще везде, где на сцене доминирует первичный процесс, имя часто является поименованной вещью. Хлеб есть Плоть, а вино есть Кровь.

Подобным же образом, весь вопрос индукции и дедукции, равно как и наших доктринальных предпочтений того или другого, приобретает новую значимость, когда мы начинаем различать индуктивные и дедуктивные шаги не только в наших собственных доказательствах, но и в отношениях между данными.

В этой связи особый интерес представляют взаимоотношения контекста со своим содержанием. Фонема существует в качестве таковой только в комбинации с другими фонемами, составляющими слово. Слово есть контекст фонемы. Однако слово существует в качестве такового (т.е. только и имеет "смысл") в большем контексте утверждения, которое в свою очередь имеет смысл только в отношениях.

Эта иерархия контекстов внутри контекстов — универсальная черта коммуникативного аспекта феноменов, подвигающая ученого всегда искать объяснения во все более широких сферах. Для физики верно, что объяснения макроскопическому нужно искать в микроскопическом. В кибернетике обычно верно противоположное: без контекста коммуникации не существует.

В согласии с негативным характером кибернетического объяснения, "информация" получает числовое выражение в негативных терминах. Такое событие, как, например, наличие буквы "k". в данном месте текста сообщения, могло бы быть любым другим из ограниченного набора двадцати шести букв английского языка. Конкретная буква исключает (т.е. устраняет посредством ограничения) двадцать пять альтернатив. По сравнению с английской буквой, китайский иероглиф исключил бы несколько тысяч альтернатив. Поэтому мы говорим, что китайский иероглиф несет больше информации, чем буква. Количество информации традиционно выражается как логарифм по основанию 2 невероятности данного события или объекта.

Вероятность — т.е. отношение величин, имеющих аналогичную размерность, — сама безразмерна. То есть центральная для объяснения числовая величина — информация — есть величина безразмерная. В кибернетическом объяснении нет места количествам с реальной размерностью (массе, длине, времени) и их производным (силе, энергии и т.д.).

Статус энергии представляет особый интерес. В общем, в системах коммуникации мы имеем дело с последовательностями, больше напоминающими стимул-и-отклик, чем причину-и-следствие. Когда один биллиардный шар ударяет другой, происходит такой перенос энергии, что движение второго шара энергетизируется ударом первого. С другой стороны, в коммуникативных системах энергия для отклика обычно предоставляется получателем. Если я пинаю собаку, ее непосредственно следующее поведение энергетизируется ее метаболизмом, а не моим пинком. Аналогично, когда один нейрон запускает другой или импульс от микрофона активизирует цепь, последующее событие имеет свои собственные источники энергии.

Разумеется, все, что происходит, по-прежнему находится в границах, заданных законом сохранения энергии. Метаболизм собаки может в конечном счете ограничить ее отклик, однако в целом в тех системах, с которыми мы имеем дело, поступления энергии превышают запросы. Задолго до иссякания запасов энергии в дело вступают "экономические" ограничения, накладываемые конечным числом доступных альтернатив, т.е. существует экономика вероятности. Эта экономика отличается от экономики энергии или денег тем, что вероятность, будучи отношением, не подлежит сложению или вычитанию, а подвержена только мультипликативным процессам — например дроблению. Телефонная связь в часы пик может "глушиться", если значительная часть альтернативных маршрутов занята. Тем самым вероятность прохождения данного сообщения снижается.

В дополнение к ограничениям, связанным с лимитированной экономикой альтернатив, следует обсудить две другие категории ограничений: ограничения, связанные с "обратной связью", и ограничения, связанные с "избыточностью".

Рассмотрим сначала концепцию обратной связи

Если мы видим феномены вселенной как связанные между собой причиной-и-следствием и переносом энергии, то результирующая картина будет картиной сложно ветвящихся и переплетающихся цепей причинности. В определенных областях этой вселенной (особо отметим организмы в среде, экосистемы, термостаты, паровые машины с регуляторами, человеческие сообщества, компьютеры и т.п.) эти цепи причинности образуют контуры, которые замкнуты в том смысле, что причинная взаимосвязь может прослеживаться вдоль всего контура в любом направлении, какое бы положение ни было (произвольным образом) выбрано в качестве исходной точки описания. Очевидно, что в таком контуре следует ожидать, что события в любой точке контура с течением времени окажут влияние на все прочие точки контура.

Такие системы, однако, всегда являются открытыми:

a) в том смысле, что контур получает энергию из некоторого внешнего источника и теряет энергию обычно в виде выделения тепла вовне;

b) в том смысле, что на события внутри контура могут влиять внешние события или они сами могут влиять на внешние события.

Очень обширная и важная часть теории кибернетики связана с формальными характеристиками и условиями устойчивости таких контуров причинности. Но здесь я буду рассматривать такие системы только как источники ограничений.

Представим себе переменную, описывающую некоторую точку контура, и предположим, что с переменной происходит случайное изменение величины, вызванное, возможно, воздействием некоторого внешнего для контура события. Теперь мы спрашиваем: как это изменение скажется на значении этой переменной позднее, когда последовательность эффектов обойдет вокруг всего контура? Ясно, что ответ на последний вопрос будет зависеть от характеристик контура и, следовательно, будет неслучайным.

В целом, контур причинности будет генерировать неслучайный отклик на случайное событие в той точке, в которой случайное событие произошло.

Таково общее требование для создания кибернетического ограничения любой переменной в любой заданной точке. Конкретное ограничение, создаваемое в каждом конкретном случае, будет, конечно, зависеть от характеристик конкретного контура: от того, будет ли общее усиление позитивным или негативным, от временных характеристик, от порогов срабатывания и т.д. Все это вместе взятое определит те ограничения, которые будут наложены на любую заданную точку.

Если мы наблюдаем, что машина движется с постоянной скоростью даже при изменении нагрузки (что невероятно), то для целей кибернетического объяснения нам следует поискать ограничение, т.е. такой контур, который будет активизироваться изменениями скорости и, будучи активизирован, станет воздействовать на некоторую переменную (например, на подачу топлива) таким образом, чтобы уменьшить изменение скорости.

Если мы наблюдаем, что обезьяна печатает прозу (что невероятно), нам следует поискать некоторый контур, который активизируется всегда, когда обезьяна делает "ошибку" и, будучи активизирован, уничтожает признаки этой ошибки в позиции ее возникновения.

Кибернетический метод негативного объяснения поднимает вопрос: есть ли разница между тем, чтобы "быть правым" и тем, чтобы "не быть неправым"? Должны ли мы говорить о крысе в лабиринте, что она "выучила правильный маршрут", или же только то, что она обучилась "избегать неправильных маршрутов"?

Субъективно я чувствую, что знаю, как произносить множество английских слов, и мне определенно ничего не известно об отбрасывании мною буквы "k" как бесперспективной при необходимости произнести слово "many". Однако согласно кибернетическому объяснению первого уровня дело представляется так, что, произнося "many", я активно отвергаю альтернативу "k".

На нетривиальный вопрос и ответ будет одновременно и уклончивым и фундаментальным: не все выборы принадлежат одному уровню. Возможно, ради того, чтобы избежать ошибки при подборе слова для данного контекста, мне пришлось отвергнуть "few", "several", "frequent" и т.д. и выбрать "many". Но если я способен достигать этого более высокого уровня выбора на негативной основе, то значит слово "many" и его альтернативы должны быть каким-то образом умопос-тижимы. Они должны существовать в качестве различимых и, возможно, маркированных или кодированных паттернов моих нейронных процессов. Если они в некотором смысле существуют, то из этого следует, что после выбора на высоком уровне слова для использования, я не должен обязательно столкнуться с альтернативами более низкого уровня. Исключение буквы "k". из слова "many" может стать необязательным. Будет правильным сказать, что я позитивно знаю, как произносить "many", а не просто знаю, как избежать ошибок при произнесении этого слова.

Из этого следует, что шутка Льюиса Кэрролла по поводу теории естественного отбора не вполне убедительна. Если в коммуникативных и организационных процессах биологической эволюции существует что-то вроде уровней (как то: одиночные явления, паттерны и, возможно, паттерны паттернов), тогда для эволюционной системы логически возможно совершение чего-то вроде позитивных выборов. Можно представить, что такие уровни (структурирование) могли бы существовать в генах, между генами или где-то еще.

От контуров вышеупомянутой обезьяны требовалось бы различать отклонения от "прозы", а проза характеризуется паттерном, или избыточностью, как говорят инженеры.

Появление буквы "k" в данном месте английского прозаического сообщения не является чисто случайным событием в том смысле, что существует равная вероятность появления в этом месте любой другой из двадцати пяти букв. Некоторые буквы встречаются в английском языке чаще других, равно как и некоторые комбинации букв. Существуют, следовательно, виды паттернов, частично определяющие, какая буква должна появиться в какой позиции. Результат таков: если получатель сообщения получил полное сообщение за исключением обсуждаемой нами конкретной буквы "k", то он мог бы с успехом, превышающим случайный, угадать, что отсутствующая буква есть "k". В той степени, в какой это возможно для этого получателя, буква "k" не исключила остальные двадцать пять букв, поскольку они уже были частично исключены той информацией, которую получатель извлек из остального сообщения. Этот паттерн предсказуемости конкретных событий внутри большей совокупности событий называется на специальном языке "избыточностью".

У меня, как и у других, концепция избыточности обычно возникает из определения сперва той максимальной информации, которую могло бы перенести данное единичное сообщение, и последующего определения того, как эта величина могла бы быть редуцирована знанием окружающих паттернов, компонентом которых является данное единичное событие. Существует, однако, совсем другой взгляд на этот вопрос. Мы могли бы рассматривать паттерны или предсказуемость как самую суть и смысл коммуникации; тогда одиночная буква, не сопровождаемая параллельными ключами, видится как частный и особый случай.

Идея, что коммуникация является созданием избыточности (паттерна) может быть применена к простейшим примерам из инженерии. Давайте рассмотрим наблюдателя, который видит, как А посылает сообщение В. С точки зрения А и В цель трансакции заключается в том, чтобы создать в блокноте у В последовательность букв, идентичную той, которая ранее существовала в блокноте А. Однако с точки зрения наблюдателя это есть создание избыточности. Если он видел блокнот А, исследование блокнота В не даст ему никакой новой информации о самом сообщении.

Очевидно, что природа "смысла", паттерна, избыточности, информации и т.п. зависит от того, где мы находимся. При обычном инженерном обсуждении отправки сообщения от А к В принято опускать наблюдателя и говорить, что В получил от Л информацию, зависящую от количества переданных букв и снижаемую такой избыточностью текста, которая могла бы позволить В сделать некоторые догадки. Но в более широкой вселенной, т.е. вселенной, определяемой точкой зрения наблюдателя, это кажется уже не "передачей" информации, а, скорее, распространением избыточности. Усилия А и В объединились для того, чтобы сделать вселенную наблюдателя более предсказуемой, более упорядоченной и более избыточной. Мы можем сказать, что правила "игры", в которую играют А и В, объединяют (в качестве "ограничений") то, что в противном случае выглядело бы во вселенной наблюдателя как загадочное и невероятное совпадение, а именно схожесть записей в двух блокнотах.

По сути, отгадывать — это значит стоять лицом к "линии", рассекающей последовательность единичных событий, и предсказывать, какого рода события могли бы находиться по другую сторону линии. Линия может быть пространственной или временной (или и той и другой одновременно), а отгадывание может быть либо предсказательным, либо ретроспективным. Фактически паттерн можно определить как такую совокупность событий или объектов, которая до некоторой степени позволяет такое угадывание, когда совокупность целиком для исследования недоступна.

Однако этот вид паттернов также вполне обычный феномен и вне сферы коммуникации между организмами. Получение сообщения одним организмом ничем фундаментально не отличается от любого другого вида восприятия. Если я вижу верхнюю часть растущего дерева, я могу предсказать с успехом, превышающим случайный, что в земле у дерева есть корни. Перцепт верхней части дерева является избыточным, т.е. содержит "информацию" касательно частей системы, которые я не могу воспринять из-за линии, обеспеченной непрозрачностью земли.

Если мы говорим, что сообщение имеет "смысл" или же что оно "о" некотором референте, то имеется в виду, что существует большая вселенная релевантности, состоящая из сообщения-плюс-референта, и что сообщение привносит в эту вселенную избыточность, паттерн или предсказуемость.

Если я говорю вам: "Идет дождь", то это сообщение привносит избыточность во вселенную "сообщение-плюс-капли дождя", поэтому из одного этого сообщения вы можете догадаться с успехом, превышающим случайный, что именно вы увидите, если выглянете из окна. Вселенной "сообщение-плюс-референт" придается паттерн или форма. В шекспировском смысле, вселенная информирована сообщением, и "форма", о которой мы говорим, не принадлежит ни сообщению, ни референту. Это есть соотношение между сообщением и референтом.

Обыденному сознанию локализация информации кажется простым делом. Буква "k". в данной позиции предполагает, что буква, находящаяся в этой конкретной позиции, есть "k". И если вся информация принадлежит к этому очень непосредственному виду, то информация может быть "локализована": кажется, что информация о букве "k" находится в этой позиции.

Дело обстоит не так просто, если текст сообщения является избыточным, однако если нам повезет и избыточность имеет низкий порядок, мы по-прежнему можем иметь возможность указать на те части текста, которые указывают (несут некоторую информацию), что в данной позиции следует ожидать букву "k"..

Однако если нас спрашивают, где находятся такие единицы информации, как:

a) "это сообщение — на английском языке"; и

b) "в английском языке буква "k" часто следует за буквой "с", кроме тех случаев, когда буква "с" стоит в начале слова",

то мы можем только сказать, что такая информация не локализована в какой-либо части текста, а является статистической индукцией из текста как целого или (возможно) из совокупности "подобных" текстов. Кроме всего прочего, это есть метаинформация, имеющая принципиально другой порядок другой логический тип — нежели информация "буква в этой позиции есть "k"".

Этот вопрос о локализации информации на протяжении многих лет был кошмаром теории коммуникации и особенно нейрофизиологии, поэтому будет интересно рассмотреть, как выглядит этот вопрос, если мы исходим из избыточности, паттерна или формы как из базовых концептов.

Совершенно очевидно, что безразмерная переменная не может иметь истинной локализации. Информация и форма своей безразмерностью напоминают контраст, симметрию, соответствие, конгруэнтность, согласованность и т.п. и, следовательно, не могут быть локализованы. Контраст между этой белой бумагой и этим черным кофе не находится где-то между бумагой и кофе. Даже если мы поместим бумагу и кофе рядом, контраст между ними не будет локализован или фиксирован между ними. Контраст не локализован также между этими двумя объектами и моими глазами. Он даже не находится у меня в голове: если это так, то он также находится и у вас в голове. Однако, вы, читатель, не видели бумагу и кофе, на которые я ссылаюсь. У меня в голове имеется образ, или трансформа, или имя контраста между ними, в вашей же голове имеется трансформа того, что есть в моей голове. Но наша согласованность не может быть локализована. Информация и форма фактически не являются тем, что может быть локализовано.

Тем не менее, есть возможность начать (хотя, возможно, и не завершить) некоторый вид отображения формальных связей внутри системы, содержащей избыточность. Рассмотрим конечную совокупность объектов или событий (скажем, последовательность букв или дерево) и наблюдателя, который уже информирован обо всех правилах избыточности, поддающихся распознаванию (т.е. имеющих статистическую значимость) в этой совокупности. Тогда возможно очертить границы областей совокупности, внутри которых наблюдатель способен осуществлять угадывание, превышающее случайное. Следующий шаг к локализации достигается рассечением этих областей такими линиями, что из того, что находится по одну сторону, осведомленный наблюдатель может сделать догадку о чем-то, что находится по другую сторону.

Однако такое отображение распределения паттернов принципиально не может быть завершено, поскольку мы не рассматривали источник предварительного знания наблюдателя о правилах избыточности. Если же мы теперь рассмотрим наблюдателя, не имеющего предварительного знания, становится ясно, что он мог бы открыть некоторые релевантные правила на основании восприятия чего-то меньшего, чем целая совокупность. Он мог бы затем использовать свое открытие для предсказания правил для остальной части, правил, которые были бы правильными, хотя и не подтверждались бы примером. Он мог бы обнаружить, что "л" часто следует за "Г", даже если остальная часть совокупности не содержала бы примеров этой комбинации. Для этого порядка феноменов необходим другой порядок линий разметки — необходимы металинии.

Интересно отметить, что металинии, производящие такую демаркацию, необходимую наивному наблюдателю для открытия правил, смещены относительно тех линий, которые появились бы на карте, подготовленной наблюдателем, полностью осведомленным о правилах избыточности для данной совокупности. Этот принцип имеет некоторое значение для эстетики. С эстетической точки зрения, форма краба, у которого одна клешня больше другой, не является просто асимметричной. Она сначала предлагает правило симметрии, а затем тонко отменяет это правило, предложив более сложную комбинацию правил.

После того как мы исключили из нашей системы объяснений все вещи и все реальные размерности, нам остается только рассматривать каждый шаг в коммуникативной последовательности как трансформу предыдущего шага. Если мы рассматриваем прохождение импульса вдоль аксона, нам следует считать события в каждой точке вдоль маршрута трансформами (хотя, возможно, и идентичными или подобными) событий в каждой предшествующей точке. Или же если мы рассматриваем последовательность нейронов, где каждый нейрон запускает следующий, тогда запуск каждого нейрона является трансформой запуска его предшественника. Мы имеем дело с последовательностями событий, которые не обязательно предполагают прохождение одной и той же энергии.

Аналогично мы можем рассмотреть любую сеть нейронов и произвольную выборку поперечных сечений этой сети в последовательных точках. Тогда нам следует рассматривать события в каждом поперечном сечении как трансформу событий в некотором предыдущем поперечном сечении.

Психология bookap

При рассмотрении восприятия нам не следует говорить, например, "я вижу дерево", поскольку дерево не находится внутри нашей системы объяснения. В лучшем случае, возможно увидеть только образ, который есть сложная, однако систематическая трансформа дерева. Этот образ, разумеется, энергетизируется моим метаболизмом, а природа трансформы отчасти определяется факторами моих нервных цепей. "Я" создаю образ под влиянием различных ограничений, частично накладываемых моими нервными цепями, а частично внешним деревом. Галлюцинация или сновидение были бы в большей степени подлинно "моими", поскольку продуцировались бы без непосредственных внешних ограничений.

Все, что не информация, не избыточность, не форма и не ограничение, есть шум, единственный возможный источник новых паттернов.