Некоторые условия, при которых происходит перестановка в системе «средства — цели», уже известны. Д. Примак (1959) провел эксперименты с выработкой оперантных условных рефлексов. Он измерял частоту ответов в значимой для организма ситуации (например, частоту актов еды), затем сравнивал эту величину с другой независимой величиной (например, частотой нажатия на рычаг). Полученные им результаты говорят о том, что подкрепление возникает всякий раз, когда ответы с низкой независимой частотой (нажатия на рычаг) совпадают — в определенных границах — со стимулами, которые управляли осуществлением ответов с высокой независимой частотой (еда).
Остроумная постановка эксперимента подтвердила эту точку зрения; один из этих опытов особенно показателен.
,„ т*Бы«?-И созданы такие Условия для крыс, которые вызывали в одном случае большую вероятность питья, чем бега, а в другом - большую вероятность бега, чем питья. У тех же самых животных бег служил подкреплением для питья, а питье — подкреплением для бега. Такие отноше-
Отключение наказания
Рис. XVI-2. Опыты с оперантными условными рефлексами (крысы). Рисунок показывает, что число лизаний, необходимых для поворота колеса, зависит от 1) среднего числа нажатий на рычаг в серии; 2) средней продолжительности лизания; 3) средней продолжительности побе-жек. Треугольник в левой части верхнего рисунка означает исходную продолжительность лизания (Premack, 1965).
ния означали, что «вознаграждался» попросту любой ответ, который сам П° ™т о» вероятным, чем другой» (Premack, 1962, р 255-
рис. AV1-2). ** '
Очень интересен эксперимент, посвященный изучению активности животного в приспособлении с колесом, которое было снабжено тормозом и механизмом, прекращающим поступление жидкости.
«Преобладание питья над бегом обеспечивалось путем отключения этого механизма, освобождением колеса и предоставлением возможности чаще пить, чем бегать. Обратное достигалось остановкой колеса включением механизма, прекращающего поступление жидкости, и предоставлением возможноеги крутить колесо, то есть бегать чаще, чем пить» (Pre-
llluCIVj lyo^jj p. ijODJ,
К сожалению, Примак рассматривает только связь между ответами. Ему не удалось полностью выявить те непосредственные операции, которые определяют ответ. Ответ в ситуации оперантных условных реакций указывает на то, что организм действует в зависимости от данной ситуации. Действие (как об этом говорилось в гл. XIII) подготавливается ие набором мышечных сокращений (движений) организма, а совокупностью внешних условий, вызывающих это движение. В действительности оперантный «ответ» как показатель действия является одним из компонентов этой совокупности. Следовательно, «частота ответа» — объект изучения Примака — имеет отношение не столько к быстроте движений, сколько к той скорости, с которой некоторые действительно наблюдаемые последствия этих движений могут быть зарегистрированы организмом. Например, в одних экспериментах наблюдалась обезьяна Цебус. Эта обезьяна прекрасно умела чмокать губами, кружиться в клетке и кувыркаться; все это были иррелевантпые движения, которые не должны были регистрироваться в данной ситуации как ответы, поскольку объектом изучения были манипуляции с рычагом, дверью и корзиной. Даже частные движения, включенные в эти действия, были совершенно несущественны в этих экспериментах — обезьяна могла пользоваться для выполнения действия правой или левой рукой, ногами или даже головой.
Короче говоря, оперантные условные ответы фактически представляют собой звенья какой-то последовательности, часть целого действия. Следовательно, вклад Примака в теорию научения состоит в том, что он установил, что частота осуществления последовательных действий определяет отношение «средства — цели». Таким образом, степень разнообразия действия может определяться количеством связанных с ситуацией последствий поведения, согласующихся с намерением, хотя, вероятно, частота ответа является не единственной переменной, определяющей это разнообразие. В данный момент мы можем установить по крайней мере, что при прочих равных условиях организм стремится управлять своими действиями, не просто уменьшая несоответствие между намерением и результатом поведения, а активно создавая такое соответствие. Достижение этого соответствия является не случайным: поведение строится таким образом, что последовательность звеньев действия организуется по законам иерархии — более близкие цели формируются в системе более отдаленных. По существу, эта иерархическая организация действия создает план или программу. Важность планов для организации поведения уже подробно обсуждалась в работе Миллера, Галантера и Прибрама (1965). Здесь я рассмотрю лишь один аспект этой проблемы, а именно значение планов для решения проблемы «средства — цели» и теории выполнения действия в целом.
ЗНАЧЕНИЕ СТИМУЛА И ФОРМИРОВАНИЕ ПЛАНОВ
В книге «Планы и структура поведения» (Миллер, Галантер, Прибрам, 1965) обсуждались два аспекта проблемы мотивации: планы и значимость поведения. Планы строго направляют поведение, то есть выбор программ выполнения этих планов. Значимость играет несколько иную, менее специализированную роль в запуске планов, их выполнении и завершении. Если рассматривать значимость как фактор, определяющий выполнение и завершение действия, то понятие значимости поведения становится более ясным. Таким образом, эффект действия, подкрепляющий его результаты, обнаруживает две особенности: он может обеспечивать информацию, то есть сокращать количество неопределенности в ситуации или направлять поведение организма, определяя его значимость (рис. XVI-1). Рассмотрим две эти особенности подкрепляющего эффекта действия более подробно.
Во второй части книги мы показали, что сенсорные возбуждения вызывают длительные изменения в работе центральной нервной системы. Возникшие констелляции нервных процессов могут быть описаны как процессы, происходящие в сенсорном, «входе». Если эти сенсорные потоки адресуются к одной из «компетентных» систем, они превращаются в воспринимаемую информацию. Таким образом, количество воспринимаемой информации может быть определено как величина совпадения между входом информации и компетентностью систем. Это определение следует из теории информации, согласно которой количество воспринимаемой информации соответствует количеству информации, передаваемой по каналам, пропускная способность которых соответствует нервной компетентности.
В гл. XIV, однако, было отмечено, что мобилизация компетентности организма зависит от гибкого, способного к модификациям механизма, который описан в гл. XV как процесс подкрепления, ведущий к завершению поведенческого акта. Необходимость в завершении действия возникает потому, что нервный субстрат поведения (по крайней мере у млекопитающих) не содержит локальных механизмов, работа которых автоматически ведет к выполнению акта. Вместо этого существуют механизмы, запускающие частные виды активности, связанные с различными отделами нервной системы; для выполнения акта необходима интеграция, организация этих частных видов активности. Такое распределение частных функций, очевидно, свойственно всей нервной системе, и в главах VI, VII и VIII мы рассматривали влияние этого неврологического факта на процесс переработки сенсорной информации (и необходимость таких явлений, как топографическая трансформация и т. д.). Теперь я хочу добавить к этому следующий важный вывод: переработка сенсорной информации, поскольку она является подкреплением, формирует
вначение стимула. Как известно, раньше все проблемы психологии сводились к двум вопросам: какова природа сходства стимулов и какова природа подкрепления. В действительности же это вовсе не две проблемы: сходство и подкрепление представляют любой одно и то же явление, хотя в одном случае оно описывается преимущественно на языке стимулов (сходство), а в другом— главным образом на языке ответов (подкрепление). Подкрепление последовательно увеличивает способность к различению стимулов и уменьшает их генерализацию; процесс различения стимулов, то есть приобретения ими определенного значения, и есть подкрепление.
Нервные процессы, участвующие, согласно этой точке зрения, в механизме научения, будут коротко описаны ниже.
«Возможно, что эта модель является прекрасным описанием того, что представляет собой подкрепление для организма. Этот нервный механизм в силу иерархической природы его избирательного контроля над его же собственными модификациями допускает изменение Образа результата в ходе последовательных актов поведения. Всякий раз, когда поступающая информация такова, что не происходит полного совпадения этой информации с Образом результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается. Таким образом, организм может в относительно неизменных или мало изменяющихся внешних условиях осуществлять поиск во внешней среде той дополнительной информации, которая ему необходима для уменьшения неопределенности. Эта нервная модель могла бы быть ответственной за процесс поиска информации организмом, нуждающимся в такой информации, до тех пор, пока корригирующие изменения в Образе результата ие прекратятся, то есть до тех пор, пока не будет достигнута стабильность» (Pribram, 19606, р. 8).
Акты рассматривания, принюхивания, прислушивания, ощупывания и т. п. являются, по сути дела, подкрепляющей активностью, с того момента, как организм начал выполнение задачи. Обезьяны в процессе решения задачи отказываются от пищи, которая дается им в награду за правильный ответ, потому что их защечные мешки и руки полны пищей, и все же они будут упорно продолжать решение задачи. Так, обезьяна будет засовывать в свой защечный мешок земляной орех, который она получает в награду за правильное выполнение задания, только для того, чтобы потом снова вытащить и съесть его, когда она совершит свою следующую ошибку. Главным фактором, управляющим поведением, становится не пища, а стремление получить информацию. Однако, для того чтобы информация стала фактором, регулирующим поведение, то есть чтобы информация етала значимой для организма, обезьяна должна превратить поступающую информацию в последовательные информационные звенья, связанные с ее компетентностью и стремлением к завершению задачи, подобно тому, как в пищеварительной системе заглатывание пищи предшествует ее перевариванию. Таким
образом, значение стимула формируется иерархически организованным механизмом, перерабатывающим информацию.
В главах XII и XIII проводилось подробное сравнение сенсорных и моторных механизмов мозга. Чему соответствует в моторном механизме процесс формирования значения, когда информация перерабатывается с помощью сенсорного механизма,? Можно предположить, что в моторном механизме про-даходит иерархический процесс, аналогичный тому, который Характерен для сенсорных систем. Образ результата форми-пувтся не «объектами» или «интересами», а с помощью тех факторов, которые продуцируются самим действующим организмом. Эти факторы должны обусловливать то стремление к завершению действия, которое подготавливает моторные механизмы к результату. Более того, благодаря работе быстродействующего мозжечкового механизма Образ результата предвосхищает действие. Итак, известно, что: 1) нервный механизм ©следствие его избирательного контроля над его же собственными модификациями допускает изменение Образа Результата в ходе последовательных актов поведения и что 2) всякий раз, когда «не происходит полного совпадения поступающей информации с Образом Результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается... до тех пор, пока корригирующие изменения в Образе Результата не прекратятся»; следовательно, любая последовательность предвосхищающих образов, но существу, представляет \:обой программу или План. Таким образом, достижение результата осуществляется в процессе выполнения действия, и, признав это, мы тем самым признаем теорию, объясняющую выполнение действия через результат. Эта теория объясняет различия в функциях подкрепляющих агентов во время научения (когда они обеспечивают информацию) и во время осуществления действия (когда они оценивают и управляют поведением). По крайней мере один класс переменных — частота ответов, — как выяснилось, играет главную роль в определении тех условий, при которых организм больше не обучается, хотя и продолжает выполнять действие по обратной схеме: вместо «средства — цель» — «цель — средства». Выполнение действия достигается благодаря иерархической природе процессов подкрепления (на языке стимулов — благодаря процессам различения): значения возникают, если информация по иерархическим законам перерабатывается в сенсорных системах, а планы и программы формируются в процессе переработки информации в предвосхищающем моторном механизме. Следующая (четвертая) часть книги содержит подробное изложение неврологии тех процессов, которые лежат в основе формирования значения и планирования, в ней описывается взаимодействие рецепторных и моторных мозговых механизмов и каждого из них с мозговыми механизмами других существ.
ЗАКЛЮЧЕНИЕ
Прежде чем продолжить изложение, подведем итог сказанному. В первой части книги обсуждался двухпроцессный кодирующий механизм работы мозга, который имеет дело с состояниями и с тем, как протекают операции на фоне этих состояний. Состояния кодируются в виде микроструктуры медленных потенциалов, которые генерируются в соедипениях нейронов. Перекодирование операций осуществляется посредством нервных импульсов, которые возникают при сдвиге этих состояний; импульсы продолжаются до тех пор, пока не'будет восстановлено исходное состояние. Модификации микроструктурных синаптических процессов (память) бывают трех видов: длительные, временные и мгновенные.
Во второй части двухпроцессный механизм работы мозга рассматривался в связи с субъективным опытом. Помимо детекторов (врожденных) признаков и особого аналитического (изменчивого) механизма, нервный аппарат обладает гибкой системой распределения информации. Это свойство обеспечивается синап-тической микроструктурой медленных потенциалов и в функциональном отношении напоминает те механизмы переработки зрительной информации, которые называются голограммами.
Кроме того, во второй части было описано, каким образом с помощью билатеральной симметричной сенсорной стимуляции конструируется образ внешней «реальности», а также то, каким образом такие специфические состояния, как голод и жажда, настораживание и сонливость, активное стремление к цели и пассивность, обусловливаются работой нейронных и химических механизмов ствола мозга. Каждый механизм ствола мозга состоит из двух частей: активирующей и тормозящей; активирующая часть связана с «инстинктивными», мотивационными ощущениями, а тормозящая — с «аффективными», эмоциональными ощущениями. Однако эти инстинктивные потребности, аффекты и чувство интереса имеют более широкую неврологическую основу, чем только механизмы ствола мозга; она включает большое число контролирующих кортикальных мозговых процессов, в том числе и такие, которые контролируют аппараты ствола мозга и сенсорные системы. Здесь мы развивали «кибернетическую» теорию мотиваций и эмоций, основанную на двухпроцес-сном механизме функционирования мозга.
В третьей части мы анализировали нейронные механизмы регуляции поведения. Мы проводили различие между движением и действием. Движение, состоящее из мышечных сокращений, контролируется двухпроцессным механизмом, сходным с тем, который контролирует сенсорные процессы. Это сходство основано на существовании в рефлекторной организации системы эфферентных волокон, которая проводит сигналы от центрального нервного аппарата к рецепторам, расположенным в мышечной
ткани. Эта система волокон организована по принципу кольцевого рефлекторного сервомеханизма Т — О — Т — Е, а не по принципу дуги «стимул — ответ». В процессе контроля за сокращением мышц должны, следовательно, включаться сигналы, идущие не только от сокращающейся мышцы, но и от этих рецепторов: если информация от них не поступает, у укороченной мышцы возникает «молчащий период» в возбуждении рецепторов, что мешает плавному выполнению движения, В действительности движение может контролироваться только посредством изменений в установках, которые воздействуют на спонтанные разряды мышечных рецепторов, подобно тому как работа отопительной системы в доме контролируется регуляцией температуры в термостате.
В данной части обсуждалось значение этого типа контроля над выполнением действий. Действия определяются как последовательности движений, обусловленные внешней средой. Озадачивающие результаты экспериментов, посвященных изучению роли двигательных отделов коры мозга, нашли свое объяснение, когда были получены данные, подтвердившие важность сенсорной коры для действия и показавшие, что моторный образ (представляющий собой статическую часть двухпроцессного механизма) связан с рядом факторов, вызывающих возбуждение мышечных рецепторов, а не с какой-то общей мозговой функцией, контролирующей специфику работы тех ияи иных мышечных волокон. Этот образ по своей природе подобен голограмме и принципиально не отличается от других сенсорных образов. Однако имеется одно важное различие, а именно: аппараты, связанные с действием, в отличие от сенсорных аппаратов характеризуются поступлением информации от мозжечка, где осуществляется мгновенная оценка предстоящего следующего звена действия, если действие уже запущено и не должно прерываться. Поэтому моторные механизмы кодируют результаты действия, а не ощущения или восприятия.
Нейронная основа модификации поведения обсуждалась с точки зрения результата. Способность к модификации поведения во времени зависит от того, что элементы, лежащие в основе моторного образа, компетентности организма для выполнения того или другого Акта, распределяются в нервном субстрате точно так же, как и элементы (биты информации) — в сенсорном образе. Эти элементы комбинируются, интегрируются в различные структуры, причем возникают подвижные комбинации. Процесс подкрепления делает эту интеграцию более длительной. Можно предположить, что подкрепление «индуцирует» непрерывные изменения в нейронных соединениях. Однако эти изменения могут приводить к устойчивым модификациям поведения только тогда, когда стимулируемое у организма стремление к завершению действия не разрушается вследствие отвлечения. Существуют
два защитных мозговых механизма: один — регистратор подкрепления соответствия результатов поведения замыслу. Эта функция осуществляется с помощью механизма, который позволяет «внутреннему эху» освободиться от влияния последовательности новых событий. Другой механизм оценивает результаты, которые больше не подкрепляются. Эти нервные механизмы обеспечивают организму устойчивое состояние готовности к подкреплению, благодаря чему и происходит научение.
Вследствие этого прежнее поведение продолжается (хотя и остается способным к новым изменениям с помощью подкреплений) тогда, когда осуществление действия не дает ничего нового, никакой новой информации. Теория, объясняющая выполнение действия с помощью результатов, исходит из этого различения эффектов подкрепления во время научения и во время выполнения действия. Эта теория подтверждается данными бихевиори-стов относительно возможности перестановки членов в системе «средства — цель» (например, результатами экспериментов с уга-шением), а также наблюдениями над наркоманами и фактами, показывающими, что частота ответа влияет на взаимоотношение между типами поведения. Все эти факты прямо подводят нас к рассмотрению того, каким образом мозг формирует значение и контролирует планы; эти два процесса существенно зависят от достижения результата.
Таким образом, мы пришли к выводу, что исследование регуляции поведения должно быть сосредоточено не на изменении поведения организма в результате влияния внешних условий, а на изменении этих внешних условий посредством последовательного поведения, осуществления действий и достижения результата. Существует одно важное различие между восприятием и чувствами, с одной стороны, и действием — с другой. Восприятие без вмешательства действия имеет тенденцию к простой ассимиляции внешних условий организмом (в том смысле, в котором употреблял этот термин Пиаже); чувства же, даже если они находят внешнее выражение, имеют тенденцию быть простой проекцией организма во внешнюю среду (как это понимал Фрейд). Действие, скорее всего, представляет собой процесс достижения согласования (или аккомодации, по терминологии Пиаже) между восприятием организма и его чувствами.
Действие имеет и другие последствия. Благодаря действиям достигается согласование между организмами. Именно эта коммуникативная функция действия и является предметом обсуждения в четвертой части книги. В этой сфере особую проблему составляет проблема реализации человека в результатах его действий. Рассмотрим же теперь, каковы те нервные механизмы, которые обеспечивают коммуникативную функцию действий, а это необходимо нам, чтобы выяснить, что же делает человека Homo Sapiens.
РЕЗЮМЕ
Выполнение действия состоит из двух фаз: 1) продолжение процесса научения, изменяющего компетентность организма, и 2) продолжение действия для достижения результата. Теория, объясняющая выполнение действия через результат, основана на экспериментах с угашением актов поведения, в частности на опытах с привыканием к наркотикам и опытах, показавших, что частота ответа предопределяет взаимоотношение звеньев в системе «средства — цель» в ситуации подкрепления.
ЧАСТЬ ЧЕТВЕРТАЯ