Классическое кондиционирование - Classical conditioning

Классическая кондиционирования (также известный как Pavlovian или ответчик кондиционирование ) представляет собой поведенческий механизм , в котором биологически мощный стимул (например , пищевые продукты) в паре с ранее нейтральным стимулом (например, звонок). Это также относится к процессу обучения, который является результатом этого соединения, посредством которого нейтральный стимул вызывает реакцию (например, слюноотделение), которая обычно аналогична той, которая вызывается мощным стимулом.

Классическое обусловливание отличается от оперантного обусловливания (также называемого инструментальным обусловливанием ), посредством которого сила произвольного поведения изменяется путем подкрепления или наказания. Однако классическое обусловливание может влиять на оперантное обусловливание по-разному; в частности, классически обусловленные стимулы могут служить для усиления оперантных реакций.

Классическое кондиционирование было впервые подробно изучено Иваном Павловым , который проводил эксперименты с собаками и опубликовал свои результаты в 1897 году. Во время исследования пищеварения , проведенного российскими физиологами , Павлов заметил, что собаки, служившие его подопытными, пускали слюни, когда им подавали мясо.

Классическая обусловленность - это базовый поведенческий механизм, и его нейронные субстраты теперь начинают понимать. Хотя иногда бывает трудно отличить классическое обусловливание от других форм ассоциативного обучения (например, инструментального обучения и ассоциативной памяти человека ), ряд наблюдений дифференцирует их, особенно непредвиденные обстоятельства, при которых происходит обучение.

Вместе с оперантным обусловливанием классическое обусловливание стало основой бихевиоризма , школы психологии, которая доминировала в середине 20-го века и до сих пор оказывает большое влияние на практику психологической терапии и изучение поведения животных. Классическое кондиционирование применялось и в других областях. Например, это может повлиять на реакцию организма на психоактивные препараты, регуляцию голода, исследования нейронной основы обучения и памяти, а также на определенные социальные явления, такие как эффект ложного консенсуса .

Определение

Классическое обусловливание возникает, когда условный раздражитель (CS) сочетается с безусловным раздражителем (US). Обычно условный раздражитель представляет собой нейтральный раздражитель (например, звук камертона), безусловный раздражитель является биологически мощным (например, вкус еды), а безусловный ответ (УР) на безусловный раздражитель является неизученной рефлекторной реакцией. (например, слюноотделение). После повторения спаривания организм проявляет условный ответ (УС) на условный раздражитель, когда условный раздражитель предъявляется отдельно. (Условный ответ может возникнуть только после одного спаривания.) Таким образом, в отличие от UR, CR приобретается через опыт, и он также менее постоянен, чем UR.

Обычно условный ответ похож на безусловный, но иногда он совсем другой. По этой и другим причинам большинство теоретиков обучения предполагают, что условный раздражитель является сигналом или предсказанием безусловного раздражителя, и продолжают анализировать последствия этого сигнала. Роберт А. Рескорла представил четкое резюме этого изменения в мышлении и его последствий в своей статье 1988 года «Павловское кондиционирование: это не то, что вы думаете». Несмотря на широкое признание, тезис Рескорла не может быть оправдан.

Классическое обусловливание отличается от оперантного или инструментального обусловливания : в классическом обусловливании поведение модифицируется посредством ассоциации стимулов, как описано выше, тогда как в оперантном обусловливающем поведении модифицируется эффект, который они производят (например, вознаграждение или наказание).

Процедуры

Иван Павлов исследование рефлекторной установки собаки

Павлова

Самая известная и самая тщательная ранняя работа по классической обусловленности была сделана Иваном Павловым , хотя Эдвин Твитмайер опубликовал некоторые связанные с этим выводы годом ранее. Во время своих исследований физиологии пищеварения у собак Павлов разработал методику, которая позволила ему изучать пищеварительные процессы животных в течение длительных периодов времени. Он перенаправил пищеварительные жидкости животного за пределы тела, где их можно было измерить. Павлов заметил, что у его собак началось слюноотделение в присутствии техника, который обычно их кормил, а не просто слюноотделение в присутствии еды. Павлов назвал упреждающее слюноотделение собак «психическим секретом». Проверив эти неформальные наблюдения в качестве экспериментальной проверки, Павлов предъявил стимул (например, звук метронома), а затем дал собаке корм; после нескольких повторений у собак начиналось выделение слюны в ответ на раздражитель. Павлов пришел к выводу, что если особый стимул в окружении собаки присутствовал, когда собаке давали еду, то этот стимул мог ассоциироваться с едой и сам по себе вызывать слюноотделение.

Классическая диаграмма кондиционирования

Терминология

В экспериментах Павлова безусловным раздражителем (УЗ) была еда, потому что ее эффекты не зависели от предыдущего опыта. Звук метронома изначально является нейтральным стимулом (NS), потому что он не вызывает слюноотделение у собак. После кондиционирования звук метронома становится условным раздражителем (КС) или условным раздражителем; потому что его эффекты зависят от его связи с едой. Точно так же и реакции собаки следуют той же договоренности - условной и безусловной. Условный ответ (CR) , является ответом на условный раздражитель, в то время как безусловный ответ (УР) соответствует безусловный раздражитель.

Павлов сообщил много основных фактов о кондиционировании; например, он обнаружил, что обучение происходило наиболее быстро, когда интервал между CS и появлением США был относительно коротким.

Как отмечалось ранее, часто думают, что условный ответ является копией безусловного ответа, но Павлов отметил, что слюна, производимая CS, отличается по составу от слюны, производимой в США. Фактически, CR может быть любой новой реакцией на ранее нейтральную CS, которая может быть четко связана с опытом условных отношений CS и США. Также считалось, что для возникновения обусловленности необходимы повторяющиеся пары, но многие CR можно выучить за одно испытание, особенно в обучении условию страха и отвращения вкуса .

Диаграмма, представляющая прямое кондиционирование. Временной интервал увеличивается слева направо.

Прямое кондиционирование

Обучение происходит быстрее всего при форвардном обучении. Во время прямого кондиционирования начало CS предшествует наступлению США, чтобы сигнализировать о том, что США последуют за ним. Двумя распространенными формами прямого кондиционирования являются кондиционирование задержки и трассировки.

  • Согласование с задержкой : в кондиционировании с задержкой CS представлена ​​и перекрывается представлением США. Например, если человек слышит зуммер в течение пяти секунд, в течение которых ему в глаза вдувается воздух, он моргает. После нескольких сочетаний зуммера и затяжки человек будет моргать только на звук зуммера. Это кондиционирование с задержкой.
  • Кондиционирование трассы : во время согласования трассы CS и US не перекрываются. Вместо этого CS начинается и заканчивается до того, как будут представлены США. Период без стимулов называется интервалом следа или интервалом кондиционирования . Если в приведенном выше примере с зуммером затяжка произошла через секунду после того, как звук зуммера прекратился, это будет трассировка кондиционирования с интервалом трассировки или кондиционирования в одну секунду.

Форвард Conditioning.svg

Одновременное кондиционирование

Классические кондиционирующие процедуры и эффекты

Во время одновременного кондиционирования CS и US появляются и прекращаются одновременно. Например: если человек слышит звонок и в то же время ему в глаза вдувается воздух, и повторяющиеся пары, подобные этому, привели к тому, что человек моргает, когда слышит звонок, несмотря на отсутствие дуновения воздуха, это демонстрирует, что одновременное кондиционирование имеет произошел. Одновременное кондиционирование.svg

Кондиционирование второго и высшего порядка

Кондиционирование второго или более высокого порядка осуществляется в два этапа. Сначала нейтральный стимул («CS1») сигнализирует нам посредством прямого кондиционирования. Затем второй нейтральный стимул («CS2») соединяется с первым (CS1) и дает свой собственный условный ответ. Например: звонок можно сочетать с едой, пока звонок не вызовет слюноотделение. Если затем соединить свет с колокольчиком, то он также может вызвать слюноотделение. Звонок - это CS1, а еда - из США. Свет становится CS2, когда он соединяется с CS1.

Second Order Conditioning.svg

Обратное кондиционирование

Обратное кондиционирование происходит, когда CS немедленно следует за США. В отличие от обычной процедуры кондиционирования, в которой CS предшествует US, условный ответ, даваемый CS, имеет тенденцию быть тормозящим. Предположительно это происходит потому, что CS служит сигналом о прекращении действия США, а не сигналом о том, что США вот-вот появятся. Например, поток воздуха, направленный в глаз человека, может сопровождаться звуком зуммера.

Временное кондиционирование

При временном кондиционировании УЗИ проводится через равные промежутки времени, например каждые 10 минут. Считается, что кондиционирование происходит, когда CR имеет тенденцию происходить незадолго до каждого УЗ. Это говорит о том, что у животных есть биологические часы, которые могут служить CS. Этот метод также использовался для изучения способности времени у животных (см. Познание животных ).

В приведенном ниже примере показано временное кондиционирование, например, УЗИ, такие как еда голодной мыши, просто доставляется по регулярному расписанию, например, каждые тридцать секунд. После достаточного воздействия у мыши начнется слюноотделение непосредственно перед доставкой еды. Это затем делает его временным условием, как будто мышь приучена к течению времени. Temporal Conditioning.svg

Процедура нулевой непредвиденной ситуации

В этой процедуре CS сопряжен с США, но США также встречается в другое время. Если это произойдет, прогнозируется, что США, скорее всего, произойдет в отсутствие CS. Другими словами, CS не «предсказывает» США. В этом случае кондиционирование не выполняется, и CS не вызывает CR. Этот вывод о том, что прогнозирование, а не сочетание CS-US является ключом к формированию кондиционирования, сильно повлиял на последующие исследования и теорию кондиционирования.

Вымирание

В процедуре вымирания CS многократно предъявляется в отсутствие США. Это делается после того, как CS была настроена одним из описанных выше методов. Когда это будет сделано, частота CR в конечном итоге вернется к предтренировочным уровням. Однако угасание не устраняет эффектов предшествующего кондиционирования. Это демонстрируется спонтанным восстановлением - когда происходит внезапное появление (CR) после исчезновения - и другими связанными явлениями (см. «Восстановление после исчезновения» ниже). Эти явления можно объяснить, постулируя накопление торможения при предъявлении слабого стимула.

Наблюдаемые явления

Получение

Во время захвата CS и US объединяются в пары, как описано выше. Степень кондиционирования можно отслеживать с помощью тестовых испытаний. В этих тестовых испытаниях CS представлен отдельно и измеряется CR. Одной пары CS-US может быть достаточно, чтобы получить CR на тесте, но обычно требуется несколько пар, и условный ответ на CS постепенно увеличивается. Это повторяющееся количество попыток постепенно увеличивает силу и / или частоту CR. Скорость кондиционирования зависит от ряда факторов, таких как природа и сила как CS, так и США, предыдущий опыт и мотивационное состояние животного . По мере приближения к завершению процесс замедляется.

Вымирание

Если CS представлен без США и этот процесс повторяется достаточно часто, CS в конечном итоге перестанет вызывать CR. В этот момент говорят, что CR «погашен».

Классическое кондиционирование - extinction.svg

Внешнее торможение

Внешнее торможение может наблюдаться, если сильный или незнакомый стимул предъявляется непосредственно перед или одновременно с CS. Это вызывает снижение условной реакции на КС.

Восстановление после исчезновения

Несколько процедур приводят к восстановлению CR, который сначала был кондиционирован, а затем погашен. Это показывает, что процедура гашения не устраняет эффекта кондиционирования. Эти процедуры следующие:

  • Повторное приобретение: если CS снова соединяется с США, CR снова приобретается, но это второе получение обычно происходит намного быстрее, чем первое.
  • Спонтанное выздоровление : спонтанное выздоровление определяется как повторное появление ранее угасшей условной реакции после периода отдыха. То есть, если CS тестируется позже (например, через час или день) после исчезновения, он снова вызовет CR. Эта обновленная КЛ обычно намного слабее КЛ, наблюдавшейся до исчезновения.
  • Растормаживание : если CS тестируется сразу после угасания и возник интенсивный, но ассоциативно нейтральный стимул, может произойти временное восстановление условного ответа на CS.
  • Восстановление: если УЗ, использованный для кондиционирования, предъявляется субъекту в том же месте, где произошло кондиционирование и угасание, но без присутствия CS, CS часто вызывает реакцию при последующем тестировании.
  • Обновление: обновление - это повторное появление условной реакции после исчезновения, когда животное возвращается в среду, в которой была приобретена условная реакция.

Обобщение стимулов

Говорят, что обобщение стимула происходит, если после того, как конкретная CS вызвала CR, обнаруживается, что аналогичный тестовый стимул вызывает такой же CR. Обычно чем больше тестовый стимул похож на CS, тем сильнее CR будет на тестовый стимул. И наоборот, чем больше тестовый стимул отличается от CS, тем слабее будет CR или тем больше он будет отличаться от наблюдаемого ранее.

Различение стимулов

Наблюдается различение стимулов, когда один стимул («CS1») вызывает один CR, а другой стимул («CS2») вызывает либо другой CR, либо вообще не вызывает CR. Это может быть вызвано, например, объединением CS1 с действующим US и представлением CS2 без US.

Скрытое торможение

Скрытое торможение относится к наблюдению, что знакомому стимулу требуется больше времени, чтобы стать CS, чем новому стимулу, чтобы стать CS, когда стимул сочетается с эффективным УЗИ.

Условное подавление

Это один из наиболее распространенных способов измерения силы обучения при классической тренировке. Типичный пример этой процедуры следующий: крыса сначала учится нажимать на рычаг посредством оперантного кондиционирования . Затем в серии испытаний крысу подвергают воздействию CS, света или шума, а затем - легкому электрическому удару в США. Развивается связь между CS и US, и крыса замедляет или прекращает нажимать на рычаг, когда CS включается. Скорость нажатия во время CS измеряет силу классического кондиционирования; то есть чем медленнее жмет крыса, тем сильнее ассоциация CS и США. (Медленное нажатие указывает на условную реакцию «страх», и это пример условной эмоциональной реакции; см. Раздел ниже.)

Условное торможение

Обычно используют три фазы кондиционирования.

Фаза 1

CS (CS +) соединяется с US до тех пор, пока не будут достигнуты асимптотические уровни CR.

Фаза 2

Испытания CS + / US продолжаются, но они чередуются с испытаниями, в которых CS + сочетается со вторым CS (CS-), но не с испытаниями в США (т.е. испытания CS + / CS-). Обычно организмы показывают CR в исследованиях CS + / US, но перестают отвечать в исследованиях CS + / CS-.

Фаза 3

  • Суммирующий тест для условного торможения: CS- из фазы 2 представляется вместе с новым CS +, который был обусловлен, как в фазе 1. Условное торможение обнаруживается, если реакция на пару CS + / CS- меньше, чем на только CS +. .
  • Тест замедления на условное торможение: CS- из фазы 2 соединен с US. Если произошло условное торможение, скорость приобретения предыдущего CS- должна быть меньше, чем скорость приобретения, которая была бы обнаружена без лечения фазы 2.

Блокировка

Эта форма классической обусловленности включает две фазы.

Фаза 1

CS (CS1) сопряжен с US.

Фаза 2

Соединение CS (CS1 + CS2) связано с US.

Тестовое задание

Для каждой CS (CS1 и CS2) выполняется отдельный тест. Эффект блокировки наблюдается в отсутствии условного ответа на CS2, предполагая, что первая фаза обучения заблокировала приобретение второй CS. Классическое кондиционирование - blocking.svg

Теории

Источники данных

Эксперименты по теоретическим вопросам кондиционирования в основном проводились на позвоночных, особенно на крысах и голубях. Тем не менее, кондиционирование также изучается у беспозвоночных, и очень важные данные о нервных основах кондиционирования были получены в экспериментах с морским слизнем, Aplysia . В большинстве соответствующих экспериментов использовалась классическая процедура кондиционирования, хотя также использовались инструментальные (оперантные) эксперименты по обусловливанию , и сила классического обусловливания часто измерялась через его оперантные эффекты, такие как условное подавление (см. Раздел «Явления» выше) и автоформирование .

Теория замещения стимулов

Согласно Павлову, обусловливание включает не приобретение какого-либо нового поведения, а скорее тенденцию старым образом реагировать на новые стимулы. Таким образом, он предположил, что CS просто заменяет США в вызове рефлекторной реакции. Это объяснение называется теорией обусловливания замещения стимулов. Критическая проблема теории замещения стимула состоит в том, что CR и UR не всегда одинаковы. Сам Павлов заметил, что слюна собаки, полученная в виде CR, отличается по составу от слюны, полученной в виде UR. CR иногда даже противоположен UR. Например: безусловная реакция на электрический шок - это увеличение частоты сердечных сокращений, тогда как CS, сопряженная с электрическим током, вызывает снижение частоты сердечных сокращений. (Однако было высказано предположение, что только тогда, когда UR не вовлекает центральную нервную систему , CR и UR противоположны.)

Модель Рескорла – Вагнера

Модель Рескорла – Вагнера (R – W) - это относительно простая, но мощная модель кондиционирования. Модель предсказывает ряд важных явлений, но она также терпит неудачу во многих отношениях, что приводит к ряду модификаций и альтернативных моделей. Однако, поскольку большая часть теоретических исследований обусловливания за последние 40 лет была инициирована этой моделью или реакциями на нее, модель R – W заслуживает здесь краткого описания.

Модель Рескорла-Вагнера утверждает, что существует ограничение на количество обусловливающих факторов, которые могут возникнуть при объединении двух стимулов. Одним из факторов, определяющих этот предел, является природа США. Например: сочетание колокольчика с сочным стейком с большей вероятностью вызовет слюноотделение, чем сочетание колокольчика с куском сухого хлеба, а сухой хлеб, вероятно, подойдет лучше, чем кусок картона. Ключевая идея, лежащая в основе модели R – W, ​​заключается в том, что CS сигнализирует или предсказывает США. Можно сказать, что до кондиционирования субъект удивлен США. Однако после кондиционирования субъект больше не удивляется, потому что CS предсказывает приход США. (Обратите внимание, что модель может быть описана математически и что такие слова, как «предсказывать», «удивлять» и «ожидать», используются только для объяснения модели.) Здесь работа модели проиллюстрирована краткими отчетами о приобретении, исчезновении и блокировании. Модель также предсказывает ряд других явлений, см. Основную статью о модели.

Уравнение

Это уравнение Рескорла-Вагнера. Он определяет объем обучения, который будет происходить при одной паре обусловливающего стимула (CS) с безусловным стимулом (US). Вышеупомянутое уравнение решается многократно, чтобы спрогнозировать курс обучения на многих таких испытаниях.

В этой модели степень обучения измеряется тем, насколько хорошо CS предсказывает США, что определяется «ассоциативной силой» CS. В уравнении V представляет текущую ассоциативную силу CS, а ∆V - изменение этой силы, которое происходит в данном испытании. ΣV - это сумма сил всех стимулов, присутствующих в ситуации. λ - максимальная ассоциативная сила, которую поддерживает данный США; его значение обычно устанавливается равным 1 при испытаниях, когда США присутствуют, и 0, когда США отсутствуют. α и β - константы, относящиеся к значимости CS и скорости обучения для данного США. Как уравнение предсказывает различные экспериментальные результаты, объясняется в следующих разделах. Подробнее см. В основной статье о модели.

Модель R – W: приобретение

Модель R – W измеряет обусловленность, приписывая «ассоциативную силу» CS и другим локальным стимулам. До того, как CS будет обусловлен, его ассоциативная сила равна нулю. Соединение CS и США вызывает постепенное увеличение ассоциативной силы CS. Это увеличение определяется природой США (например, их интенсивностью). Объем обучения, который происходит во время любой пары CS-US, зависит от разницы между общей ассоциативной силой CS и других стимулов, присутствующих в ситуации (ΣV в уравнении), и максимумом, установленным США (λ в уравнении ). В первой паре CS и US эта разница велика, и ассоциативная сила CS значительно выросла. По мере того, как пары CS-US накапливаются, США становятся более предсказуемыми, и увеличение ассоциативной силы в каждом испытании становится все меньше и меньше. Наконец, разница между ассоциативной силой CS (плюс любой, которая может накапливаться с другими стимулами) и максимальной силой достигает нуля. То есть США полностью предсказаны, ассоциативная сила CS перестает расти, и кондиционирование завершено.

R – W модель: вымирание

Сравнение ассоциированной силы по модели RW в обучении

Ассоциативный процесс, описываемый моделью R – W, ​​также объясняет вымирание (см. «Процедуры» выше). Процедура вымирания начинается с положительной ассоциативной силы CS, что означает, что CS предсказывает появление США. В судебном процессе по вымиранию США не может появиться после CS. В результате этого «удивительного» результата ассоциативная сила CS падает. Вымирание считается полным, когда сила CS достигает нуля; США не прогнозируются, и США не происходит. Однако, если та же самая CS представлена ​​без УЗ, но сопровождается хорошо зарекомендовавшим себя условным ингибитором (КИ), то есть стимулом, который предсказывает отсутствие УЗ (в терминах RW, стимул с отрицательной ассоциативной силой), тогда RW предсказывает, что CS не подвергнется вымиранию (его V не уменьшится в размерах).

Модель R – W: блокировка

Наиболее важным и новым вкладом модели R – W является ее предположение, что обусловливание CS зависит не только от этого CS и его отношения к США, но также и от всех других стимулов, присутствующих в ситуации обусловливания. В частности, модель утверждает, что США предсказывается суммой ассоциативных сил всех стимулов, присутствующих в ситуации обусловливания. Обучение контролируется разницей между этой общей ассоциативной силой и силой, поддерживаемой США. Когда эта сумма сил достигает максимума, установленного в США, кондиционирование заканчивается, как только что описано.

Пояснение R – W феномена блокировки иллюстрирует одно следствие только что сформулированного предположения. При блокировании (см. «Явления» выше) CS1 соединяется с US до тех пор, пока не будет завершено кондиционирование. Затем при дополнительных испытаниях кондиционирования второй стимул (CS2) появляется вместе с CS1, и за обоими следует УЗИ. Наконец, тестируется CS2, и показано, что он не дает ответа, потому что изучение CS2 было «заблокировано» первоначальным изучением CS1. Модель R – W объясняет это тем, что после первоначального кондиционирования CS1 полностью предсказывает США. Поскольку нет никакой разницы между тем, что прогнозируется, и тем, что происходит, никакого нового обучения не происходит в дополнительных испытаниях с CS1 + CS2, следовательно, CS2 позже не дает ответа.

Теоретические вопросы и альтернативы модели Рескорла – Вагнера.

Одна из основных причин важности модели R – W заключается в том, что она относительно проста и дает четкие прогнозы. Проверка этих предсказаний привела к ряду важных новых открытий и значительно расширила понимание обусловленности. Некоторая новая информация подтвердила теорию, но большая часть - нет, и все согласны с тем, что теория в лучшем случае слишком проста. Тем не менее, похоже, что нет единой модели, объясняющей все явления, вызванные экспериментами. Ниже приводится краткое изложение некоторых связанных теоретических вопросов.

Содержание обучения

Модель R – W сводит обусловленность к ассоциации CS и US и измеряет это с помощью одного числа - ассоциативной силы CS. Ряд экспериментальных результатов показывает, что можно узнать больше, чем это. Среди них два явления, описанные ранее в этой статье.

  • Скрытое торможение: если субъект неоднократно подвергается воздействию CS до начала кондиционирования, кондиционирование занимает больше времени. Модель R – W не может объяснить это, потому что предварительная выдержка оставляет силу CS неизменной, равной нулю.
  • Восстановление реакции после исчезновения: Похоже, что что-то остается после исчезновения, что снизило ассоциативную силу до нуля, потому что несколько процедур вызывают повторное появление реакции без дальнейшего кондиционирования.

Роль внимания в обучении

Скрытое торможение может произойти из-за того, что объект перестает фокусироваться на часто наблюдаемой CS, прежде чем он будет соединен с US. Фактически, изменения во внимании к CS лежат в основе двух известных теорий, которые пытаются совладать с экспериментальными результатами, которые усложняют модель R – W. В одном из них, предложенном Николасом Макинтошем , скорость кондиционирования зависит от количества внимания, уделяемого CS, и это количество внимания, в свою очередь, зависит от того, насколько хорошо CS предсказывает США. Пирс и Холл предложили родственную модель, основанную на другом принципе внимания. Обе модели были тщательно протестированы, и ни одна из них не объясняет все экспериментальные результаты. Следовательно, различные авторы пытались создать гибридные модели, сочетающие два процесса внимания. Пирс и Холл в 2010 году объединили свои идеи привлечения внимания и даже предложили возможность включения уравнения Рескорла-Вагнера в интегрированную модель.

Контекст

Как указывалось ранее, ключевая идея кондиционирования состоит в том, что CS сигнализирует или предсказывает US (см. «Процедуру нулевой непредвиденной ситуации» выше). Однако, например, комната, в которой происходит кондиционирование, также «предсказывает» возможность возникновения УЗИ. Тем не менее, комната предсказывает с гораздо меньшей уверенностью, чем сама экспериментальная CS, потому что комната также существует между экспериментальными испытаниями, когда США нет. Роль такого контекста иллюстрируется тем фактом, что собаки в эксперименте Павлова иногда начинали выделять слюну при приближении к экспериментальному устройству, прежде чем они увидели или услышали какой-либо CS. Такие так называемые «контекстные» стимулы присутствуют всегда, и их влияние помогает объяснить некоторые загадочные экспериментальные результаты. Ассоциативная сила контекстных стимулов может быть введена в уравнение Рескорла-Вагнера, и они играют важную роль в компараторных и вычислительных теориях, описанных ниже.

Теория компаратора

Чтобы узнать, что было изучено, мы должны каким-то образом измерить поведение («производительность») в тестовой ситуации. Однако, как слишком хорошо знают ученики, успеваемость в тестовой ситуации не всегда является хорошей мерой того, что было изучено. Что касается обусловливания, есть свидетельства того, что испытуемые в блокирующем эксперименте действительно узнают что-то о «заблокированной» CS, но не могут показать это обучение из-за того, как их обычно тестируют.

«Компараторные» теории кондиционирования «основаны на производительности», то есть они подчеркивают то, что происходит во время теста. В частности, они смотрят на все стимулы, которые присутствуют во время тестирования, и на то, как могут взаимодействовать ассоциации, приобретенные этими стимулами. Чтобы несколько упростить, теории компараторов предполагают, что во время кондиционирования субъект приобретает ассоциации как CS-US, так и контекст-US. Во время теста эти ассоциации сравниваются, и ответ на CS происходит только в том случае, если ассоциация CS-US сильнее, чем ассоциация контекст-США. После того, как CS и США неоднократно объединяются в пары в простом захвате, ассоциация CS-US становится сильной, а связь контекст-США относительно слабой. Это означает, что CS вызывает сильный CR. При «нулевой случайности» (см. Выше) условная реакция слабая или отсутствует, потому что ассоциация контекст-США примерно такая же сильная, как ассоциация CS-US. Блокирование и другие более тонкие явления также можно объяснить с помощью теорий компараторов, хотя, опять же, они не могут объяснить все.

Вычислительная теория

Потребность организма в предсказании будущих событий занимает центральное место в современных теориях обусловливания. Большинство теорий используют ассоциации между стимулами, чтобы делать эти прогнозы. Например: в модели R – W ассоциативная сила CS говорит нам, насколько сильно эта CS предсказывает US. Другой подход к прогнозированию предлагается с помощью таких моделей, как модель, предложенная Галлистелем и Гиббоном (2000, 2002). Здесь ответ не определяется ассоциативными силами. Вместо этого организм записывает время начала и смещения CS и US и использует их для расчета вероятности того, что США последуют за CS. Ряд экспериментов показал, что люди и животные могут научиться определять время событий (см. Познание животных ), а модель Галлистеля и Гиббона дает очень хорошие количественные соответствия множеству экспериментальных данных. Однако недавние исследования показали, что модели, основанные на продолжительности, не могут учитывать некоторые эмпирические данные, а также ассоциативные модели.

Элементные модели

Модель Рескорла-Вагнера рассматривает стимул как единое целое и представляет ассоциативную силу стимула с одним числом без записи того, как это число было достигнуто. Как отмечалось выше, это затрудняет учет в модели ряда экспериментальных результатов. Большая гибкость обеспечивается за счет предположения, что стимул внутренне представлен набором элементов, каждый из которых может переходить из одного ассоциативного состояния в другое. Например, сходство одного стимула с другим можно представить, сказав, что два стимула имеют общие элементы. Эти общие элементы помогают учесть обобщение стимулов и другие явления, которые могут зависеть от обобщения. Кроме того, разные элементы в одном наборе могут иметь разные ассоциации, и их активации и ассоциации могут изменяться в разное время и с разной скоростью. Это позволяет моделям на основе элементов обрабатывать некоторые иначе необъяснимые результаты.

Модель СОП

Ярким примером элементного подхода является модель «СОП» Вагнера. С момента своего появления модель разрабатывалась различными способами, и теперь она в принципе может объяснить очень широкий спектр экспериментальных результатов. Модель представляет любой заданный стимул с большим набором элементов. Время предъявления различных стимулов, состояние их элементов и взаимодействия между элементами - все это определяет ход ассоциативных процессов и поведение, наблюдаемое во время экспериментов с кондиционированием.

Представление СОП о простом кондиционировании иллюстрирует некоторые основы модели СОП. Начнем с того, что модель предполагает, что каждая CS и US представлены большой группой элементов. Каждый из этих элементов стимула может находиться в одном из трех состояний:

  • основная деятельность (А1) - грубо говоря, стимул «обслуживается». (Ссылки на «внимание» предназначены только для облегчения понимания и не являются частью модели.)
  • вторичная активность (A2) - стимул «обслуживается периферически».
  • неактивный (I) - стимул «не принимается во внимание».

Из элементов, которые представляют один стимул в данный момент, некоторые могут находиться в состоянии A1, некоторые - в состоянии A2, а некоторые - в состоянии I.

Когда стимул впервые появляется, некоторые из его элементов переходят из состояния бездействия I в основное действие A1. Из состояния A1 они постепенно переходят в состояние A2 и, наконец, обратно в I. Активность элементов может измениться только таким образом; в частности, элементы из A2 не могут напрямую вернуться в A1. Если элементы и CS, и США одновременно находятся в состоянии A1, между двумя стимулами усваивается ассоциация. Это означает, что если позже CS будет представлен перед США, и некоторые элементы CS войдут в A1, эти элементы активируют некоторые элементы US. Однако элементы США, активируемые косвенно, таким образом, только повышаются до состояния A2. (Можно подумать, что CS пробуждает воспоминания о США, которые не будут такими сильными, как настоящие.) При повторных испытаниях CS-US все больше и больше элементов связываются, и все больше и больше элементов из США переходят в A2. когда включается CS. Это постепенно оставляет все меньше и меньше элементов США, которые могут войти в A1, когда появятся сами США. Как следствие, обучение замедляется и приближается к пределу. Можно сказать, что США «полностью предсказаны» или «не удивительны», потому что почти все его элементы могут войти в A2 только при включении CS, оставляя лишь немногие для формирования новых ассоциаций.

Модель может объяснить результаты, которые объясняются моделью Рескорла-Вагнера, а также ряд дополнительных результатов. Например, в отличие от большинства других моделей, SOP учитывает время. Рост и спад активации элементов позволяет модели объяснить зависящие от времени эффекты, такие как тот факт, что кондиционирование является наиболее сильным, когда CS наступает непосредственно перед США, и что, когда CS возникает после US («обратное кондиционирование»), результат часто является тормозящим CS. Также объясняются многие другие более тонкие явления.

В последние годы появился ряд других мощных моделей, которые включают представления элементов. Они часто включают предположение, что ассоциации включают сеть соединений между «узлами», которые представляют стимулы, ответы и, возможно, один или несколько «скрытых» слоев промежуточных взаимосвязей. Такие модели вступают в контакт с нынешним взрывом исследований в области нейронных сетей , искусственного интеллекта и машинного обучения .

Приложения

Нейронная основа обучения и памяти

Павлов предположил, что обусловливание включает связь между мозговыми центрами условных и безусловных раздражителей. Его физиологическое объяснение обусловливания было отвергнуто, но классическое обусловливание продолжает использоваться для изучения нейронных структур и функций, лежащих в основе обучения и памяти. Формы классического обусловливания, которые используются для этой цели включают в себя, среди прочего, опасаются кондиционирования , ока кондиционирования и ножной сократительную кондиционирование Hermissenda crassicornis , морского слизня. И страх, и обуславливание моргания включают нейтральный стимул, часто тон, который соединяется с безусловным стимулом. В случае кондиционирования моргания США - это воздушная затяжка, в то время как в случае кондиционирования страха США представляют собой угрозу или отвращение, например, шок стопы.

"Доступные данные демонстрируют, что отдельные области мозжечка и связанные с ним области ствола мозга содержат нейроны, которые изменяют свою активность во время кондиционирования - эти области имеют решающее значение для усвоения и выполнения этой простой задачи обучения. Похоже, что другие области мозга, включая гиппокамп , миндалина и префронтальная кора вносят свой вклад в процесс кондиционирования, особенно когда требования задачи становятся более сложными ".

Страх и обусловленность морганием глаз обычно связаны с неперекрывающимися нервными цепями, но имеют общие молекулярные механизмы. Кондиционирование страха происходит в базолатеральной миндалине, которая получает глутаминергический вход непосредственно от таламических афферентов, а также косвенно от префронтальных проекций. Прямых проекций достаточно для кондиционирования задержки, но в случае кондиционирования следа, когда CS должен быть внутренне представлен, несмотря на отсутствие внешнего стимула, необходимы непрямые пути. Передняя поясная извилина является одним из кандидатов на промежуточное кондиционирование следа, но гиппокамп также может играть важную роль. Пресинаптическая активация протеинкиназы А и постсинаптическая активация рецепторов NMDA и его пути передачи сигнала необходимы для кондиционирования связанной пластичности. CREB также необходим для кондиционирования связанной пластичности, и он может индуцировать последующий синтез белков, необходимых для этого. Поскольку рецепторы NMDA активируются только после увеличения пресинаптического кальция (тем самым высвобождая блок Mg2 +), они являются потенциальным детектором совпадений, который может опосредовать пластичность, зависящую от времени спайков . STDP ограничивает LTP ситуациями, когда CS предсказывает US, а LTD - наоборот.

Поведенческая терапия

Некоторые методы лечения, связанные с классическим обусловливанием, - это терапия отвращения , систематическая десенсибилизация и наводнение . Терапия отвращения - это тип поведенческой терапии, предназначенный для того, чтобы заставить пациентов отказаться от нежелательной привычки, связывая эту привычку с сильным неприятным безусловным стимулом. Например, можно использовать лекарство, чтобы связать вкус алкоголя с расстройством желудка. Систематическая десенсибилизация - это лечение фобий, при котором пациента учат расслабляться, подвергаясь все более и более вызывающим тревогу раздражителям (например, злым словам). Это пример контркондиционирования , предназначенный для того , чтобы связать вызывающие страх раздражители с реакцией (расслаблением), несовместимой с тревогой. Наводнение - это форма десенсибилизации, которая пытается устранить фобии и тревоги путем многократного воздействия очень тревожных стимулов до тех пор, пока не исчезнет подкрепление. реакция тревоги вызывает ее угасание. «Затопление» обычно подразумевает действительное воздействие раздражителей, тогда как термин «имплозия» относится к воображаемому воздействию, но эти два термина иногда используются как синонимы.

Кондиционирующая терапия обычно занимает меньше времени, чем гуманистическая терапия.

Обусловленный лекарственный ответ

Стимул, который присутствует при введении или употреблении лекарства, может в конечном итоге вызвать условный физиологический ответ, имитирующий действие лекарства. Иногда так бывает с кофеином; Те, кто часто пьет кофе, могут обнаружить, что запах кофе вызывает у них чувство настороженности. В других случаях условный ответ - это компенсаторная реакция, которая имеет тенденцию нивелировать действие препарата. Например, если лекарство делает организм менее чувствительным к боли, компенсаторная условная реакция может быть реакцией, которая делает пользователя более чувствительным к боли. Эта компенсаторная реакция может способствовать толерантности к лекарствам . Если это так, наркоман может увеличить количество потребляемого наркотика, чтобы почувствовать его действие, и в конечном итоге принять очень большое количество наркотика. В этом случае может возникнуть опасная реакция на передозировку при отсутствии КС, так что условный компенсаторный эффект не наступит. Например, если лекарство всегда вводили в одной и той же комнате, стимулы, создаваемые этой комнатой, могут вызывать условный компенсаторный эффект; тогда может возникнуть реакция передозировки, если препарат вводится в другом месте, где отсутствуют условные раздражители.

Условный голод

Сигналы, которые постоянно предшествуют приему пищи, могут стать условными стимулами для набора телесных реакций, которые подготавливают организм к пище и пищеварению. Эти рефлекторные реакции включают секрецию пищеварительных соков в желудок и секрецию определенных гормонов в кровоток, и они вызывают состояние голода. Примером условного голода является «эффект закуски». Любой сигнал, который постоянно предшествует еде, например часы, указывающие на то, что пора обедать, может вызвать у людей чувство голода, чем до сигнала. Боковой гипоталамус (ЛГ) участвует в инициировании приема пищи. Было показано, что нигростриатальный путь, который включает черную субстанцию, латеральный гипоталамус и базальные ганглии, участвует в мотивации голода.

Обусловленная эмоциональная реакция

Влияние классической обусловленности можно увидеть в эмоциональных реакциях, таких как фобия , отвращение, тошнота, гнев и сексуальное возбуждение. Знакомый пример - условная тошнота, при которой CS - это вид или запах определенной пищи, которые в прошлом приводили к безусловному расстройству желудка. Точно так же, когда CS - это взгляд собаки, а US - боль от укуса, результатом может быть условный страх перед собаками. Пример условной эмоциональной реакции - условное подавление .

В качестве адаптивного механизма эмоциональное кондиционирование помогает защитить человека от вреда или подготовить его к важным биологическим событиям, таким как сексуальная активность. Таким образом, стимул, возникший до сексуального взаимодействия, вызывает сексуальное возбуждение, которое подготавливает человека к половому контакту. Например, сексуальное возбуждение у людей было обусловлено сочетанием стимула, такого как изображение банки с монетами, с просмотром клипа из эротического фильма. Подобные эксперименты с синей рыбой гурами и домашним перепелом показали, что такое кондиционирование может увеличить количество потомства. Эти результаты предполагают, что методы кондиционирования могут помочь повысить уровень фертильности у бесплодных людей и исчезающих видов.

Павловско-инструментальный перевод

Павлово-инструментальный перенос - это феномен, который возникает, когда условный стимул (CS, также известный как «сигнал»), который был связан с поощрительными или отталкивающими стимулами через классическое обусловливание, изменяет мотивационную значимость и оперантное поведение . В типичном эксперименте крысе предлагают сочетания звука и пищи (классическое кондиционирование). Отдельно крыса учится нажимать на рычаг, чтобы получить пищу (оперантное кондиционирование). Сеансы испытаний теперь показывают, что крыса нажимает на рычаг быстрее в присутствии звука, чем в тишине, хотя звук никогда не был связан с нажатием рычага.

Предполагается, что Павлово-инструментальный перенос играет роль в эффекте дифференцированных исходов , процедура, которая усиливает оперантное различение путем объединения стимулов с конкретными исходами.

В популярной культуре

В 1932 роман дивный новый мир по Хаксли , кондиционирование играет роль ключа в поддержании социального мира, особенно в поддержании кастовой системы , на которой базируется общество. Другой пример - в романе-антиутопии Энтони Берджесса « Заводной апельсин » 1962 года, в котором антигерой и главный герой романа , Алекс, проходит процедуру, называемую техникой Людовико , где его кормят раствором, вызывающим сильную тошноту, а затем заставляют наблюдать за актами насилия. . Это делает его неспособным совершать какие-либо насильственные действия, не вызывая аналогичной тошноты. Неумышленно у него также формируется отвращение к классической музыке.

Некоторые общие примеры, которые задействуют классическую теорию обусловливания в действии, включают во многих случаях рекламу. Это тактика, используемая для того, чтобы вызвать ответ. Реклама на игровых шоу - один из многих примеров. В захватывающей и позитивной обстановке игрового шоу зритель может начать генерировать захватывающий отклик на рекламу из-за ассоциации с окружающей средой. Другой пример, очень похожий на эксперимент Павлова, касается еды. Каждый раз, когда человек идет на кухню, он начинает чувствовать голод. Это также может относиться к употреблению определенных продуктов во время просмотра страшного фильма, превращающемуся в ассоциацию ужаса с едой, которая потреблялась во время просмотра фильма. Любая музыка, например рождественская, которая вызывает определенные приятные воспоминания, также связана с классической обусловленностью.

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки