Статистическое овладение языком - Statistical language acquisition

Статистическое овладение языком , раздел психолингвистики развития , изучает процесс, с помощью которого люди развивают способность воспринимать, воспроизводить, понимать и общаться с естественным языком во всех его аспектах ( фонологических , синтаксических , лексических , морфологических , семантических ) посредством использования общих механизмов обучения, работающих на статистических паттернах лингвистического ввода. Статистические методы обучения утверждают, что изучение языка младенцами основано на восприятии закономерностей, а не на врожденной биологической грамматике. Некоторые статистические элементы, такие как частота слов, частые кадры, фонотаксические паттерны и другие закономерности, предоставляют информацию о языковой структуре и значении для облегчения усвоения языка.

Философия

В основе изучения статистического усвоения языка лежат многовековые дискуссии между рационализмом (или его современным проявлением в психолингвистическом сообществе, нативизмом ) и эмпиризмом , причем исследователи в этой области решительно поддерживают последнюю категорию. Нативизм - это позиция, согласно которой люди рождаются с врожденными предметными знаниями, особенно с врожденными способностями к изучению языка. От философов-рационалистов семнадцатого века, таких как Декарт , Спиноза и Лейбниц, до современных философов, таких как Ричард Монтегю, и лингвистов, таких как Ноам Хомский , нативисты постулируют врожденный механизм обучения со специфической функцией овладения языком.

В наше время эта дискуссия в значительной степени окружала поддержку Хомским универсальной грамматики , свойств, которыми должны обладать все естественные языки, посредством спорного постулата устройства для овладения языком (LAD), инстинктивного ментального `` органа '', ответственного за изучение языка, который ищет все возможные языковые альтернативы и выбирает параметры, которые лучше всего соответствуют языковым входам учащегося. Большая часть теории Хомского основана на аргументе о бедности стимулов (POTS), утверждении, что лингвистические данные ребенка настолько ограничены и искажены, что изучение языка только на основе этих данных невозможно. Например, многие сторонники POTS утверждают, что, поскольку дети никогда не сталкиваются с отрицательными доказательствами, то есть информацией о том, какие фразы не грамматичны, языковая структура, которую они изучают, не будет напоминать структуру правильной речи без механизма обучения, зависящего от языка. Аргумент Хомского в пользу внутренней системы, ответственной за язык, биолингвистики, представляет собой трехфакторную модель. «Генетическая одаренность» позволяет младенцу извлекать лингвистическую информацию, определять правила и владеть универсальной грамматикой. «Внешняя среда» подчеркивает необходимость взаимодействия с другими и преимущества языкового воздействия в раннем возрасте. Последний фактор включает свойства мозга, принципы обучения и вычислительную эффективность, которые позволяют детям быстро усваивать язык, используя шаблоны и стратегии.

Этой позиции резко контрастирует эмпиризм, эпистемологическая теория, согласно которой все знания происходят из чувственного опыта. Эта школа мысли часто характеризует зарождающийся ум как tabula rasa , или чистый лист, и во многих отношениях может быть связана с перспективой воспитания в « споре о природе и воспитании ». Эта точка зрения имеет давнюю историческую традицию, которая параллельна традиции рационализма, начиная с философов-эмпириков семнадцатого века, таких как Локк , Бэкон , Гоббс , а в следующем столетии - Юм . Основной принцип эмпиризма состоит в том, что информация в окружающей среде достаточно структурирована, чтобы ее шаблоны можно было обнаружить и извлечь с помощью общих механизмов обучения предметной области. С точки зрения овладения языком эти модели могут быть лингвистическими или социальными по своей природе.

Хомский очень критически относится к этой эмпирической теории овладения языком. Он сказал: «Это правда, что было много работы по попыткам применения статистических моделей к различным лингвистическим проблемам. Я думаю, что были некоторые успехи, но много неудач». Он утверждает, что идея использования статистических методов для овладения языком - это просто имитация процесса, а не истинное понимание того, как усваивается язык.

Экспериментальные парадигмы

Процедура предпочтения разворота (HPP)

Одной из наиболее часто используемых экспериментальных парадигм в исследовании способности младенцев к статистическому усвоению языка является процедура предпочтения поворота головой (HPP), разработанная Стэнфордским психологом Энн Ферналд в 1985 году для изучения предпочтений младенцев в отношении прототипной речи, ориентированной на ребенка, по сравнению с нормальной речью взрослых. В классической парадигме HPP младенцы могут свободно поворачивать голову и сидеть между двумя динамиками с установленными светильниками. Затем мигает свет правого или левого говорящего, когда этот говорящий предоставляет младенцу какой-либо звуковой или лингвистический входной стимул. Надежная ориентация на заданную сторону считается показателем предпочтения входа, связанного с динамиком этой стороны. Эта парадигма с тех пор становится все более важной в изучении восприятия детской речи , особенно для ввода на уровнях выше, чем слоговые фрагменты, хотя и с некоторыми изменениями, включая использование времени прослушивания вместо побочного предпочтения в качестве соответствующей зависимой меры.

Условная процедура поворота головы

Подобно HPP, процедура условного поворота головой также использует дифференциальное предпочтение младенцем данной стороны как указание на предпочтение или, чаще, знакомство с вводом или речью, связанной с этой стороной. Используется в исследованиях просодических пограничных маркеров Gout et al. (2004) , а позднее Werker в своих классических исследованиях категориального восприятия на коренном языке фонем , младенцы обусловлено каким - то привлекательным образом или дисплеем , чтобы посмотреть в одном из двух направлений каждый раз определенный вход слышал, целое слово в случае подагры в и единственный фонематический слог в Werker's. После кондиционирования младенцу предъявляется новый или более сложный ввод, и его способность обнаруживать более раннее целевое слово или различать ввод двух попыток определяется по тому, поворачивают ли они голову в ожидании условного отображения или нет.

Опережающее движение глаз

В то время как HPP и процедура условного поворота головой позволяют наблюдать поведенческие реакции на стимулы и постфактум делать выводы о том, какие ожидания субъекта должны были мотивировать это поведение, парадигма упреждающего движения глаз позволяет исследователям непосредственно наблюдать ожидания субъекта до того, как событие произойдет. . По отслеживания испытуемых движений глаз исследователей смогли исследовать младенческую принятию решений и способы , в которых ребенок закодировать и действуют на вероятностном знании , чтобы сделать прогнозы о своей среде. Эта парадигма также предлагает преимущество сравнения различий в поведении движения глаз в более широком диапазоне возрастов, чем у других.

Искусственные языки

Искусственные языки , то есть маломасштабные языки, которые обычно имеют чрезвычайно ограниченный словарный запас и упрощенные грамматические правила, являются широко используемой парадигмой для психолингвистических исследователей. Искусственные языки позволяют исследователям изолировать интересующие переменные и в большей степени контролировать вводимые данные, которые получит субъект. К сожалению, чрезмерно упрощенная природа этих языков и отсутствие ряда явлений, общих для всех естественных языков человека, таких как ритм , изменение высоты тона и последовательные закономерности, поднимают вопросы внешней достоверности любых результатов, полученных с использованием этой парадигмы, даже после попыток. был сделан, чтобы увеличить сложность и богатство используемых языков. Отсутствие сложности или пониженная сложность искусственного языка не в состоянии учесть потребность ребенка в распознавании данного слога естественного языка независимо от звуковой вариативности, свойственной естественному языку, хотя «возможно, что сложность естественного языка действительно облегчает обучение».

Таким образом, эксперименты с искусственным языком обычно проводятся для изучения соответствующих лингвистических переменных, какие источники информации младенцы могут использовать и когда, и как исследователи могут моделировать процесс обучения и усвоения. Аслин и Ньюпорт , например, использовали искусственные языки, чтобы исследовать, какие особенности языкового ввода делают определенные закономерности заметными и легко обнаруживаемыми младенцами, что позволяет им легко сравнивать обнаружение повторения слогов с обнаружением повторения слогов в конце слова и делать выводы о условия, при которых любая функция признается важной.

Аудио и аудиовизуальные записи

Было показано, что статистическое обучение играет большую роль в овладении языком, но социальное взаимодействие также является необходимым компонентом обучения. В одном исследовании младенцы, которым были представлены аудио- или аудиовизуальные записи носителей мандаринского языка, не смогли различить фонемы языка. Это означает, что просто слышать звуки недостаточно для изучения языка; социальное взаимодействие побуждает ребенка собирать статистику. Конкретные взаимодействия, ориентированные на младенцев, известны как «ориентированный на детей» язык, потому что он более повторяющийся и ассоциативный, что облегчает обучение. Эти «ориентированные на ребенка» взаимодействия также могут быть причиной того, что детям легче изучать язык, чем взрослым.

Двуязычные

Исследования двуязычных младенцев, такие как исследование Bijeljac-Babic и др., Посвященное младенцам, изучающим французский язык, предложили понимание роли просодии в овладении языком. Исследование Биеляц-Бабич показало, что доминирование языка влияет на «чувствительность к просодическим контрастам». Хотя это не было исследованием статистического обучения, его результаты по распознаванию просодических образов могут иметь значение для статистического обучения.

Возможно, что виды языкового опыта и знания, полученные в результате статистического изучения первого языка, влияют на овладение вторым языком. Некоторые исследования указывают на возможность того, что сложность изучения второго языка может быть вызвана структурными паттернами и языковыми сигналами, которые человек уже усвоил в процессе освоения первого языка. В этом смысле знание и навыки обработки первого языка на основе статистических данных могут выступать в качестве усложняющего фактора, когда кто-то пытается выучить новый язык с другими структурами предложений, грамматическими правилами и моделями речи.

Важные выводы

Обучение фонетической категории

Первый шаг в развитии знаний о такой сложной системе, как естественный язык, - это научиться различать важные языковые классы звуков, называемых фонемами, которые различают значения слов. Психолог из Университета Британской Колумбии Джанет Веркер , после ее влиятельной серии экспериментов в 1980-х годах, была одной из самых выдающихся фигур в попытках понять процесс, с помощью которого человеческие младенцы развивают эти фонологические различия. В то время как взрослые, говорящие на разных языках, не могут различать значимые звуковые различия на других языках, которые не определяют разные значения сами по себе, младенцы рождаются со способностью универсально различать все звуки речи. Работа Веркера показала, что, хотя младенцы в возрасте от шести до восьми месяцев все еще способны воспринимать разницу между некоторыми согласными звуками хинди и английского языка , они полностью утратили эту способность к 11-13 месяцам.

Сейчас общепринято, что дети используют ту или иную форму перцептивного распределенного обучения , с помощью которого категории обнаруживаются путем объединения похожих экземпляров входного стимула, чтобы сформировать фонетические категории в раннем возрасте. Было обнаружено, что развивающиеся дети хорошо разбираются в лингвистическом авторитете, проверяя вводные данные, на основе которых они моделируют свой язык, меньше перекладывая свое внимание на говорящих, которые неправильно произносят слова. Младенцы также используют статистическое отслеживание для расчета вероятности того, что определенные фонемы будут следовать друг за другом.

Парсинг

Синтаксический анализ - это процесс, с помощью которого непрерывный речевой поток сегментируется на отдельные значимые единицы, например предложения , слова и слоги. Saffran (1996) представляет собой исключительно плодотворное исследование в этом направлении. Младенцам давали две минуты непрерывной речи на искусственном языке из компьютеризированного голоса, чтобы устранить любые помехи от посторонних переменных, таких как просодия или интонация . После этой презентации младенцы смогли отличить слова от неслов, что было измерено во втором случае по более длительному поиску.

Важным понятием для понимания этих результатов является переходная вероятность , вероятность элемента, в данном случае слога, следующего или предшествующего другому элементу. В этом эксперименте слоги, которые соединялись в словах, имели гораздо более высокую вероятность перехода, чем слоги на границах слов, которые только что оказались смежными. Невероятно, но после короткого двухминутного выступления младенцы смогли отслеживать эту статистику и распознавать слова с высокой вероятностью . Дальнейшие исследования с тех пор воспроизвели эти результаты с естественными языками, незнакомыми младенцам, что показало, что обучающиеся младенцы также отслеживают направление (вперед или назад) переходных вероятностей. Хотя нервные процессы, лежащие в основе этого явления, остаются в значительной степени неизвестными, недавние исследования сообщают об увеличении активности левой нижней лобной извилины и средней лобной извилины во время обнаружения границ слов.

Развитие предубеждений в отношении порядка слогов - важный шаг на пути к полноценному развитию языка. Способность классифицировать слоги и группировать вместе часто встречающиеся последовательности может иметь решающее значение при разработке протолексикона , набора общих языковых шаблонов слов, основанных на характерных шаблонах в словах, которые слышит младенец. Развитие этого протолексикона может, в свою очередь, позволить распознавать новые типы образов, например, высокую частоту согласных звуков с первоначальным ударением в английском языке, что позволит младенцам дополнительно анализировать слова, распознавая общие просодические фразы как автономные языковые единицы, перезапуская динамический цикл изучения слова и языка.

Референт-лейбл-ассоциации

Вопрос о том, как начинающие пользователи языка могут ассоциировать выученные ярлыки с соответствующим референтом , человеком или объектом в среде, которую называет ярлык, был в центре философских размышлений о языке и значении от Платона до Куайна и Хофштадтера . Эта проблема, что найти некоторые прочные отношения между словом и объектом поиска данного словом смысла , не поддаваясь бесконечной рекурсией словарного поиска, известен как проблема символа заземления .

Исследователи показали, что эта проблема тесно связана со способностью разбирать язык и что слова, которые легко сегментировать из-за их высокой вероятности перехода, также легче сопоставить с соответствующим референтом. Это служит дополнительным доказательством прогрессии овладения языком, когда детям требуется понимание звукового распределения естественных языков, чтобы формировать фонетические категории, анализировать слова на основе этих категорий, а затем использовать эти синтаксические разборы для сопоставления их с объектами в качестве меток.

Самое раннее в развитии понимание ассоциаций слова с референтом было зарегистрировано в возрасте шести месяцев, когда младенцы понимали слова « мама » и « папа » или их семейные или культурные эквиваленты. Дальнейшие исследования показали, что младенцы быстро развиваются в этой способности и к семи месяцам способны усваивать ассоциации между движущимися изображениями и бессмысленными словами и слогами.

Важно отметить, что существует различие, часто сбиваемое с толку в исследованиях приобретения, между отображением метки на конкретный экземпляр или отдельного человека и отображением метки на весь класс объектов. Этот последний процесс иногда называют обобщением или изучением правил. Исследования показали, что если входные данные кодируются в терминах воспринимаемых величин, а не конкретных деталей, и если шаблоны во входных данных указывают на то, что ряд объектов названы взаимозаменяемо в одном и том же контексте, изучающий язык с гораздо большей вероятностью будет обобщать это имя. к каждому экземпляру с соответствующими функциями. Эта тенденция сильно зависит от согласованности контекстных подсказок и степени перекрытия контекстов слов во входных данных. Эти различия, кроме того, связаны с хорошо известными паттернами недостаточного и чрезмерного обобщения в обучении младенцам слов . Исследования также показали, что частота совпадения референтов также отслеживается, что помогает создавать ассоциации и рассеивать двусмысленность в моделях объект-референт.

Способность соответствующим образом обобщать на целые классы еще невидимых слов в сочетании со способностями разбирать непрерывную речь и отслеживать закономерности упорядочения слов могут быть критическими навыками, необходимыми для развития навыков и знания синтаксиса и грамматики.

Различия среди аутичных популяций

Согласно недавнему исследованию, не существует нейронных доказательств статистического изучения языка у детей с расстройствами аутистического спектра . Под воздействием непрерывного потока искусственной речи нейротипичные дети проявляли меньшую активность коры в дорсолатеральной лобной коре (особенно в средней лобной извилине ), поскольку количество сигналов к границам слов увеличивалось. Однако активность в этих сетях у аутичных детей оставалась неизменной, независимо от предоставленных словесных сигналов. Эти данные, подчеркивающие важность правильного функционирования головного мозга лобной доли, подтверждают теорию «исполнительных функций», используемую для объяснения некоторых из биологически связанных причин аутичного языкового дефицита. С нарушениями рабочей памяти, принятия решений, планирования и постановки целей, которые являются жизненно важными функциями лобной доли, аутичные дети теряют способность общаться и общаться (Ozonoff, et al., 2004). Кроме того, исследователи обнаружили, что уровень коммуникативных нарушений у аутичных детей обратно коррелировал с увеличением сигнала в тех же регионах во время воздействия искусственных языков. На основании этих данных исследователи пришли к выводу, что у детей с расстройствами аутистического спектра нет нейронной архитектуры, позволяющей определять границы слов в непрерывной речи. Было показано, что ранние навыки сегментации слов предсказывают дальнейшее развитие речи, что может объяснить, почему задержка речевого развития является отличительной чертой расстройств аутистического спектра.

Статистическое изучение языка в разных ситуациях

Изучение языка происходит в разных контекстах, когда и младенец, и воспитатель участвуют в социальных взаимодействиях. В недавнем исследовании было изучено, как младенцы и взрослые используют кросс-ситуационную статистику, чтобы узнать не только о значениях слов, но и о ограничениях в контексте. Например, Смит и его коллеги предположили, что младенцы изучают язык, приобретая предвзятость, чтобы маркировать объекты похожими объектами, которые происходят из четко определенных категорий. Для этой точки зрения важна идея о том, что ограничения, помогающие запоминать слова, не являются независимыми от самого ввода или опыта младенца. Скорее, ограничения возникают, когда младенцы узнают о способах использования слов и начинают обращать внимание на определенные характеристики предметов, которые использовались в прошлом для представления слов.

Проблема индуктивного обучения может возникнуть, поскольку слова часто используются в неоднозначных ситуациях, в которых доступно более одного возможного референта. Это может привести к путанице для младенцев, поскольку они могут быть не в состоянии различать, какие слова следует использовать для обозначения объектов, на которые делается ссылка. Смит и Ю предположили, что способ проводить различие в таких неоднозначных ситуациях - это отслеживать пары слово-референт в нескольких сценах. Например, младенец, который слышит слово в присутствии объекта A и объекта B, не будет уверен в том, является ли слово референтом объекта A или объекта B. Однако, если младенец затем снова слышит ярлык в присутствии объекта B и объект C, младенец может сделать вывод, что объект B является референтом ярлыка, потому что объект B согласованно соединяется с ярлыком в разных ситуациях.

Вычислительные модели

Вычислительные модели давно используются для изучения механизмов, с помощью которых изучающие язык обрабатывают лингвистическую информацию и манипулируют ею . Модели этого типа позволяют исследователям систематически контролировать важные переменные обучения, которыми зачастую вообще трудно манипулировать у участников-людей.

Ассоциативные модели

Ассоциативные нейросетевые модели овладения языком являются одним из старейших типов когнитивных моделей , использующих распределенные представления и изменения весов связей между узлами, составляющими эти представления, для моделирования обучения способом, напоминающим реорганизацию нейронов на основе пластичности. это составляет основу человеческого обучения и памяти . Ассоциативные модели представляют собой разрыв с классическими когнитивными моделями, характеризующимися дискретными и контекстно-независимыми символами , в пользу динамического системного подхода к языку, который лучше справляется с временными соображениями.

Предшественник этого подхода, и один из первых типов моделей для учета измерения времени в лингвистическом понимании и производстве был Эльман «s простая рецидивирующий сетью (СРН). Используя сеть обратной связи для представления прошлых состояний системы, SRN смогли в задаче предсказания слов сгруппировать вводимые данные в самоорганизованные грамматические категории, основанные исключительно на статистических паттернах совместной встречаемости.

Первые успехи , такие как они проложили путь для динамических систем исследования в лингвистическое приобретение, отвечая на многие вопросы о раннем языковом развитии , но оставляя без ответа многих других, например, как эти статистически полученные лексемы будут представлены . Особое значение в последнее время исследований было стремление понять динамическое взаимодействие обучения (например , на основе языка) и обучающийся (например , акустических систем на базе) переменных в лексической организации и конкуренции в билингвов . В непрекращающихся попытках перейти к более психологически реалистичным моделям многие исследователи обратились к подмножеству ассоциативных моделей, самоорганизующихся карт (SOM), как установленных, когнитивно правдоподобных моделей языкового развития.

SOM были полезны исследователям в выявлении и исследовании ограничений и переменных, представляющих интерес, в ряде процессов приобретения, а также в изучении последствий этих открытий для лингвистических и когнитивных теорий. Определив рабочую память как важное ограничение как для изучающих язык, так и для текущих вычислительных моделей, исследователи смогли показать, что манипуляции с этой переменной позволяют осуществлять синтаксическую загрузку , извлекая не только категориальное, но и фактическое значение содержимого из взаимного расположения слов в предложения.

Вероятностные модели

Некоторые недавние модели овладения языком были сосредоточены на методах байесовского вывода для учета способностей младенцев правильно анализировать потоки речи и усваивать значения слов. Модели этого типа в значительной степени полагаются на понятие условной вероятности (вероятность того, что A задано B), в соответствии с выводами, касающимися использования младенцами переходных вероятностей слов и слогов для изучения слов.

Модели, использующие эти вероятностные методы, смогли объединить ранее дихотомические перспективы овладения языком социальных теорий, которые подчеркивают важность изучения намерений говорящего, и статистических и ассоциативных теорий, которые полагаются на кросс-ситуационные контексты, в единую проблему совместного вывода. Этот подход привел к важным результатам в объяснении феноменов приобретения, таких как взаимная исключительность , однократное обучение или быстрое картирование , а также использование социальных намерений .

Хотя эти результаты кажутся надежными, исследования, касающиеся способности этих моделей справляться с более сложными ситуациями, такими как отображение нескольких референтов на одну метку, сопоставление нескольких меток с одним референтом и овладение двуязычным языком по сравнению с успехами ассоциативных моделей в этих областях, имеют еще предстоит изучить. Тем не менее остается надежда, что эти типы моделей могут быть объединены, чтобы дать исчерпывающий отчет о приобретении языка.

Гипотеза C / V

Что касается вероятностных частот, гипотеза C / V в основном утверждает, что все слушатели языка используют согласные частоты, чтобы различать слова (лексические различия) в непрерывных речевых строках, по сравнению с гласными. Гласные более подходят для ритмической идентификации. Несколько последующих исследований показали этот результат, поскольку они показали, что гласные обрабатываются независимо от их локального статистического распределения. Другое исследование показало, что соотношение согласных и гласных не влияет на размер лексиконов при сравнении различных языков. В случае языков с более высоким соотношением согласных дети могут больше зависеть от согласных соседей, чем от частоты рифм или гласных.

Алгоритмы овладения языком

Некоторые модели усвоения языка основаны на алгоритмах адаптивного синтаксического анализа и грамматической индукции .

Languages

In other projects