Агглютинация - Agglutination

Средний знак на венгерском языке , который сильно агглютинирует. (Верхний и нижний знаки на румынском и немецком языках соответственно, оба склоняются .) Английский перевод - «Министерство продовольствия и сельского хозяйства: Главное управление продовольствия и сельского хозяйства округа Сату-Маре ».

Агглютинация - это лингвистический процесс деривационной морфологии, в котором сложные слова образуются путем объединения морфем без изменения их орфографии или фонетики. Языки, которые широко используют агглютинацию, называются агглютинативными языками . Примером такого языка является турецкий , где, например, слово evlerinizden , или «из ваших домов», состоит из морфем ev-ler-iniz-den, буквально переведенных морфема за морфемой как дом-множественное число-ваш. -с .

Агглютинативные языки часто противопоставляются как языкам, в которых синтаксическая структура выражается исключительно посредством порядка слов и вспомогательных слов ( изолирующие языки ), так и языкам, в которых один аффикс обычно выражает несколько синтаксических категорий, а одна категория может быть выражена несколькими разными аффиксы (как в флективных (фузионных) языках ). Однако как фузионные, так и изолирующие языки могут использовать агглютинацию в наиболее часто используемых конструкциях и активно использовать агглютинацию в определенных контекстах, таких как словообразование. Так обстоит дело с английским языком , который имеет агглютинированный маркер множественного числа - (e) s и производные слова, такие как shame · less · ness .

Агглютинативные суффиксы часто вставляются независимо от слоговых границ , например, путем добавления согласной к слоговой коде, как в английском языке tie - tie s . Агглютинативные языки также имеют большое количество энклитиков , которые могут быть отделены от корня слова носителями языка в повседневном использовании.

Термин агглютинация иногда используется в более общем смысле для обозначения морфологического процесса добавления суффиксов или других морфем к основанию слова. Этот вопрос более подробно рассматривается в разделе, посвященном другим использованию этого термина .

Примеры агглютинативных языков

Хотя агглютинация характерна для определенных языковых семей, это не означает, что, когда несколько языков в определенной географической области являются агглютинативными, они обязательно филогенетически связаны. В прошлом это предположение побудило лингвистов предложить так называемую урало-алтайскую языковую семью , которая включала (в наибольшем из когда-либо предложенных) уральские и тюркские языки, а также монгольский, корейский и японский. Современная лингвистика считает это предложение спорным.

Еще одно соображение при оценке вышеупомянутого предложения состоит в том, что некоторые языки, которые развились на основе агглютинативных протоязыков, утратили свои агглютинативные особенности. Например, современный эстонский язык, который настолько близок к финскому, что оба языка взаимно понятны, сместился в сторону слитного типа. (Он также утратил другие черты, характерные для уральских семей, такие как гармония гласных .)

Евразия

Примеры агглютинативных языков включают уральские языки , такие как финский , эстонский и венгерский . В их повседневном употреблении очень агглютинированные выражения, и большинство слов двусложные или длиннее. Грамматическая информация, выражаемая приставками в западных индоевропейских языках , обычно встречается в суффиксах.

Венгерский язык использует обширную агглютинацию почти во всех его частях. Суффиксы следуют друг за другом в особом порядке, в зависимости от роли суффикса, и многие из них могут быть наложены друг на друга, в результате чего слова передают сложные значения в сжатой форме. Примером является fiaiéi, где корень «fi (ú) -» означает «сын», последующие четыре гласных являются отдельными суффиксами, а все слово означает «[свойства множественного числа] принадлежат его / ее сыновьям». Вложенная притяжательная структура и выражение множественного числа весьма примечательны (обратите внимание, что в венгерском языке роды не используются).

Почти все австронезийские языки , такие как малайский и большинство филиппинских языков , также относятся к этой категории, что позволяет им образовывать новые слова из простых базовых форм. Индонезийское и малайское слово mempertanggungjawabkan образовано путем добавления активных, причинных и благотворных аффиксов к составному глаголу tanggung jawab , что означает «учитывать». На тагальском языке (и его стандартизированном регистре - филиппинском ) nakakapágpabagabag («то, что расстраивает / беспокоит») образовано от корня bagabag («расстраивает» или «тревожит»).

Японский также является агглютинирующим языком, добавляя такую ​​информацию, как отрицание , пассивный залог , прошедшее время , почетную степень и причинность в форме глагола. Типичными примерами могут быть хатаракасераретара (働 か せ ら れ た ら) , которая сочетает в себе причинные, пассивные или потенциальные и условные спряжения, чтобы прийти к двум значениям в зависимости от контекста: «если (субъект) был задействован ...» и «если (субъект)». может заставить (объект) работать », и tabetakunakatta (食 べ た く な か っ た) , в котором сочетаются желание, отрицание и спряжения прошедшего времени, означающие« Я / он / она / они не хотели есть ».

  • taberu ("(субъект) съест (это)")
  • tabetai ("(субъект) хочет съесть (это)")
  • tabetakunai («(субъект) не хочет есть (это)»)
  • tabetakunakatta («(субъект) не хотел есть (это)»)

Турецкий , наряду со всеми другими тюркскими языками , является еще одним агглютинирующим языком: в качестве крайнего примера выражение Muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine произносится как одно слово на турецком языке, но его можно перевести на английский как «как если бы вы были из тех, кого мы не смогли бы превратиться в создателя неудачников »(« -siniz »относится к форме множественного числа, где« -sin »является единственной формой, точно так же« -im »является« I », а« -imiz »делает его "мы").

Все дравидийские языки , включая каннада , малаялам , тамильский и телугу, являются агглютинативными.

Агглютинация также является заметной чертой баскского языка . Спряжение глаголов, например, осуществляется путем добавления различных префиксов или суффиксов к корню глагола: dakartzat , что означает «Я приношу их», образовано da (указывает на настоящее время), kar (корень глагола ekarri → принести), tza (указывает на множественное число) и t (указывает на подлежащее, в данном случае «I»). Другой пример - склонение: Etxean = «В доме», где etxe = дом.

Африке

Все языки банту , такие как KiKongo , IsiZulu , ChiChewa , LuGanda и суахили .

Сенегамбийские языки, такие как волоф и фула .

Игбоидные языки .

Америка

Подпишитесь на испанском, английском и кичва (агглютинативный язык).

Агглютинация используется очень сильно в большинстве индейских языков , таких как языки инуитов , науатль , мапуче , кечуа , Tz'utujil , какчикель , Cha'palaachi и киче , где одно слово может содержать достаточное количество морфем , чтобы передать смысл того , что было бы сложным предложением на других языках. И наоборот, навахо содержит аффиксы для некоторых целей, но накладывает их таким непредсказуемым и неотделимым образом, что его часто называют языком слияния.

Построено

Эсперанто - это сконструированный вспомогательный язык с очень регулярной грамматикой и морфологией агглютинативных слов. См. Словарь эсперанто .

Вымышленный

Новояз - это вымышленный язык 1984 года, основанный на единственной цели агглютинации, как выразился персонаж Сайм: «Каждое понятие, которое когда-либо может понадобиться, будет выражено ровно одним словом». Например, используя корневое слово «хороший», мы можем формировать такие слова, как хорошо (хорошо), plusgood (очень хорошо), doubleplusgood (очень хорошо) и ungood (плохо). Слова со значениями в сравнительной и превосходной степени также упрощаются, поэтому «лучше» становится «лучше», а «лучший» становится «самым хорошим».

Слоты

Как отмечалось выше, типичной особенностью агглютинативных языков является взаимно однозначное соответствие между суффиксами и синтаксическими категориями. Например, существительное может иметь отдельные маркеры для числа, падежа, притяжательного или соединительного употребления и т. Д. Порядок этих аффиксов фиксирован; таким образом, мы можем рассматривать любое данное существительное или глагол как основу, за которой следует несколько словоизменительных «слотов», то есть позиций, в которых могут встречаться флективные суффиксы. Часто бывает, что самый распространенный экземпляр данной грамматической категории не помечен, т. Е. Соответствующий аффикс пуст.

Количество слотов для данной части речи может быть на удивление большим. Например, конечный корейский глагол имеет семь слотов (внутренние круглые скобки указывают на части морфем, которые могут быть опущены в некоторых фонологических средах):

  1. почетный: - (eu) si ((으) 시) используется, когда говорящий уважает подлежащее предложения
  2. время: (eo) ss (었) для завершенного (прошедшего) действия или состояния; когда этот слот пуст, время интерпретируется как настоящее ('ss' произносится как 't', если оно помещается после согласного. Например, - 었어 (eoss-eo) произносится как (eosseo), но - 었다 (eoss-ta) произносится как (eotta). Обратите внимание, что одно и то же правило применяется ко всем случаям окончания 'ss'.)
  3. экспериментально-контрастный аспект: (eo) ss (었) удвоение маркера прошедшего времени означает, что «субъект получил опыт, описанный глаголом»
  4. модальный: gess (겠) используется с субъектами от первого лица только для определенного будущего и с субъектами от второго или третьего лица также для вероятного настоящего или прошлого
  5. формальный: (eu) pni ((으) ㅂ니) выражает вежливость к слушателю
  6. ретроспективный аспект: deo ; (더) означает, что говорящий вспоминает то, что он наблюдал в прошлом, и сообщает в настоящей ситуации.
  7. настроение: da (다) для декларативного, kka (까) для вопросительного, ra / la (라) для императивного, ja (자) для высказывания, yo (요) для вежливого декларативного и большое количество других возможных маркеров настроения

Более того, пассивные и причинные глагольные формы могут быть получены путем добавления суффиксов к основанию, которое можно рассматривать как нулевой слот.

Даже несмотря на то, что некоторые комбинации суффиксов невозможны (например, только один из слотов аспектов может быть заполнен непустым суффиксом), более 400 форм глагола могут быть сформированы из одной основы. Вот несколько примеров, образованных от корня слова ga «идти»; числа указывают, какие слоты содержат непустые суффиксы:

  • 7 (маркер повелительного наклонения): суффикс повелительного наклонения -ra (라) объединяется с корнем ga- (가) для выражения повелительного наклонения: га-ра (가라) «Иди!»;
  • 7 (маркер пропозитивного настроения): если мы хотим выразить предложение, а не команду, используется маркер положительного настроения: -ja (자) вместо -ra (라): ga-ja (가자) «Поехали!»
  • 5 и 7: Если говорящий хочет проявить уважение к слушающему, он использует маркер вежливости - (eu) pni ((으) ㅂ니) (в слоте 5); одновременно могут использоваться различные маркеры настроения (в слоте 7, следовательно, после маркера вежливости): gap-ni-da (갑니다) «Он идет.», gap-ni-kka? (갑니까) 'Он идет?'
  • 6: ретроспективный аспект: Джон-и джиб-э га-део-ра (존 이 집 에 가 더라) «Я заметил, что Джон шел домой, и теперь я сообщаю об этом вам».
  • 7: простой указательный: сеон-сенг-ним-и джиб-э ган-да (선생님 이 집 에 간다) «Учитель идет домой. (не выражая уважения или вежливости) '
  • 5 и 7: вежливость по отношению к слушателю: сеон-саенг-ним-и джиб-е гап-ни-да (선생님 이 집 에 갑니다) или сеон-сенг-ним-и джиб-э га-йо (선생님 이 집 에 가요) 'Учитель идет домой.',
  • 1 и 7: уважение к предмету: сеон-сенг-ним-и джиб-э га-син-да (선생님 이 집 에 가신다) «(Уважаемый) учитель идет домой».
  • 1, 5 и 7: два вида вежливости в одном предложении: seon-saeng-nim-i jib-e ga-syeo-yo (선생님 이 집 에 가셔 요) или seon-saeng-nim-i jib-e ga- sip-ni-da (선생님 이 집 에 가십 니다) «Учитель идет домой. (выражая уважение как к слушателю, так и к учителю) »
  • 2, 3 и 7: прошедшие классы: Jon-i hak-gyo-e ga-ss-da / gat-ta (존 이 학교 에 갔다) «Джон пошел в школу (и сейчас там)», Джон- i hak-gyo-e gass-eoss-da / gass-eot-ta (존 이 학교 에 갔었다) «Джон был в школе (и вернулся)».
  • 4 и 7: модальное от первого лица: nae-ga nae-il ga-gess-da / ga-get-ta (내가 내일 가겠다) «Я пойду завтра».
  • 4 и 7: модальный вид от третьего лица: Jon-i nae-il ga-gess-da / ga-get-ta (존 이 내일 가겠다) «Я полагаю, что Джон уйдет завтра», Jon-i eo-je gass- gess-da / gat-get-ta (존 이 어제 갔 겠다) «Полагаю, Джон уехал вчера».

Суффикс или префикс

Хотя в большинстве агглютинативных языков в Европе и Азии преобладают суффиксы, языки банту в южной части Африки известны очень сложной смесью префиксов, суффиксов и дублирования. Типичной особенностью этой языковой семьи является то, что существительные делятся на классы существительных. Для каждого класса существительных существуют определенные префиксы единственного и множественного числа, которые также служат маркерами согласия между подлежащим и глаголом. Более того, существительное определяет префиксы всех слов, которые его изменяют, а подлежащее определяет префиксы других элементов в той же глагольной фразе.

Например, существительные на суахили -toto («ребенок») и -tu («человек») попадают в класс 1 с префиксом единственного числа m- и префиксом множественного числа wa- . Существительное -tabu («книга») попадает в класс 7 с префиксом единственного числа ki- и множественным префиксом vi- . Можно составить следующие предложения:

  • m-toto a-li-fika «Ребенок прибыл».
  • m-toto a-ta-fika «Ребенок придет».
  • ва-тото ва-ли-фика «Дети прибыли».
  • ва-тото ва-та-фика «Дети придут».
  • м-ту а-ли-лала «Человек спал».
  • м-ту а-та-лала «Человек уснет».
  • ва-ту ва-ли-лала 'Люди спали'.
  • ва-ту ва-та-лала 'Люди уснут '.
  • ки-табу ки-ли-ангука «Книга упала».
  • ки-табу ки-та-ангука «Книга упадёт».
  • ви-табу ви-ли-ангука «Книги упали».
  • ви-табу ви-та-ангука «Книги упадут».

yu-le 1sg-that

m-tu 1sg-человек

m-moja 1sg-one

m-refu 1sg-высокий

a-li 1sg-he-past

ye 7sg-rel.-it

ки-сома 7sg-читать

ки-ле 7sg-что

ки-табу 7sg-книга

ки-рефу 7sg-long

«Тот самый высокий человек, который читал эту длинную книгу».

wa-le 1pl-that

wa-tu 1pl-человек

ва-вили 1пл-два

wa-refu 1pl-высокий

ва-ли 1пл-он-прошлое

(ш) -о 7пл-отн.-это

vi-soma 7pl-читать

vi-le 7pl-что

vi-tabu 7pl-книга

vi-refu 7pl-длинный

«Те два высоких человека, которые читают эти длинные книги».

В контексте количественной лингвистики

Американский лингвист Джозеф Гарольд Гринберг в своей статье 1960 года предложил использовать так называемый индекс агглютинативности для вычисления числового значения, которое позволило бы исследователю сравнивать «степень агглютинативности» различных языков. Для Гринберга агглютинация означает, что морфы соединяются только с незначительными модификациями или без них. Морфемы называются автоматическим , если оно либо принимает одну форму поверхности (морфинг), или если его поверхность форма определяется фонологическими правилами , которые держат во всех подобных случаях на этом языке. Соединение морфов - позиция в слове, где встречаются две морфы - считается агглютинативным, если обе включенные морфемы являются автоматическими. Индекс агглютинации равен среднему отношению количества агглютинативных стыков к количеству морфовых стыков. Языки с высокими значениями индекса агглютинативности являются агглютинативными, а языки с низкими значениями индекса агглютинативности - фузионными.

В той же статье Гринберг предложил несколько других индексов, многие из которых оказались актуальными для изучения агглютинации. Индекс синтетического представляет собой среднее количество морфем в слове, с наименьшим мыслимых значением , равным 1 для изоляции (аналитические) языки и ценности реальной жизни редко превышает 3. Индекс компаундирования равно среднему числу корневых морфем в слове ( в отличие от словообразовательных и словоизменительных морфем). Деривационные, флективные, префиксные и суффиксальные индексы соответствуют соответственно среднему количеству деривационных и флективных морфем, префиксов и суффиксов.

Вот таблица с примерами значений:

агглютинация синтез компаундирование происхождение перегиб префикс суффикс
суахили 0,67 2,56 1,00 0,03 0,31 0,45 0,16
разговорный турецкий 0,67 1,75 1.04 0,06 0,38 0,00 0,44
письменный турецкий 0,60 2.33 1,00 0,11 0,43 0,00 0,54
Якутский 0,51 2,17 1.02 0,16 0,38 0,00 0,53
Греческий 0,40 1,82 1.02 0,07 0,37 0,02 0,42
английский 0,30 1,67 1,00 0,09 0,32 0,02 0,38
Инуиты 0,03 3,70 1,00 0,34 0,47 0,00 0,73

Фонетика и агглютинация

Однозначные отношения между аффиксом и его грамматической функцией могут несколько осложняться фонологическими процессами, активными в данном языке. Например, следующие два фонологических явления проявляются во многих уральских и тюркских языках:

  • градация согласных , означающая, что между определенными парами кластеров согласных существует такое чередование, что один член пары появляется в начале открытого слога, а другой - в начале закрытого слога ; (на уральских языках)
  • ассимиляция выделения согласных: аналогичный, но отличный от описанного выше процесс, ассимиляция выделения глухого согласного на конце корня; (на некоторых тюркских языках)
  • гармония гласных , означающая, что в несоставном слове сосуществуют только определенные подклассы гласных.

Несколько примеров на финском языке проиллюстрируют, как эти два правила и другие фонологические процессы приводят к отклонениям от основных однозначных отношений между морфами и их синтаксической и семантической функцией. При склонении talo 'house' не применяется никаких фонологических правил . Однако второй пример иллюстрирует несколько видов фонологических явлений.

talo
'дом'
märkä paita
'мокрая рубашка'
корни содержат согласного кластеры -rk- и -t-
Talo-n
'дома'
märä-n paya-n
'мокрой рубашки'
градация согласных: суффикс родительного падежа -n закрывает предыдущий слог;
          rk -> r, t-> d
talo-ssa
'в доме'
märä-ssä paya-ssa
'в мокрой рубашке'
гармония гласных: слово, содержащее ä, может не содержать гласных a, o, u ;
          алломорф в инессиве окончания -ssa / SSA используется
talo-i-ssa
'в домах'
mär-i-ssä payo-i-ssa
'в мокрых рубашках'
Фонологические правила также подразумевают различные изменения гласных, когда маркер множественного числа -i- встречается с гласной в конце концов

Крайности

Можно создать искусственно крайние примеры агглютинации, которые не имеют реального применения, но иллюстрируют теоретическую способность грамматики к агглютинации. Это не вопрос «длинных слов», потому что некоторые языки допускают неограниченное количество комбинаций со сложными словами, отрицательными клитиками и т. Д., Которые могут быть (и выражаются) с аналитической структурой в реальном использовании.

Английский язык способен агглютинировать морфемы исключительно местного ( германского ) происхождения как не-целостность , но, вообще говоря, самые длинные слова собираются из форм латинского или древнегреческого происхождения. Классический пример - антидисестаблишментарианство . Агглютинативные языки часто имеют более сложную деривационную агглютинацию, чем изолирующие языки, поэтому они могут делать то же самое в гораздо большей степени. Например, в венгерском языке может найти реальное применение такое слово, как elnemzetietlenítetlenségnek , что означает «[в целях] неденационализации». Точно так же есть слова, которые имеют значение, но, вероятно, никогда не используются, например, legeslegmegszentségteleníttethetlenebbjeitekként , что означает «как большинство из вас, не имеющих секретности», но их трудно расшифровать даже для носителей языка. Их можно расширить с помощью флективной агглютинации. Например, официальный мировой рекорд Гиннеса - финский epäjärjestelmällistyttämättömyydellänsäkäänköhän «Интересно, даже с его / ее качеством - не быть несистематизированным». Он имеет производное слово epäjärjestelmällistyttämättömyys в качестве корня и удлиняется флективными окончаниями -llänsäkäänköhän . Однако это слово грамматически необычно, потому что -kään «также» используется только в отрицательных предложениях, а -kö (вопрос) - только в вопросительных предложениях.

Очень популярная турецкая агглютинация - ekos Slovakyalılaştıramadıklarımızdanmışsınız , что означает «Вы один из тех, кого мы не смогли превратить в чехословацких». Эта историческая справка используется как шутка для людей, которых трудно изменить, или для тех, кто выделяется в группе.

С другой стороны, Afyonkarahisarlılaştırabildiklerimizdenmişsinizcesine - это более длинное слово, которое не удивляет людей и означает «Как будто вы один из тех, кого мы смогли сделать похожими на людей из Афьонкарахисара ». Недавнее дополнение к утверждениям появилось с введением следующего слова на турецком языке muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine , что означает что-то вроде «(вы говорите), как будто вы один из тех, кого мы не смогли превратить в создателя неудачников» ( кто-то, кто не обучает людей, чтобы сделать их неудачными).

Грузинский также очень агглютинативный язык. Например, слово gadmosakontrrevolucieleblebisnairebisatvisaco ( გადმოსაკონტრრევოლუციელებლებისნაირებისათვისაცო ) будет означать «(кто-то не указан) сказал, что это также для тех, кто подобен тем, кто должен быть снова / снова контрреволюционирован».

Аристофан комедия " Женщины в народном собрании включает греческое слово λοπαδο-τεμαχο-σελαχο-γαλεο-κρανιο-λειψανο-δριμ-υπο-τριμματο-σιλφιο-καραβο-μελιτο-κατακεχυ-μενο-κιχλ-επι-κοσσυφο-φαττο-περιστερ-αλεκτρυον-οπτο-κεφαλλιο-κιγκλο-πελειο-λαγῳο-σιραιο-βαφη-τραγανο-πτερύγων , вымышленное блюдо с именем , словом , которое перечисляет его ингредиенты. Он был создан, чтобы высмеять в то время тенденцию к созданию длинных словосочетаний на аттическом греческом языке.

Славянские языки считаются не агглютинативными, а слитными . Однако крайние производные, подобные тем, которые встречаются в типичных агглютинативных языках, действительно существуют. Известный пример - болгарское слово « непротивоконституциослователствуйте» , что означает « не выступайте против конституции и, во вторую очередь , не действуйте против конституции» . Он состоит всего из трех корней: против против , конституция конституции , заимствованного слова и, следовательно, лишен своего внутреннего состава и слова . Остальные - это связанные морфемы для отрицания ( не , проклитика, иначе записываются отдельно глаголами), усилителя существительного ( -ателств ), преобразования существительного в глагол ( -ува ), повелительного наклонения второго лица множественного числа ( -йте ). Это довольно необычно, но находит свое применение, например, в газетных заголовках 13 июля 1991 года, на следующий день после принятия нынешней болгарской конституции, вызвавшей много споров, дебатов и даже скандалов.

Другие употребления слов агглютинация и агглютинативный

Слова агглютинация и агглютинация произошли от латинского слова agglutinare , «склеивать вместе». В лингвистике эти слова используются с 1836 года, когда посмертно опубликовал работу Вильгельма фон Гумбольдта Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts [букв .: О различиях в конструкции человеческого языка и его влиянии. о психическом развитии человечества] ввел разделение языков на изолирующие , флективные , агглютинативные и включающие .

Особенно в некоторой старой литературе агглютинативный термин иногда используется как синоним слова « синтетический» . В этом случае он охватывает то, что мы называем агглютинативными и флективными языками, и является антонимом аналитического или изолирующего . Помимо четкой этимологической мотивации (в конце концов, флективные окончания также «приклеиваются» к основам), это более общее использование оправдано тем фактом, что различие между агглютинативными и флективными языками не является резким, как мы уже видели.

Во второй половине XIX века многие лингвисты считали, что существует естественный цикл эволюции языка: функциональные слова изолирующего типа приклеиваются к их заглавным словам, так что язык становится агглютинативным; более поздние морфы сливаются посредством фонологических процессов, и получается флективный язык; наконец, в быстрой речи часто опускаются флективные окончания, опускаются интонации и язык возвращается к изолирующему типу.

Следующий отрывок из Lord (1960) хорошо демонстрирует весь диапазон значений, которые может иметь слово « агглютинация» .

( Агглютинация ...) состоит из соединения двух или более терминов, постоянно встречающихся как синтагматическая группа, в единое целое, которое становится либо трудным, либо невозможным для последующего анализа.

Агглютинация принимает различные формы. По-французски сварка становится полным плавлением. Латинское hanc horam «в этот час» - это французская наречивая единица бис . Старофранцузское tous jours становится toujours , а dès jà («с настоящего времени») déjà («уже»). В английском языке, с другой стороны, за исключением редких комбинаций , таких как Прощайте от Бога быть с вами , грецкий орех из Уэльса орех , окна от ветра глаза (ON vindauga ), блоки, составляющие слипшиеся формы сохраняют свою идентичность. Такие слова, как « черный дрозд» и « бифитер» - совсем другое дело; они сохраняют свои единицы, но их окончательное значение не может быть полностью выведено из этих единиц. (...)

Соссюр предпочитал различать составные слова и действительно синтезированные или агглютинированные комбинации.

Агглютинативные языки при обработке естественного языка

При обработке естественного языка языки с богатой морфологией создают проблемы совершенно иного рода, чем изолирующие языки. В случае агглютинативных языков главное препятствие заключается в большом количестве словоформ, которые могут быть получены из одного корня. Как мы уже видели, образование этих словоформ несколько усложняется фонологическими процессами конкретного языка. Хотя в финском языке основные однозначные отношения между формой и синтаксической функцией не нарушены, авторитетный институт языков Финляндии ( Kotus ) перечисляет 51 тип склонения для финских существительных, прилагательных, местоимений и числительных.

Еще больше проблем возникает с распознаванием словоформ. Современные лингвистические методы в значительной степени основаны на использовании корпусов; однако, когда количество возможных словоформ велико, любой корпус обязательно будет содержать лишь небольшую их часть. Hajič (2010) утверждает, что компьютерное пространство и мощность настолько дешевы в настоящее время, что все возможные словоформы могут быть созданы заранее и сохранены в форме словаря, в котором перечислены все возможные интерпретации любой данной словоформы. (Структура данных словаря должна быть оптимизирована, чтобы поиск был быстрым и эффективным.) По словам Гайча, именно устранение неоднозначности этих словоформ является трудным (в большей степени для флективных языков, где неоднозначность высока, чем для агглютинативных языков).

Другие авторы не разделяют точку зрения Гайча о том, что пространство не является проблемой, и вместо того, чтобы перечислять все возможные словоформы в лексиконе, анализ словоформ осуществляется модулями, которые пытаются разбить поверхностную форму на последовательность морфем, встречающихся в порядке, допустимом язык. Проблемой такого анализа является большое количество границ морфем, характерных для агглютинативных языков. Слово флективного языка имеет только одно окончание, и поэтому количество возможных делений слова на основание и окончание линейно зависит от длины слова. В агглютинативном языке, где несколько суффиксов объединяются в конце слова, количество различных делений, которые необходимо проверять на непротиворечивость, велико. Этот подход использовался, например, при разработке системы для арабского языка, где агглютинация происходит, когда артикли, предлоги и союзы соединяются со следующим словом, а местоимения соединяются с предыдущим словом. См. Grefenstette et al. (2005) для получения более подробной информации.

Смотрите также

Примечания

использованная литература

Библиография

  • Киммо Коскенниеми и Lingsoft Oy: Финский морфологический анализатор , Lingsoft Language Solutions, 1995–2011.
  • Бернард Комри (редактор): Основные языки мира, Oxford University Press, Нью-Йорк - Оксфорд 1990.
  • Кейт Деннинг, Сюзанна Кеммер (ред.): О языке: избранные труды Джозефа Х. Гринберга , Stanford University Press, 1990. Избранные части доступны в googlebooks .
  • Виктория Фромкин, Роберт Родман, Нина Хайамс: Введение в язык , Томпсон Уодсворт, 2007.
  • Джозеф Х. Гринберг: количественный подход к морфологической типологии языка , 1960. Доступно через JSTOR и в Denning et al. (1990), стр. 3–25. Также есть хорошее краткое резюме .
  • Грегори Грефенстетт, Насредин Семмар, Фаиза Элкатеб-Гара: Модификация системы обработки естественного языка для европейских языков для обработки арабского языка в приложениях обработки информации и поиска информации , Вычислительные подходы к семитским языкам - Материалы семинара, Мичиганский университет 2005, стр. 31-38. Доступно на [1] .
  • Ян Гайч: Вспоминая историю: истоки статистического машинного перевода и языков с богатой морфологией , IceTAL'10 Труды 7-й международной конференции по достижениям в обработке естественного языка, Springer-Verlag Berlin, Heidelberg, 2010. Резюме доступно по ссылке [2] .
  • Елена Лехечкова: Вод до ugrofinistiky, Státní pedagogické nakladatelství, Прага, 1983.
  • Роберт Лорд: научите себя сравнительной лингвистике, The English Universities Press Ltd., Дом Святого Павла, Лондон, 1967 (первое издание, 1966).
  • Ганс Христиан Лушютцкий: Uvedení do typologie jazyk , Filozofická fakulta Univerzity Karlovy, Praha 2003.
  • J. Vendryes: Language - A Linguistic Introduction to History, Kegan Paul, Trench, Trubner Co., Ltd., Лондон, 1925 (перевод Пола Радина)

внешние ссылки