ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 266. Читать онлайн

Нет заранее заданного четкого деления слов на значения, до употребления лексикон пуст.

По мнению В. Тойберта, КЛ отказывается от всех теоретических достижений лингвистики после Ф. де Соссюра, в основном это относится ко всем вариантам порождающих грамматик школы Н.Хомского и его последователей, исключение делается им только для аппарата категориальных грамматик [смз Teubert, 2001j. Универсальная Грамматика описывает только ядро языка и ничего не говорит о периферийных зонах, тогда как исследователи языка и изучающие язык нуждаются именно в конкретном материале разных синтаксических конструкций (смл Barlow, 19961.

Поскольку КЛ интересует не отдельное слово, но текстовые сегменты, разница между лингвистическим и энциклопедическим знанием размывается. Так, если немецкое слово Machtergreifung означает просто захват enacrnu какой-то группой, ранее исключенной из политической жизни, своими силами, недемократически, то сегмент braune Machiergreifung im 3ahre 1933 безоговорочно означает захват власти нацистами. Объясняется зто тем, что часто в разных контекстах они заменяли друг друга, были парафразами или анафорически связанными сегментами. Энциклопедическое знание — это не что иное, как дискурс(ив)ное знание. Нет значения вне языка, вне дискурса. Мы не можем видеть глобализацию, но мы знаем сегодня, что такое глобализация, пото- ~' му что читали тексты, в которых это объясняется.

1

В 74. КЛ, системы АПТ,

лингвистика

КЛ образует близкое родство с практической дисциплиной «Автоматическая обработка текста» и, конкретно, с системами АПТ по нескольким признакам:

а) системы АПТ нужны именно для работы с большими массивами текстов. Чтобы добиться каких-то полезных результатов в работающей системе, необходимо знать и учитывать все свойства этих новых для лингвистики объектов — текста как целого и массива текстов. КЛ формирует, исследует и описывает их как информационный ресурс;

б) технологии и приемы первичной обработки «сырых«о не- препарированных текстов в прикладных системах (машинный перевод и другие системы АПТ) во многом совпадают с теми, которые приняты или отрабатываются в КЛ. Так, чтобы создать параллельный корпус, нужны алгоритмы и программы сегментирования текста на такие (значимые) единицы, которые могут быть

сопоставлены друг другу;

266

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 266. Читать онлайн