ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 62. Читать онлайн

Ту же задачу, но уже в рамках СинАн решают процедуры ментации сложных предложений. Их цель — определить прав~ ные структуры простых высказываний в составе сложного п ложения, чтобы в дальнейшем сопоставить им структуры Си ций. В алгоритме, предложенном Л.Н.Иорданской, межсеп тантный анализ опирается на свойства правильной синтакс: ской структуры [смз Иорданская, 1967], а в работе Т.Ю. Кобэ вой и ее программной реализации, выполненной И.М. Ножог анализ сегментной структуры использует свойство рекурсивн< линейной структуры русского предложения [см.: Кобзарева, 2 Ножов, 2003]. Хотя многие признаки прерванности и оказыва возможным определить по результатам ранних стадий анализг окончательная композиционная структура текста в сложных чаях формируется в ходе полноценного синтаксического и г семантического анализа.

Итак, чтобы иметь выход к задачам разной степени сложно первичный анализ должен иметь установку ничего ие потерять

В результате работы только первичного анализа мы полу хорошо структурированный массив, который может служить новой для работы любых систем АПТ. Многие, казалось бы, нические решения имеют лингвистический смысл, они связа~ обшей моделью системы, определяют характер задач, кото может решать данная система. Если их дополнить этапом мор логического анализа, они образуют большой комплекс, кото можно назвать досивтаксическим компонентом. Такой компл созданный еще в 1997 r. и реализованный программистами А. кирко и Ж.Аношкиной, до сих пор устойчиво работает в сос УИС РОССИЯ, а также включен в ряд других систем.

Макросинтаксический анализ представляет собой мощное с ство обработки текста: разбивая текст на структурно подоб фрагменты, он облегчает задачи и синтаксического анализа (у речислительных пассажей особый синтаксис и т.д.), и семш ческого (семантика знает, к какому фрагменту нужно обрати для восстановления опущенных на данном участке частей см ла). Он позволяет также корректировать ошибки оформления с дартных или официальных документов. Поскольку работаю~ далее полный цикл лингвистического анализа (или лингви ческой экспертизы) строит структуры отдельно для каждой и росинтаксической единицы, это позволит при поиске выда ответ с точностью до абзаца и предложения.

Заметим, что модуль МакроСинАн настроен не на предмет область, а на корпус текстов со своей структурой. Подобную сл ную структуру имеет и техническая документация.

62

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 62. Читать онлайн