ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 85. Читать онлайн

а оп ядро щел , дал , Пе ятся ;ифра :пол ствен гтол сичес и кро няют — 5 ,ско

:С, н ,ычис обн стны ~ ГСС ~ в со . непо ], пр е еди

юдел збога знент варош ответ юван

: синнног гмы

иакси их 50 славе ваетс ~ слов лите <о соэтог ~тиче-

Принятый в ней подход к СинАн сложен для реализации, так i,àê стремится к построению полного и абсолютно правильного зсрева для каждого предложения и требует идеальных условий на входе:

1) все слова должны быть обеспечены словарными статьями комбинаторного словаря с полной синтаксической исходной информацией;

2) анализируемое предложение должно быть правильным предяожением русского языка.

Эти жесткие условия в последних реализациях модели ослабляются, СинАн становится более устойчивым: в версии ЭТАП-3 лдя перевода с русского языка предложен новый алгоритм СинАн, введен синтаксический корректор, дополненный алгоритмической процедурой, позволяющей справляться со словами, отсутствующими в комбинаторном словаре [смз Цинман, Сизов, 2000; Григорьев, 2000].

Вариант совмещения поверхностной и глубинной синтаксических структур, названный комбинированной синтаксической структурой (KCC), был введен в системе АРАП и в настоящее время используется в системе японско-русского перевода ЯРАП [смп Шаляпина, 1974; 2001; и др.]. В обеих системах принят лексикографический способ лингвистического описания, лексика и грамматика задаются в виде словарных статей единой структуры и отличаются лишь степенью общности. Синтагматика задана в виде валентностных свойств всех единиц, включая знаки препинания, участвующих в процессе анализа. Это значит, что обработка текста осуществляется «под управлением словаря», одновременно учитывается информация разных языковых уровней.

Коллектив Лаборатории математической лингвистики (Ленинградский государственный университет) под руководством Г.С. Цейтина проводил эксперименты по машинному переводу и анализу текстов в ограниченных предметных областях, что позволило существенно продвинуться в реализации подхода «сверху- вниз» [смз Цейтин, 1985; Железняков, Невлева, Новицкая и др., 1988]. Если проход «снизу-вверх», который обеспечивается словарем и морфологическим анализом, не давал единственного решения, система строила ассоциативную сеть, узлами которой были конкретные объекты этой предметной области с привязанными к ним ироцедурами предсказаний и наследовании, и строилась очередь вызова разных процедур. В этой сети сосуществует информация разных уровней: морфология, синтаксис и семантика, понимаемая как прагматика. При построении единиц высших уровней нижние единицы не уничтожаются, что позволяет семантике управлять синтаксисом и наоборот, Важно то, что в сети склеивались повторяющиеся объекты, т.е. синтаксический анализ выходил на межфразовый уровень. К 1990-м rr, эти работы прервались.

85

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 85. Читать онлайн