ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 95. Читать онлайн

сих спосо .емых син ,яаках.

~ы синтакксически про трам

',ких отно

хозяин,

:ние

ьиый член,

~агательное

s)

~лен)

1н и сидегяь, союза) «ем

epee

35 примк (правое, левое) 'примыкание, если слова стоят рядом и никакая другая связь не подходит

В следующей версии СинАн обмен информацией между струк- I~3MB СинП и СемП решено было проводить раньше, сразу после построения синтаксических групп первого и второго ранга, т.е. согласовательных групп и групп с управлением, но собранных как непосредственные составляющие. Это позволяло представлять терминологические группы как один узел СинП и давало быстрый выход в информационную систему. Процедура стыковки лингвистических и предметных знаний оставалась и остается до сир пор главной проблемой во всех ведущихся экспериментальных разработках.

Оптимальное соотношение операций СинАн, сравнения с БД и локального СемАн при построении искомых объектов (географических и др.) еще предстояло установить по окончании всех стыковочных работ. Компонент СинАн должен был не только принимать и учитывать все изменения (в том числе форматов структуры) предшествующих уровней, но и развиваться содержательно, включая в обработку все больший круг сложных синтаксических явлений русского языка. Хотя продолжение работ в этом направлении было приостановлено по внешним обстоятельствам, зто совпало и с кризисом жанра:

а) слишком сложной, необозримой оказывалась полная синтаксическая структура, особенно для трудных, длинных, неоднозначных предложений, лингвисты уже не могли учесть все последствия сравнений с базами данных, с семантическим словарем;

б) термины, имена и другие сложные и имеющие свою внутреннюю структуру единицы, попадая в синтаксическую структуру, часто «ломали» дерево синтаксических связей, и программа СинАн «нервничала», не зная, что предпочесть: сведения нижнего уровня или поступающую из предметной области информацию «сверху». Было принято решение перейти на упрощенный СинАн; он был реализован уже в другой системе (ДИАЛИНГ).

Синтаксис в системе ДИАЛИНГ

Задача упрощенного СинАн была реализована уже в составе системы русско-английского МП ДИАЛИНГ, выполненной в основном студентами и аспирантами РГГУ — бывшими участниками проекта ПОЛИТЕКСТ — Л.Гершензоном, Д.Панкратовым, А. Сокирко и др.). Эта реализация опиралась практически на ту же грамматику СинАн, но использовала новые технологические решения. При том же разделении уровней СинАн и СемАн все компоненты, включая предшествующие синтаксису, были перепрограммированы, а работа на порядок ускорена и упрощена. Полностью обновлен этап сегментации, так как расширился характер и тип текстов. Теперь всем доступна Интернет-версия системы АПТ

95

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 95. Читать онлайн