ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 274. Читать онлайн

«Содержание понятого» ие называем смыслом, оставляя субъективное понятие СМЫСЛ за пределами компетенции Системы АПТ, Как оценку результата работы Системы его можно конкретизировать, например, так: Если воспринимающее устройство может присоединить Информацию, полученную из текста, в свою индивидуальную базу знаний, не создавая при этом дублирования, значит, данный текст имеет смысл для этого BY.

Моделируемое таким образом понимание намного беднее «че- I ловеческогогс оно прямое и бесхитростное, так как имеет дело, только с тем знанием, которое задано в системе явно. Модель нь ~ может учитывать ситуацию, при которой «все, что пишет автор Х, надо понимать наоборот», ей недоступен анализ шуток, каламбуров и т.д., если не задан словарно соответствующий перевод.

Изложенное в данном пособии авторское видение архитектуры системы, «понимающей» тексты, — это не предложение готовых рецептов, а скорее поиски новой парадигмы. Горизонты этой парадигмы очевидны: с одной стороны, точный лингвистический анализ, с другой — неточный информационный, меняющий объем понятого содержания. Между ними — пространство решений, сфера действия понимаемого нами широко семантического компонента.

Одна из важных тенденций в современных разработках систем АПТ — работа с неполной, неточной, неопределенной информацией. Неполнота и неоднозначность присутствуют на всех уровнях анализа текста. Это и неполные словари (а они в принципе не могут быть полными ввиду постоянных изменений в языке); и недостроенные синтаксические структуры (иногда и недостижима полная и «правильная» синтаксическая структура из-за ошибок в тексте, из-за свободного обращения современных пользователей с языковыми нормативами); и «дырявые», с белыми пятнами семантические представления. Автор текста часто намеренно не хочет освещать те валентности, заполнять которые ero вынуждает полное словарное описание валентного слова (не боясь даже' прослыть «коммуникативным неудачником»), Но такое «незнание» должно найти эксплицитное выражение в структуре; часто это вопрос, rro которому может идти развитие связного текста.

Все такие «нарушения» в тексте нужно рассматривать не как досадную помеху для автоматического анализа, а как проявления живого организма, их надо фиксировать в семантической структуре и использовать конструктивно. Так, локальная семантическая неполнота заставляет выйти за границы предложений, в связный текст, а информационная неполнота инициирует поиск ответа в семантической сети, и т.д.

Конкретная система не может создаваться по предложенной модели иначе, чем в режиме исследования, объектом которого являются и свойства текстов, подлежащих анализу либо перево-

274

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 274. Читать онлайн