ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 25. Читать онлайн

БД ему

нг1- :та. риг.п. кду ива сех ~ед- «II, гую

иия

шм

~им

ен- ей- ек-

ипа

ен- поСТ ас оке се- коуть ин-

та) ек-

ти.

см.

ес-

гые

гы-

.ми

ггя-

ес-

крипторы, термины информационно-поискового тезауруса (ИПТ). Информационный тип молелей — достаточно гибкий:

а) с точки зрения входного анализируемого материала (принимаются естественные тексты без каких-либо структурных огра~ гичений и с довольно большим тематическим разбросом);

б) с точки зрения выходных структур, называемых поисковым образом документа: обычно ПОД представляет собой свободную структуру, элементами которой являются слова ЕЯ, в основном гермины, т.е. такие единицы, которые приняты и в естественном понимании. Они не такие мелкие, как в лингвистических модеяях, и не такие крупные и подчас отражающие специфическую действительность, как в системах ИИ, они «средние» и обычно имеют переводные эквиваленты в других ЕЯ;

в) с точки зрения средств анализа они не привязаны к конкретной тематике, а достаточно универсальны (так, в некоторых ИПС реализован бессловарный статистический анализ лексического материала, строящий ПОД для текстов любой тематики).

Очень важным параметром ИПС являются реальные, не игрушечные масштабы, наличие компонента «реальный пользователь», с которым у системы может быть организована обратная связь, а это является началом обращения информации. Наличие пользователя (хоть и вне системы) создает реальные критерии оценки качества работы ИПС, что влияет на изменение параметров, учитываемых в работе ИПС. Эти параметры ИПС необходимо учитывать при создании моделей понимания произвольного текста. Узким местом таких систем является небольшой смысловой потенциал (см. об этом в гл. 9).

Структуры типа Г (структуры баз данных и знаний) еще ближе к задачам пользователей и составляют часть реквизита их производственной деятельности. Их можно назвать специализированными, экстралингвистическими структурами, они отображают часть действительности, являются квазиденотатом, который можно привлекать при анализе естественного текста как дополнительное знание. Структуры баз данных — это формальные, жесткие, фиксированные структуры (например, таблицы с описанием кадрового состава учреждения, таблицы занятости населения и др.), поэтому над ними возможны формальные, математически обоснованные операции. Над структурами типа БД можно надстроить лингвистическую систему, генерирующую текст на ЕЯ (см. гл. 10).

Среди них есть и полужесткие структуры динамического типа. Это сценарии, схемы, ситуации или их части — «фреймы». Они образуют базы знаний (БЗн) системы. Такие структуры получили широкое распространение в системах класса ИИ, они отображают сюжет целого текста, который, как известно, безразличен к членению на предложения. При использовании их в качестве инструмента анализа задаваемая жестко схема сюжета дополняется

25

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 25. Читать онлайн