ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 189. Читать онлайн

или

зед-

се- опуры

емы

зтся

, но иер, етов id of лько сонаи каего жен лов,

му с 1ию. отея Пи 1U 001 1 по )03]. ебу- али~ном

ема . ин- К в. ы, м

делями анализа предложений, с другой стороны. ИЧИ — более простая задача, чем понимание целого текста, так как семантика системы ограничивается заданными заранее списками и шаблонами.

ИЧИ-системы обеспечивают построение»специальных объектов», которые поддаются формальному обнаружению и которые приближают нас к анализу целого текста. Спецобъекты — это одна из простых разновидностей полноценных семантических узлов, построение которых было заложено в систему ПОЛИТЕКСТ и включено в концепцию создания Базы текстовых фактов.

Что касается описанного выше тематического анализа (ТемАн), то его тоже можно считать процессом извлечения частичной информации, той, которая выражена в тексте терминами или близкими к ним образованиями. Темы можно формировать двумя разными способами, приводящими к двум разным результатам:

а) тезаурусный подход построит ТемП как перечень (или более организованную структуру) объектов, специфических для данного типа текстов;

б) лингвистический путь построит ТемП как совокупность (или иерархию) единиц типа СИТ (ситуаций).

Тот и другой путь определения основных тем документа опирается на свойство связности текста, но использует разные инструменты. Построение ТемП первого типа описано на примере работы системы УИС РОССИЯ. В этой системе были сконцентрированы и развиты многие лингвистические наработки, заложенные в системе ПОЛИТЕКСТ [см.: Леонтьева, 1995]. В принципе два пути — Тематический анализ и Ситуативный анализ — должны дополнять друг друга в составе полной системы АПТ: ведь нужна не только связность по терминам, но и связность по развитию ситуации. И оба подхода могут быть дополнены более современными механизмами, как это описано в работах последних лет по развитию информационных систем [см.: Ступин, 2004].

Литература

Автоматизация индексирования и реферирования документов // Итоги науки и техники. Серия «Информатика» / Под ред. В.И. Горьковой. — М., !983. — Т. 7.

Б е л î í o r о в Г. Г., Ш е м а к и н Ю. И., Н о в о с е л о в А. П, и лр. Авгоматическое индексирование документов и запросов // НТИ. — М., 1973. — Cep. 1. — № 7. — С. 17 — 25.

Берзон В.Е. Об одном подходе к проблемам автоматического реферирования я автоматического свертывания индексируемых текстов // НТИ. — 1971. — Сер. 2. — № 10. — С. 16 — 21.

Гиндин С.И., Леонтьева Н.Н. Задачи и общее строение системы автоматического индексирования с использованием янформацион-

!89

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 189. Читать онлайн