ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 176. Читать онлайн

структурой, сжатым представлением текста, Но для свободн текста терминологический ПОД далеко не всегда можно пост; ить, а построенный может до неузнаваемости исхазить содер: ние. Так, предложению из художественного текста Данилов, » всегда поутру, гладил электрическим утюгом черную бабочку для х будет сопоставлен ПОД„состоящий из найденных в тезаурусе т минов: электраческий утюг, черная бабочка, яма, а при восхож нии к вышестоящим дескрипторам можно получить последо тельность имен рубрик «Электротехника», «Энтомология», «Ст ительство». А на самом деле речь идет о музыканте и концерт» атрибутах.

В большинстве систем автоматического индексирования ИГ структуры дают точечное отображение содержания целого тек< ПОД содержит лишь перечень дескрипторов-терминов, а св: между дескрипторами отсутствуют. Такие структуры безразлич к членению текста на предложения, поэтому они плохо совм тимы с лингвистическими структурами, для которых главной е, ницей является предложение. Основной недостаток этого т» структур — слабая семантическая сила, в частности из-за отс ствия связей между понятиями в окончательной структуре. И» не работающие с текстуальными отношениями, называют «И' без грамматики». Чтобы такая структура без связей могла эфф тивно работать, она не должна быть слишком большой, что объ няет ограничения на объем (а следовательно, и на жанр) обра тываемых источников — это не статьи произвольного размер: короткие, компактные по смыслу тексты, в основном вторич» (рефераты).

Даже такая развитая ИПС, как система СКОБКИ [см.: Лах и др., 1985], выросшая из системы ЭЛЕКТРОТЕХНИКА, не ботает с текстуальными отношениями, которые могли бы б» установлены синтаксическим анализом. Частично это компен руется информацией о позиции КС в тексте (или о вхожде» дескрипторов в предложения), что дает основания приписать л крипторам какие-то весовые коэффициенты, в ранних систе1 АИ их называли ролями. Наибольший вес получают слова из: павия. Роли также могут задаваться при термине в словаре. Ро веса иногда присваиваются ключевым словам на основании ратной связи с пользователем.

Результаты такого индексирования часто используются построения квазиреферата: отбираются те фразы текста, кото) оказались «весомее» с точки зрения концентрации ключевых с (КС) и с учетом их положения в тексте, Например, первая, » рая и последняя фразы текста считаются более весомыми или лес нагруженными по смыслу.

Наличие роли в структуре ПОД — это уже элемент грамматв Еще более содержательную аттестацию дескриптора задает ка

17б

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 176. Читать онлайн