ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 185. Читать онлайн

>в (основ-

з;

>злов (ло-

>в;

представ-

ров.

ножество ~ми пред>ее глагол ьное и не тредложе-

х возмож" ачинается юряющи !ержит ли ос поены присоедикрипторы > таблицы «t должн с кажды меньше

ия являет ыбранны ия текста

'>дложени :ние, при

ннотации ии;

>в аннота

:ние вклю >ы оно н ем, вклю

1 не вклю

Таким образом, система как эксперт строит аннотацию в зависимости от количества основных тем, выделенных ею в тексте, и от распределения этих тем по предложениям текста.

Однако пользователь имеет возможность задавать величину аннотации в абсолютных размерах. Это нужно, например, для того, чтобы аннотация помещалась на экран системы пользователя. Если размер построенной аннотации больше, то аннотация урезается до подходящего размера. При этом система в состоянии отследить, какие основные темы документа не попали в урезанную аннотацию, и сообщить пользователю, что еще обсуждалось в данном тексте.

Объединенные с хорошо отлаженными технологиями стандартных ИПС методы информационного анализа УИС РОССИЯ привели к качественным и устойчивым результатам.

Я 48. Системы автоматического извлечения знаний

из текстов

В моделях типа Information Extraction планируется и реализуется ограниченное, ПО-зависимое понимание. Извлечением локальных сведений из текста, или экстрагированием информации, на>ывается любой метод выбора релевантной для пользователя связной порции информации из большого массива текстов. Извлеченные из массива сведения заносятся в структуры табличного вида (templates), которые специально формируются как множество слогов, характерных для данного типа объектов. Результаты запоминания слотов могут выдаваться пользователю на экран, могут сохраняться в виде баз данных или поступать на вход следующей системы (например, системы генерации отчетов).

Системы извлечения частной информации работают обычно в <ва этапа: сначала стандартная система информационного поиска выбирает подмножество документов, релевантных заданной теме ic помощью поисковой машины или вручную), затем на отобранном множестве работает собственно ИЧИ-система, отыскивая в каждом тексте описанные грамматикой шаблоны.

Работы по созданию ИЧИ-систем получили интенсивное развитие в США в 1990-е гг. Например, подобная работа была выполнена на медицинских текстах в Нью-Йоркском университете (NYU). В последней декаде ХХ в. такой метод получил мощную поддержку: работы по ИЧИ-системам были объединены (на конкурсной основе) серией конференций MUC (Message Understanding Сonference) [см.: Hobbs, Appe1t, Bear et ai., 1996; Grishman, 8undheim, 1997]. Темы поиска, задаваемые организаторами MUC, отличались большим разнообразием. Это были корабли и их параметры, информация о террористах в Южной Америке, приобре-

185

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 185. Читать онлайн