ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 177. Читать онлайн

ого роKa"" еак ьиы ер- де- ва- ро~ых

lC- :та: ази ны ес- лигпа ут- IC, ПС ек- яс- баз,a ~ые

ути раьпъ си«ии ~есмах mr- ли- обдл зы ло по бо

1ки те

горин. Так, в некоторых ИПС выделяются категории дескрипторов: агенты, качества, предметы и процессы (а в системе «КРИС- ГАЛЛЬ — процессы, свойства, материя, составные части). Категории могли быть зафиксированы в словаре основ дескрипторов, иногда при суффиксах, сочетающихся с данной основой. Это уже начало простейшего семантического анализа.

Кроме указателей роли в ПОД некоторых систем вводятся и указатели связи, понимаемые как пространственная близость в тексте; иногда они ранжируются: соседние слова образуют самую сильную связь, а самая слабая связь устанавливается между словами, оказавшимися в одном абзаце.

Наконец, несколько систем АИ вводят в грамматику используемого языка простейшие семантические связи. Первым таким ИЯ был СИНТОЛ, в котором ПОД представляет собой набор сингагм (пар дескрипторов), связанных одним из четырех отношений: координативяое (чисто формальная связь), колсекутивное (причинности или воздействия), ассоциативное (принадлежность в широком смысле) и лледикангивпое (отношение между предикатом и его актантами) [см.: Кросс, Гарден, Леви, 19б8]. А сами отношения строятся в зависимости от того, слова каких семантических категорий (предметы, состояния, действия и предикаты) они соединяют.

Дальнейшие работы над ИПС с автоматическим индексирова~нием связаны с развитием самого инструмента АИ, его усложнением, в первую очередь за счет введения парадигматических сва~ей. В тезаурусах фиксируются отношения родства между терминами, и зто приводит к созданию иерархической структуры ПОД, отражающей иерархию понятий в тезаурусе. Учет их распределения по тексту и частоты упоминаний позволяет определять тема~ ическую принадлежность текста и разносить тексты по рубрикам, т.е. классифицировать поток, что очень важно для больших информационных учреждений, особенно связанных со СМИ.

Автоматическое индексирование предпочтительнее ручного ( которое еще называют интеллектуальным индексированием), поскольку в случае с АИ:

а) исключается субъективизм индексаторов (разные КС из одного класса условной эквивалентности переводятся всегда в один и тот же дескриптор);

б) обеспечивается стабильность результатов;

в) ошибки АИ очевиднее и устраняются проще, т.е. почти ав- ~ оматически.

При всех достоинствах моделей типа ИПС отсутствие система- ~ ических методик работы с текстуальными отношениями не дает пока возможности ставить типичную информационную задачу: автоматического построения реферата (не квазиреферата, а соаержательно сжатого текста) на основе полного текста. Итак, глав-

177

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 177. Читать онлайн