ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 231. Читать онлайн

на

ив

уле >ыггге кое '

ов

,.1 ::.-1 ер-- же [ й- j .'О,

ер,

ги, ' ых' ' l rr [ая ой ий ю 4- ГН ес> >й

стадия(начинать,строить)

модальностъ(двлжен,строить)

оценка(иерввстеиенный,важность)

параметр(размер,комната)

часть(член, коллектив)

Некоторые слова (грамматически это существительные), совпадающие с именами СО, относятся к категории АСП и в первичном СемП занимают сразу две позиции — Р и его первою места: ВРЕМЯ(время,B); ПРИЧИНА(причина,В); ЦЕЛЬ(цель,В). Семантическое поведение этих слов аналогично поведению слов категории МЕСТ: они требуют нахождения того члена СемП текста, которым можно уточнить первый терм формулы. Их исходный информационный вес меньше, чем у слов-этикеток и у большинства слов-отношений.

5. ОПЕР — слова-операторы. В первичном СемП эти слова занимают первую позицию в составе формулы ОПЕР(С,В); на втором месте (позиция В) указывается семантически главная единица. Индивидуальное поведение единиц категории ОПЕР описывается алгоритмами преобразования части СемП; каждый оператор имеет свою сферу действия, в пределах которой могут выполняться сложные преобразования над уже построенной частью СемП [смп Богуславский, 1966]. К этой категории относятся частицы (не, даже, только), вводные слова (кстати, в частности, действительна, на самом деле) и др, (особенно, наоборот, соответственно). В дальнейшем слово-операюр может уточниться как ФУНКЦИЯ(С,В), МОДАЛЬНОСТЬ(С,В), КВАНТОР(С,В) и др.

Информационный вес слов этой категории минимальный, но в результате вызванных ими преобразований может измениться информационный вес главного герма В или связанных с ннм единиц. Работа с этими единицами относится к этапу собственно семантического анализа текста, когда сформированы единицы, могущие быть аргументами вводимых смысловых отношений. В существующей версии словаря лишь некоторые поля, например ВАР (вариант), релевантны для них; в поле КОММ (комментарий) можно формулировать предложения к алгоритмам обработки этих слов, а также делать ссылку на те лингвистические работы, где дается подробное описание их поведения.

Итак, главный семантический словарь — словарь лексем- включает полнозначные лексемы (в основном слова категории «этикетки», но также много аспектных слов). Второй по значимости — словарь отношений — включает слова и словосочетания, которые переходят в отношения. Слова-«полуотношеннн» (это те слова, которые из категории ЭТК переходят в дальнейшем в категорию ОТН, например, являться, соответствовать) распределены сейчас между этими двумя словарями: слова, принадлежащие к полнозначным частям речи, описываются в словаре лек-

231

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 231. Читать онлайн