ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 167. Читать онлайн

овпада ы пред гегори "-А, о гу ни.

:о так узлы

ь назва

~той ка

ексем

начны

ситель

ro узла

юе зна

стави

и ЗНА

дереву

,'СА

егории

ии (на

"ТИ

:ть-

отребо

.С-

юлно

завис

ьере вс

тентно Ситуа

ически

зксем

гп олпе

ый уз

: члена

:манти

I;ECC

ю кате ии ХА

»ЪЕК ИКА .КТО

На основании только такого словаря при автоматическом анализе текста речь может идти только о вылавливании, «выуживании» той лексической информации из текста, на основе которой можно воссоздать, синтезировать более или менее полную структуру ИнфП в интересующем нас аспекте (фактографическая информация). Но при хорошо выбранных единицах ИЯ даже первичное ИнфП является достаточно содержательным. Приведем пример первичного ИнфП в терминах введенного выше категориального ИЯ.

Пример Продуктивный пласт имеет мощность от 100 до 200 м будет иметь первичное ИнфП (полученное только заменой узлов):

ОБЪЕКТ (пласт) — ХАРАКТЕРИСТИКА ОБЪЕКТА (мощность)- ЗНАЧЕНИЕ ХАРАКТЕРИСТИКИ (om 100 до 200 м)

ПРОЦЕСС (давало) — ОБЪЕКТ (месторождение)

ЗНАЧЕНИЕ ХАРАКТЕРИСТИКИ (8,8 тыс. м~/cym)

ПРОЦЕСС (давало) — ОБЪЕКТ (нефть)

Итак, первичное ИнфП в терминах категориального ИЯ имеет вид множества цепочек (в частном случае одной) и/или узлов (в частном случае одного). Если цепочки правильно зацепляются (т.е. все связи правильны), они образуют дерево (когда заполнены все четыре категории) или поддерево.

Анализ текста, учитывающий классификацию лексики только в терминах категорий и опирающийся лишь на грамматику категориального ИЯ (без полного лингвистического анализа), привозит к образованию правильных цепочек в идеальных или простых случаях (когда, например, в документе описывается всего один ПРОЦЕСС, один ОБЪЕКТ и т, д.), в остальных случаях возможны неоднозначные решения, приводящие к «шумовым» эффектам.

Основным средством образования правильных цепочек в сисгеме СПАНГ является дополнительная (к категориальной) классификация лексики. Она опирается на понятие стандартной композиции текстов по рассматриваемой тематике, позволяющей выделить основные аспекты содержания документов. Остановимся подробнее на аспектах, т.е. на аспектном ИЯ.

Рассмотрение типового развертывания содержания реальных чокументов, а также множества реальных запросов по данной тематике позволило выделить три стандартных аспекта содержания.

Аспект А: Описание предмета изучения, исследования, экс~плуатации и т.п.

Аспект В: Описание метода воздействия на предмет.

Аспект С: Описание результата воздействия.

Эти аспекты можно считать типовой схемой документов, относящихся к данной ПО.

Более полную классификацию лексики, которая дает более связное отображение фактографического содержания документов,

167

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 167. Читать онлайн