ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 211. Читать онлайн

епочка одит к ia даже олучит дакто- xropoM дается икато."т под-

твенно ~анный яцы до линии. Это, в ;ых для >строе- наибо:ы слоечного ели же 'висти-

ценное услого ТФ, самого

иые из ксиче- стано(м слоне вс ми Т инать ядро мо как ."дария m,ин исей

r ТФ

:то

бходи

ктура

разных баз знаний. Обычно оно осуществляется операцией перемещения одного из аргументов законного предиката на место предиката, часто с вытеснением последнего из структуры ТФ. Так, из сообщения В 1996 году было создано совместное предприятие «Факел» с участием нескольких высокодоходных фирм на роль ТФ должна быть выбрана единица совместное предприятие, а не бьио создано.

ТФ — не только единицы представления текстовой информации, но и единицы хранения этой информации в виде отдельных записей БД. При их включении в базу фактов или базу знаний каждый ТФ должен быть снабжен всеми атрибутами нормального текста: автор ТФ, ссылка на контексты, на источник и т.д., т.е. о нем должен быть сообщен набор сведений, составляющих его внешнюю дескрипцию, как и у текста (см. гл. 3).

В ряду единиц текстового анализа ТФ — та первая единица, к которой могут быть применены логические категории «истинно/ ложно». Например, если во всех газетах названы одни и те же параметры события (имя, время, место и др.), ero можно объявить истинным текстовым фактом. Однако истинность ТФ не исключает возможности расхождений и даже противоречий с историческими фактами. Полноценной единицей базы знаний может быть лишь Т-Факт, согласующийся с фактами других источников в той же предметной области. БТФ перерастает в базу знаний заданной предметной области по мере того, как ТФ получают статус Фактов, т.е. истинных в данной ПО утверждений. Критерии перехода ТФ в Факт (ПО) должны задаваться отдельно (Т-Факт может быть частично истинным и т.д.).

Приведены примеры возможных ТФ, составленных на небольшом массиве текстов СМИ.

Иллюстрация: фрагмент БТФ. Несколько фрагментов БТФ были построены при работе лингвистов с диалоговой программой, позволяющей засылать в БД (Грамматику ситуаций) выделяемые на экране фрагменты из поступающих текстов. Имя ТФ, многоместного предиката, также выбиралось из текстового материала. Базой исходных текстов послужили около 100 газетных сообщений, появившихся сразу после событий 1991 г. в России (антидемократический путч, выдвижение Ельцина, в дальнейшем- распад СССР). Заметим, что почти все аргументы ТФ заполнены не на основе сильных лингвистических управлений; они сильны только в данной ПО, и часто их можно получить только смысловым выводом. Некоторые энциклопедические сведения вводил лингвист исходя из собственного понимания семантики слова. Такие добавления не из текста, а из собственных знаний в этой игрушечной системе берутся в квадратные скобки (например, КОНТРАГЕНТ понятия государственный переворот введен как ~ Прежняя власть)).

211

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 211. Читать онлайн