ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 132. Читать онлайн

В научно-технических текстах узкого профиля наиболее в мыми словами являются термины; на их выявлении н учете ст стики встречаемости, распределения по тексту и других внеп признаках основана работа информационно-поисковых сис Наиболее продвинутые информационные системы учитывают же тезаурусные связи между терминами, их статистику, наел ванне и т. п.; их учет позволяет отбирать из текста наиболее в мые фразы. Получаемые таким способом квазирефераты или зианнотации часто смотрятся вполне естественно.

Что касается выявления конкретного содержания целого ста, то здесь необходимо опираться на слова, обозначающие < сываемые в тексте ситуации и их участников, причем желате; задавать логику развертывания ситуаций.

Система, которая могла бы объединить все эти средства с в единое целое, — дело будущего, но строительные блоки т; системы прорабатываются во многих исследовательских пр тах.

Так, в некоторых работах предлагается способ сжатия д мента (Automatic Text Summartzation), основанный на анализе и варнтельно автоматически размеченных системой GDA (G Document Annotation) структурах массива документов [смл М Has(du, 1998]. Предложено новое множество признаков («тэг~ прежде всего обозначающих части речи, вводящих символ отл ного предложения и других больших частей текста. Резуль аннотирования выводятся на экран и могут быть поправлены как имеется соответствующий редактор. Система GDA строит z ритекстовую сеть, в которой отражены актантные (Агент, П енс, Реципиент) и риторические (Причина, Следование и отношения; их не всегда можно различить, поэтому они зат общим списком (Thematic/Rhetorical Relations). Кроме того, ) навливаются анафорические и кореферентные связи. По резуз там GDA вычисляется степень информационной значимост~ дельных элементов и целых поддеревьев, которые маркирук чтобы затем войти в окончательный сжатый текст/реферат. E личие от информационных систем, где по простым крите1 статистическою свойства вычисляется значимость целых пре жений, в данном подходе результирующий текст может быть нерирован из частей разных предложений, но в порядке их ct, ванна по тексту. Процедура сжатия опирается на лингвистиче свойства, т. е, не зависит от ПО, а размер реферата (степень тия) заказывает сам пользователь.

Системой GDA могут пользоваться и авторы текстов нз Иь нета, тогда их тексты смогут обрабатываться интеллектуаль процессом основной системы (содержательный поиск, маг ный перевод, реферирование с указанной пользователем cs

нью сжатия и др.).

132

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 132. Читать онлайн