ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 209. Читать онлайн

В 55. Этапы построения и единицы БТФ

Задаваемый для анализа массив текстов назовем Базой исходных текстов (БИТ). Лингвистический транслятор (ЛТ) выполняет многоуровневоепреобразование:

( из ~согов;

3 пе:ста

за-

~ре- ек;ен- кой

<ер-

юз~руг

па- ри) бедней г, а дом :та- KRK уры вге1ляr no ~ни ьль-

209

БИТ =» ... ЛТ ... =~ (БТФ}.

БТФ одного (сложного по содержанию) текста — не только важная промежуточная структура на пути к предельной цели, но и наиболее устойчивая и определенная из структур, сопоставляемых целому тексту.

Напомним, что начинает серию преобразований, ведущих к построению БТФ, традиционный лингвистический анализ «сии~у-вверх» (ЛТ-1). В него включен в нашей модели и этап локального семантического анализа, который завершается созданием текстовой семантической структуры, адаптивной к разным предметным областям н безразличной к последующей задаче. Эту структуру мы назвали семантическим пространством текста. Далее начинают работать механизмы собственно семантического анализа (ЛТ- 2), которые, в частности, преобразуют СемПрост в ситуативное представление текста. В приложении 11 приведен пример СнтП одного простого предложения. Снабженная внешней дескрипцисй, единица СИТ структурно не отличается от целевой единицы ГФ (или Т-Факт), поэтому схема иллюстрирует также и ТФ.

(СитП1} как последовательность ситуатнвных представлений первого уровня для всех простых предложений текста — это еще ~ингвистическая структура.

С СитП1 начинаются межфразовый анализ и собственно семантические преобразования. В основном это утрата части информации, не существенной с точки зрения структуры целого, изменение лингвистических иерархий (ср.: подготовка к сбору урожаяв бор урожая в стадии подготовки) и др. Единицы типа СИТ могут переходить в единицы Соб в том случае, если лексическое ядро Сит входит в заданные списки слов-событий илн на основе вычисления словарного веса единиц в составе СИТ. Приведем в качестве примера сообщение Предпринимается ряд мер по усилению роли факторов, способствующих быстрой ликвидации пожара. ИПС найдет в нем ключевое словосочетание ликвидация пожара и чожет заменить ero термином ТУШЕНИЕ ПОЖАРА, который и войдет в поисковый образ документа. Лингвистический анализ юлжен выбрать в качестве лексического ядра СИТ то же словосочетание ликвидация пожара (даже если оно не задано никаким встречным списком), но припишет ему модальность слабой реальности (меры по активизации чего-то абстрактного, которое может привести когда-то к быстрому уничтожению пожара). Ведь

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 209. Читать онлайн