ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 5. Читать онлайн

уже на двух ранних стадиях. Глава 5 освещает проблематику синп|ксического анализа (СинАн) предложений. В составе предложенной автором информационно-лингвистической модели (ИЛМ) синтаксис рассматривается как опора для понимания и поэтому может быть неполным. Объясняется механизм взаимодействия сингаксической и семантической структур, при котором построенные формально синтаксические связи интерпретируются в первичном семантическом представлении (СемП), строятся семантические узлы, после чего можно вернуться к синтаксическому представлению (СинП) и достроить единицы СинП, уточнив их как члены предложения, аттестованные семантически (как обстоятельства места, времени и т.п.). Глава 6 подробно разбирает состав и функционирование семантического компонента системы в составе ИЛМ. Это только локальный (в пределах каждого отдельного предложения) анализ, но он вводит свой метаязык, с помощью которого строятся все дальнейшие семантические представления.

Семантический компонент — центральная часть информационно-лингвистической модели, объясняющей мягкое автоматическое понимание текста. Он обеспечивает функции многомерного, неоднозначного, неполного, выборочного и других видов естественного понимания. Ero основное назначение — справляться с разноязычием, которое может быть естественно-языковым (например, английский текст — русский реципиент), профессиональным,проблемно-ориентированным (поскольку каждая предметная область или задача вводит свой профессиональный язык) и ценностным (у каждого реципиента свои информационные установки и ценности, «в пользу» которых может строиться СемП).

Последовательность всех локальных интерпретаций единиц текста в виде семантического пространства (СемПрост) текста — первая реальная, строящаяся программно, а не только теоретически целотекстная структура.

Описанный в главе 7 процесс создания глобальной структуры текста сводится с технической точки зрения к устранению свойств неидеальности СемПрост текста. Это устранение избыточности, уточнение отношений иерархии, устранение единиц, получивших в ходе анализа малый информационный вес, и др. Основная содержательная операция глобального анализа — синтез новых единиц типа СИТ (ситуация). Высшей единицей, представляющей текст во внешней среде, предложено считать текстовый факт (ТФ). Это и лингвистическая единица, и кандидат на включение в базу знаний определенной предметной области (ПО), т.е. объект, традиционно относящийся к экстралингвистическим единицам.

Лишь на глобальной структуре могут проводиться важнейшие процессы сравнения содержания разных текстов, приводящие к построению «текста информации». Это структура, получаемая в

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 5. Читать онлайн