ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 205. Читать онлайн

р и-

в в- оез ет оие о- еое о-

Д" ке

а-

ля т«и

хя

н- д- р-

Д-

е-

оть

о-

а- а[

о

f

а

ми, которые предоставляет корпусная лингвистика. P. Киттредж делает вывод, что искомое СемП должно быть похожим на семантические сети модели «Смысл «» Текст», в структуре которых кроме очевидных и всем известных достоинств отображается темо-ремная организация, что очень важно для систем генерации, улучшает стилистические качества текста, в частности помогает строить правильные перифразы.

В СГТ реализуется особый вид понимания, в котором объектом понимания является какая-либо искусственная структура, для нее заданы правила ее считывания, а результаты должны быть выданы пользователю в виде понятного текста на его языке. Тем самым в ГТ-системах de facto используется принцип «текстовости» (см. гл. 1). Информацией признается лишь такая порция сведений из базы данных или базы знаний, которой можно придать форму правильного текста на естественном языке. Этапу оформления выходного текста предшествует зтап информационного синтеза: нужно отобрать из базы то содержание, которое составит ответ на вопрос к базе (стратегический компонент), затем задать его поверхностное выражение (тактический компонент). Очевидно, что установка на построение хорошего, отвечающего нормам языка, текста в тактическом компоненте предъявляет определенные требования к составу и структуре исходной базы знаний: она должна содержать все сведения, необходимые для построения нормального текста.

Очень сложная техника генерации естественного связного текста на выходе систем ГТ часто объясняется отсутствием нужных расчленений информации, поступающей в базы данных. Знания, извлекаемые из текста, должны быть полноценными для всех тех внешних пользователей, которым зги знания нужны. Это лишний раз подчеркивает необходимость адекватного представления и релевантной обработки явлений связного текста на уровне его анализа, понимания и предъявляет особые требования к языку, на котором представлены структуры, являющиеся исходными для СГГ и конечными для систем АПТ. На наш взгляд, зтот промежуточный язык должен быть языком представления знаний, но ero окончательный вид еще не выработан.

Литература

Болдасов М.В. Разработка прикладныхсистем генерации типовых

текстов на ЕЯ на основе представления информации на языке ХМЬ //

Труды Международной конференции ДИАЛОГ-2004. — М., 2004.

205

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 205. Читать онлайн