ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 255. Читать онлайн

русские предметные имена (морковь, картошка...), а глубокое исследование сочетаемостных свойств этих имен ставит перед разработчиками компонента «Онтология» новые интересные вопросы [см.: Рахилина, 2000].

Перечисленные, а также многие другие словарные работы свидетельствуют о том, что есть много способов описания семантики слова, но что в прикладных системах должно быть согласие между словарем, метаязыком и стратегией анализа, т.е. способом эффективного использования заложенных в словаре знаний.

При разработке нашего комплекса РУСЛАН основной концептуальной установкой было обеспечить «выход в текст» и стыковку с предметной областью. На первую часть задачи работают принятые в системе язык и способ описания валентностей: это в основном текстовые валентности. Вторая часть может быть выполнена в совокупности с системой предметных словарей (спецсловарей). Семантическому словарю отводится роль скрепляющего элемента системы, который поддерживает соединение, мягкую стыковку лингвистической и предметной информации при построении структур текста семантического уровня.

Понятно, что одним волевым усилием невозможно преодолеть конфликт (а он всегда возникает хотя бы при попытке технической реализации) между разными возможными аспектами описания лексики. Невозможно также учесть все регулярности контекстных влияний на изменение значений отдельных слов, на их жизнь в тексте. В нашей модели это компенсируется наличием, как минимум, двух дополнительных (к традиционному семантическому) уровней описания, — глобального текстового (по сути «собственно семантического») и информационного, настраивающегося на запросы и информационные установки пользователя. Настройку можно осуществлять словарным путем — заданием параметров полей в зоне ПРАГМатика, а при переходе к принципиально другой ПО можно менять только эти релевантные поля. Такой способ хотя и не решает все проблемы перехода к другой ПО, но мы относим его к «мягким» механизмам систем АПТ.

В настоящее время словарная база РУСЛАН включает около 13 тыс. описаний лексем. Около 1 тыс. словарных статей составляют слова-отношения и обороты. В такой же форме в нашей модели описываются кроме предлогов и союзов (простых и сложных) еще и грамматические конструкции, знаки препинания и, наконец, сам язык двуместных отношений.

Что касается терминологических, т.е. полусвободных и даже свободных, словосочетаний, то они принадлежат в основном к категории слов-этикеток, но в отличие от последних часто не имеют валентностей (cp. следстеа массовой информации). Стандартный формат слов-лексем дополняется описанием внутреннего состава терминов для того, чтобы можно было отождествлять раз-

255

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 255. Читать онлайн