ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 97. Читать онлайн

4стем 4ЕС осста :peso ечен амыш ерьез рения доста доже ~ван зисто 4Ан, :й cer : Коб жени рафо дини :т ти дини Грам гагм и дре обра сталь к слусочи ариен Связ зовы вляет :ле за гакси-

аровн зцесс шали агина

дежн

rob

,rIlr4tx: синтаксис собирает лишь такие части структуры, которые »рошо ложатся в заданную формальную грамматику. Часто апаш I предложения не доводится до окончательного СинП, тем са»ым резко снижается число вариантов разбора. Но при этом обяа ~ ~ ельна какая-то другая поддержка — не «снизу», а «сверху». Ею ~пляются схемы и структуры предметной области, которые при падизе наполняются материалом «узнанных» лингвистических ~а ьектов. Этот подход можно назвать тенденциозным понимании: несмотря на свою размытость, приблизительность, он жестко щтерпретирует текст. Подобный метод сейчас широко использу~ ся в системах типа Information Extraction (см. гл. 9). При этом ~ропускается этап, который мы считаем общесемантическим анашзом текста, он заменен специальным, или концептуальным, щализом, который проводится сразу в терминах ПО.

С практической точки зрения стратегия, в которой синтаксис а ущественно обогащен элементами семантического уровня, молот быть — самая эффективная, особенно для систем машинного перевода. Заметим, однако, что подход, реализованный в систе«ах ЭТАП-2 и ЭТАП-3, создавался и постепенно оттачивался не адин десяток лет, работа и сейчас продолжается, в ней задейачвован большой и сильный лингвистический коллектив. Повторить новому коллективу разработку, подобную синтаксису моде~н «Смысл «» Текст», очень трудно, если не невозможно. Комбипаторный словарь, как и все словари семантического анализа (см. а а. 12), трудно расширяем в массовом масштабе. Но жизнь развивается с такой быстротой, что задачи и методы интеллектуальной обработки текстового материала да и сами способы хранения знаний и т.д. за это время уже претерпели и еще могут претерпеть кардинальные изменения.

Синтаксис, как и морфология, — хорошо разработанный компонент АПТ. Мы склонны утверждать, что с точки зрения дальнейшей семантической интерпретации все равно, какую синтаксическую модель выбрать (тем более не важно, какова была страгегия морфологического анализа). Важно, как семантический компонент сможет интерпретировать то, что осталось незавершенным с предшествующих уровней анализа.

Взаимодействие синтаксической структуры с единицами семантического уровня, т. е. концепция связи СинАн и СемАн, попадает в центр внимания в особенности потому, что настройка синтаксических процессоров на специфику анализируемых массивов оказалась очень дорогостоящей и не очень эффективной процедурой. Видимо, проще исчислить даже большое количество специфических для разных ПО обьектов и способ подключения

4 Jleo»««а

97

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 97. Читать онлайн