ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 52. Читать онлайн

в) ГрафАн (tokenizotion), подготавливающий контекст дг

боты следуюших этапов (морфологического анализа, этапа

пения с базами данных и др.);

r) композиционный анализ, устанавливающий иерархик

ниц типа «абзац» и «предложение» и создающий основу для

нейших этапов, в основном для синтаксического анализа.

Полученные данные заносятся в отдельные структуры,

рые могут быть в дальнейшем предметом обращения к н1

ИПС, а также из разных лингвистических процессоров.

Препроцессор: подготовка массива

Все документы массива проходят предварительную обра( которая включает три шага.

1. Сложные документы автоматически разбиваются на (основной текст и каждое приложение в отдельности). Эти объявляются самостоятельными документами и помещаю отдельные файлы с уникальными именами, отражающими приложений с основным документом.

2. Для каждого такого самостоятельного документа авто чески строится шапка, в нее записываются формальные пр ки документа. Для основного документа — это тип доку» заголовок, место и дата подписания, подписываюшая инста номер, дата, имя соответствующего файла, количество при. ний; для приложений (и подприложений, т.е. приложений к ложению) также указывается порядковый номер приложени заголовок. При этом выводятся в отдельный файл для дальн< ro просмотра нестандартно или ошибочно оформленные вне реквизиты документа. Таких «плохих» ситуаций немного: н, мер, документ со следующим номером отсутствует в массив подписи; объявлено, но отсутствует приложение, и т. п. Их| ление важно для обеспечения полноты и чистоты массива.

3. Проверяется и корректируется орфография документов сматриваются «плохие» ситуации; недостающие части досы. ся в основной массив.

Препроцессор: создание внешней дескрипции докумен

После этапа предварительной обработки сложный доку»к базы исходных текстов разбит на относительно независимые поненты, один из которых (обязательный) является осно документом, а остальные (если они есть) — документами-п жениями. С каждым документом связан свой набор реквизи

Описание документа складывается из двух частей — впев внутренней дескрипций. Первая включает набор внешних рек тов, куда входят такие параметры, как имя массива, дата вы

52

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 52. Читать онлайн