ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 72. Читать онлайн

с входами в эти специальные словари, приписываются поме1 соответственно, «g», «и», «о». В связи с этими изменениями сло1 ря были модифицированы программы морфоанализа и програм1 пополнения базовых словарей.

Особым образом обрабатываются дефисные слова, частям з торых графематический анализ ставит пометы ДЕ1, ДЕ2... Сна ла ищется полное дефисное слово по всем словарям íà пол» совпадение. Если таковое нашлось, то части дефисного слова у не ищутся. В противном же случае, если полного дефисного cm не нашлось ни в одном словаре, оно анализируется по част опять по всем словарям. Если среди результатов последней ча< дефисного слова есть прилагательное, а среди результатов оста ных частей есть краткое прилагательное, неизменяемое прила тельное или наречие, то считается, что это сложное прилагате~ ное типа экономико-статистический или японско-китайско-росс] ские, поэтому выдается только этот вариант (сложное прила тельное) с морфологической характеристикой последнего ело При этом помета состоит уже из нескольких символов (= * + характеризующих каждую часть дефисного слова.

Варианты лемм неопознанных словоформ выдаются в порят уменьшения длины найденного в словаре «хвоста» словофорь При одинаковой длине совпадений варианты упорядочиваю~ по частям речи; прилагательные, существительные, глаголы, п1 чие.

Обороты при МорфАн пропускаются, так как они найдены этапе ГрафАн; грамматическая информация для них извлекае~ из словаря оборотов. Результаты помещаются в файл с имен текста и расширением '.lcm.

Как правило, вслед за МорфАн следует программа иоетмор~ логического анализа, которая разрешает часть неоднозначнооп учитывая ближайший грамматический контекст, обьединяет в од морфологический узел глагольные группы с аналитически вьй женным временем, а также именные группы типа «инициалы-им

В системе ПОЛИТЕКСТ результат ее работы фиксируетс~ файле '.рйн. Она осуществляет следующие проверки:

1)проверяется согласование по числу, роду и падежу пар п1 лагательное — существительное. Не совпадающие у них морфоз гические информации (МИ) отбрасываются;

2) проверяются падежи прилагательных и существительн~ стоящих после предлогов: соответствуют ли они падежам, зад» ным в списке падежей, где для каждого предлога указаны упр: ляемые им падежи;

3) аналитические формы глагола (будущее время и страдате> ные формы с причастием) преобразуются в одно слово, т.е. > словоформы объединяются в одну строку и ей приписывается ol лемма: например, был-ноднисан — ПОДПИСАТЬ;

72

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 72. Читать онлайн