ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 263. Читать онлайн

«аннотируются» ролью в предложении (которая называется «функ- тором»). Функторов примерно 60: Актант, Пациенс, Адресат, Источник, Эффект, а также разные типы пространственных, временных и иных обстоятельств: Средство, Способ, Степень, Последствие, Условие. Большинство функторов приписывается вручную, но создается обучающийся модуль, который хотя бы часть функторов будет строить автоматически, опираясь на правила и словарные данные, извлеченные из уже аннотированной части корпуса.

предложени сна

ре (topic focus articulation — TFA). Последние работы чешских лингвистов обогащают глубинные синтаксические структуры еще одним видом информации — введением кореферентных связей для личных и указательных местоимений [см.: Кибоча, Налбоуй, 2004].

Такой уровневый подход к аннотированию текстовых корпусов принят в основном в русской и чешской школах КЛ, он сближается с методами полного лингвистического анализа текстов в системах класса АПТ, но требует больших трудозатрат от лингвистов, корректирующих автоматические процедуры. Западные школы стремятся к упрощению методов обработки материала с целью приблизить решение сегодняшних задач.

~[,

й 72. Методы анализа в КЛ

ТК — источники лингвистических знаний, но информация, содержащаяся в массивах КЛ, мертва без лингвистической обработки. Как отдельная дисциплина КЛ имеет собственную задачу и постепенно вырабатывает свои методы извлечения лиигвистических знаний на основе анализа больших коллекций текстов. В свою очередь, эти лингвистические знания предполагается использовать {помимо теоретического описания языка той или иной эпохи и т.д.) и для практического анализа других порций текстов, доступных в электронном виде. Иначе говоря, КЛ на некотором представительном корпусе/подмножестве текстов формирует и уточняет инструмент анализа всех других текстов, относимых к тому же подмассиву.

Чтобы извлекать знания, нужны достаточно мощные лингвистические технологии. Хотя традиционная КЛ (в основном ее западная ветвь) избегает пользоваться терминологией, принятой в АОТ, в ней встают практически те же проблемы, которые характерны для этапа анализа в системах АПТ:

263

К 2002 г. из текстов текущей версии Чешского корпуса в 100

млн слов проаннотировано в терминах ATS 100 тыс. предложе- 1~,

ний, средствами TGTS — 20 тыс. предложений; из них 2 тыс. '~1

й бжены пометами о коммуникативной структу

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 263. Читать онлайн