ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 247. Читать онлайн

Актанты формул типа СИТ получают номера, следующие за последним номером валентности: так, если валентностей было три (АЗ), то вводимые в поле ЭСит актанты получают номер А4 и далее. Если валентностей не было, нумерация актантов начинается с Al. И сами формулы нумеруются, чтобы на них можно было сослаться как внутри того же поля, так и в последующих полях.

Поля ПРЕДШ и ПОСЛ выделяют из множества формул поля СИТ две группы: те, которые предшествуют общей ситуации, и те, которые следуют за ней, например: ПРЕДШ = ЭС1 — ЭС4; ПОСЛ = ЭС10 — ЭС12.

Для ЗГЛ = экспортировать (см. выше) эти поля получат значение: ПРЕДШ = ЭС1 — ЭС2; ПОСЛ = ЭСЗ — ЭС4.

Зона ИНФ (Описание слова как единицы информационной

структуры текста н тезауруса)

ПО — поле, задающее предметные области, для которых справедливо описываемое значение слова. Актуальные ПО, которые охватывает Тезаурус проекта ПОЛИТЕКСТ — это политика, экономика, законодательство, военная и общая тематика.

ВЕС — информационный вес единицы в данных ПО (5 — самые информативные слова, 1 — стоп-слова, пустые для ПО). Несколько усложнен формат этого поля у пустых слов, имеющих ВЕС = 2: в скобках за ним назван тот актант, который может не только повысить ВЕС, но и войти в состав СемУзла вместе со словом ЗГЛ. Например:

ЗГЛ =выборы; BEC= 5 ЗГЛ = начинать; ВЕС = 2 (A2) (начинать работу — один Семузел) ЗГЛ = являться; BEC = 3 (малоннформативные слова, BEC которых

зависит от всех, обычно двух, актантов) ТЕРМ — включающие слово С термины, которые должны войти

в дальнейшем в какие-либо базы данных или тезаурусы системы:

ЗГЛ = взаимопомощь; ТЕРМ = братская взаимопомощь

ВАР — лексические варианты слова С (разной степени близости):

ЗГЛ = компенсация; BAP = возмещение, страховка, контрибуция, выплаты ЗГЛ = вид; BAP = разновидность ЗГЛ = брак; BAP = бракованная продукция (его можно записать и в

терминах) АСЦ — другие ассоциированные понятия:

ЗГЛ = депутат; АСЦ = избирательная кампаниц органа власти и др.

Более точные связи слова С с ассоциированными словами можно

описать в зоне СИТ:

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 247. Читать онлайн