ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 154. Читать онлайн

Все термины тезауруса (слова или словосочетания) высз в нем в качестве дескриптора либо в качестве варианта (cr. ма) дескриптора. В роли дескрипторов по сложившейся пр; построения тезаурусов выступают термины, обозначающие торые понятия предметной области и удовлетворяющие пр пам общеупотребительности, краткости, распространенн< терминологической точности. Дескрипторы представлены о ными существительными и именными группами. Вариантаь нонимами) дескрипторов считаются термины, обозначают же понятие, что и дескриптор. Кроме двух упомянутых грвз ческих типов синонимами также могут быть отдельные пр тельные, глаголы и глагольные группы. Дескриптор в сово> сти с его вариантами (синонимами) представляет опредег понятие предметной области.

В ходе работы над тезаурусом были приняты следующие рии включения в него терминов.

1. Наличие любой, хотя бы одной, связи с другими деск1 рами тезауруса; для общеупотребительных слов из этого кр< вытекают следующие следствия:

а) в тезаурус не включаются общеупотребительные ело< которых невозможно установить связь с каким-либо деск1 ром тезауруса; такими словами являются, например, услов зулынан< и т.п.;

б) в тезаурус включается общеупотребительное слово, нем уже имеются дескрипторы, которые можно считать ни: ящими для данного слова: например, слова реформа (nogr< скан реформа, экономическая реформа) или договор (между ный договор, арендный договор).

2. Наличие (если это словосочетание) таких тезаурусны зей, которые не вытекают из структуры словосочетания. Ь мер, словосочетание аренда земли является свободным слов танием, и сумма значений его составляющих равна значени ro словосочетания, при этом, однако, аренда земли являет ним из видов земленользования, и эта неочевидная связь с основанием для включения этого словосочетания в тезаур)

В процессе разработки и пополнения тезауруса было снято ло невключения в тезаурус слишком конкретных терминов (ж вило типично для многих тезаурусов, используемых при г индексировании). Использование тезауруса в автоматически цедурах требует включения в него и названий профессий, и оборудования, и видов продукции, и составных частей того или производственного или социального процесса, так как не: конкретного термина, встретившегося в тексте, может пр< к неправильным результатам автоматической обработки те

В РуТез включаются также термины, не упоминавшиеся стах, если они:

154

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 154. Читать онлайн