ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 150. Читать онлайн

нем понятия («категории», которых насчитывалось сначал; тысяча; это обычные слова, расположенные в алфавитном г ке, например, AFFIRMATION ... AGENCY...), далее идут е нонимы по частям речи (существительные„глаголы, прилаг ные, наречия), антонимы и затем списки родственных ел< много, и некоторые представляют собой отсылки к имена< тих категорий, в словарной статье которых список «дальни ственников» может продолжаться, например, от АОЕХСЪ BUSINESS). Со времени издания «Тезауруса Роже» в 1852 > сих пор продолжаются ero переиздания в разных видах и дл ных пользователей, тезаурус постоянно пополняется ново< сикой и связями, но за всеми вариантами остается имя соз1 первой версии. Ценность этого тезауруса мы видим в ero ственности, в том, что это описание всей лексики языка только терминологии, а также в том, что его можно привле использованию в системах информационного поиска и АП средство увеличения семантической силы системы.

WordNet, EuroWordNet

В 1990 г. появляется тезаурус английского языка WordNet чинаются активные работы по ero привлечению в различны ры автоматической обработки текстов [см:. Miller, Beckwi FelIba«m С. et al., 1990]. )YordNet охватывает около 100 тыс. р< ных единиц (из них почти половина — словосочетания), ор зованных в 70 100 понятий, или совокупностей синонимов (s

В состав словаря входят лексемы, относящиеся к четыре< тям речи: прилагательному, существительному, глаголу и чию. Лексемы различных частей речи хранятся отдельно, и о ния, соответствующие ках<дой части речи, имеют различную < туру. Жесткое разделение различных частей речи приводит шествованию никак не связанных между собой очень похохо нонимических рядов, сформированных из разных частей ре

Все значения словаря связаны между собой семантиче< отношениями. Основными отношениями в словаре являютс

- синонимия;

- антонимия;

- гипонимия/гиперонимия (ISA-отношение или отнов НИЖЕ-ВЫШЕ). Это отношение транзитивно и несимметр Гипоним наследует все свойства гиперонима. Это отношен< ляется центральным отношением для описания существител

- меронимия (отношение ЧАСТЬ-ЦЕЛОЕ). Внутри этого щения выделяются отношения «быть элементом» и «быть сл ным из». Отношение определено только для существительн<

- следствие (это отношение связывает между собой глаг< — причина (также определено для глаголов).

150

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 150. Читать онлайн