ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 215. Читать онлайн

нала, ние в ализ, Хлы- стивьных, еско- фак:стов, Базы БТФ, ~ются ашей озри: колoro u

ъекта е баз ' аботу ачи и м одестно нтуи-

щ над оть и

MH- в выi рус- адан- тоян- поли- эсти), ~бъек-

кого- когда отноих есе едиализу, з. Это долж-

ности, организации и др. с разными вариантами их сокращений в тексте.

Для построения БТФ были привлечены такие предметно-ориентированные словари и списки (в современных IE-системах их бы назвали Gazetteers — «газетеры» (см. гл. 9).

1. Словари в составе базы данных по реалиям США (dB-USA):

а) словарь географических единиц (GEOGR-USA);

б) список должностей в составе кабинета президента (CABUSA);

в) список должностей в составе конгресса (CONGR-USA); г) список имен членов правительства и ведущих общественно-политических деятелей (VIP-USA);

д) список организаций (ORG-USA);

е) список основных изданий (PUBL-USA);

ж) Тезаурус Библиотеки Конгресса США (THEZ-USA).

2. Словари в составе базы данных по СССР (dB-RUS) в основном те же с именами соответственно:

а) GEOGR-RUS;

б) САВ-RUS;

в) иерархия должностей в составе Верховного Совета (SUPRRUS);

г) VIP-RUS;

д) ORG-RUS;

е) PUBL-RUS;

ж) информационно-поисковый тезаурус (ROSSTHES)„

представляющий терминосистему предметной области «Российско-американские отношения». В первую очередь в него вводились описания терминологических словосочетаний, тогда как семантика одиночных слов-терминов описывалась в основном словаре (ROSSWORD);

з) Русский общесемантический словарь (РОСС), существующий в виде словарной базы ROSSWORD (см. описание ее современного варианта в гл. 12);

и) словосочетания общелингвистические или принадлежащие другим ПО (как часть РОСС), вынесенные в отдельную словарную базу ROSSCOMP;

к) словник «горячих» слов (HOTWORDS) — зто сменный

файл, он задает слова, заказанные пользователем как лексические ядра, вокруг которых нужно формировать текстовые факты.

В дальнейшем списковая часть многих имен объектов (названия должностей, организаций, географических имен и т.п.) вошла в Тезаурус УИС РОССИЯ.

Практически все текстовые ресурсы и политические словари были добыты и включены в УИС РОССИЯ благодаря энергии Т.Н. Юдиной.

215

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 215. Читать онлайн