ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 180. Читать онлайн

блемой. Эти системы входят в класс систем искусственног теллекта, они широко описаны в соответствующей литератур< ведения не игрушечного, а настоящего диалога с ЭВМ е< созрели все условия. Многие ведущие разработчики систем (в частности, Й.Уилкс) переключились на более массовые, востребованные и более достижимые задачи: например, изн ния локальных знаний из больших массивов текстов.

В настоящее время ценятся модели и системы, которые с лаются с большими массивами и потоками текстов. Ниже ставлены два типа современных систем, работающих с мас ми: развитый тематический анализ и системы экстрагиров, извлечения информации из текстов.

В 47. Тематический анализ потока текстов

Тематическое иредставлеиие (ТемП) текстов — одна из

нейших семантических структур текста, которая включает

названия (или более организованную структуру) тех тем (

ков), которые характеризуют основное содержание докуь

Важность такой структуры текста в составе информационн

исковых систем состоит в том, что она позволяет любому

ничному пользователю ознакомиться в очень краткой фо

содержанием большого корпуса текстов и определить дал

шие режимы работы с документами массива. Тематические

ставления потока текстов позволяют автоматизировать про<

классификации и рубрикация, что необходимо особенно в г

ствах СМИ, куда ежедневно поступают огромные нотою

формации разнообразной тематики. Укажем также на потр

сти хотя бы предварительной сортировки типов знаний для

нейшего учета и управления базами знаний.

Очевидно, что при создании ТемП должны быть задейсз

ны достаточно эффективные методы сжатия исходного мате

текста. Тематическому анализу (ТемАн) должна предшестт

хотя бы минимальная лингвистическая обработка исходног<

сина текстов.

Оставим в стороне чисто механические методы сокрав

текста, стремящиеся к построению тематического представ.

текста, такие, как: а) устранение из текста малозначащих

(заданием списка так называемых «стоп-слов»); б) оставление

ко существительных; в) отбор первого-второго и последнего

ложений текста; г) выбор списка слов, отвечающих каким-т

тистическим закономерностям, и т.п.

Остановимся на таких методах, которые принимают во в<

ние свойство связности текста: ведь и темы должны быть

связными.

180

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 180. Читать онлайн