ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 178. Читать онлайн

ным достоинством ИПС является работа с реальными текстовз

массивами и реальным (или виртуальным) пользователем, а

новным узким местом информационных систем является их

большой смысловой потенциал.

ф 45. Автоматическое

реферирование/фрагментирование текстов

Системы автоматического реферирования (АР) текстов со вались в большом количестве в 70 — 80-е гг. XX в. практическ всех отраслевых информационных институтах. Они разрабатз лись в рамках ИПС на основе систем АИ, но в отличие от остались лишь экспериментальными. Обычно различают три ~ результирующих текстов рефератов: квазирефераты, рефер; клише и собственно рефераты [cM.: Пащенко, Кнорина, Мо. нова„1983].

Квазиреферат представляет собой последовательность всех бранных из текста наиболее информативных предложений (в рядке их следования в исходном тексте). Разработано много < цедур их дальнейшего редактирования с целью придать им б ше связности, убрать повторения, сократить объем и т.д. В пр ле результат представляет собой аннотацию, тематическое п ставление или даже обычный ПОД.

Рефераты-клише строятся тоже извлечением из текста на лее информативных слов, которые вставляются в заранее за ные словесные клише, или шаблоны, например: «Данная ст относится к теме...», «В тексте говорится о...» [см.: Севбо, 1 Пиотровский, Беляева, Попескул и др., 1983]. Построение р рата в собственном смысле должно опираться на более глуб< анализ текста.

В работе С. И. Гиндина проведены классификация и теог ческое осмысление идей и методов автоматического фрагме рования, которое имеет целью сжатие текста до таких предсз тельных его фрагментов, в которых заключено основное смь вое содержание. Получаемый в результате текст автор назь кондеисатом [смз Гиндин, 1977]. «Любая сколько-нибудь р; ная процедура фрагментирования просто не может игнорир< план содержания текста: ведь цель любой процедуры фрагм< рования "по определению"' состоит в том, чтобы сравнить с менты по их значимости для выражения основного содерж текста... Различные же процедуры фрагментирования отлича друг от друга тем, как именно, какими путями пытаются "добраться" до этой структуры плана содержания» [Гиндин, 70 — 71]. В этой же работе подробно рассмотрены разные и« получения конденсата: статистический метод выбора опорнь

178

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 178. Читать онлайн