ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 133. Читать онлайн

есоати-,

гнил тем. так- едо- есо- ква- тек- эпичьно

вязи зкой оек-

окуред-, lobo[

1аны ~ста ~ьтаг от >тся 1 ог)ня дло сге ~еде ски ежа

~тер ,ны пин .еп

Многие приемы сжатия содержания текста используются в системах СГТ и других системах АПТ, основанных на знаниях. Их описание есть в работах, приведенных в списке литературы; там же указаны некоторые работы по теории связного текста. Особенный интерес представляют исследования, проводимые в Колумбийском университете под руководством K.ÌaKÊüþèí. Так, например, система SUMMONS (SUilfMarizing Onttnå NewS articles) суммирует содержание многих газетных сообщений на одну тему («терроризм») [смл McKeown, Radev, 1998], но за основу берет не тексты на ЕЯ, а уже готовые фреймы (templates), сравнивая их, убирая дублирующую информацию и принимая решения в случаях противоречивой информации (примеры см. в гл. 10). В книге И.Мани подробно рассмотрены сходные методы компрессии текста с опорой на методы АОТ, ИИ, ИПС и с оценкой эффективности использования современных технологий [см.: Mani, 2001).

В 34. Информационный синтез значимых

для текста единиц

В рамках нашей информационно-лингвистической модели СемП понимается очень широко — как любая структура семантического уровня, начиная с первичной структуры семантического пространства и кончая информационным представлением, которое является результатом отбора и настройки на язык пользователя части содержания текста. Разновидностью СемП является также строящаяся для текста база данных.

В этой модели высшей единицей, представляющей текст во внешней среде, предлагается считать текстовый факт. Он может быть собран, синтезирован в результате ряда преобразований- операций над первичной целотекстной структурой.

Необходимость построения более крупных единиц СемПрост, чем семантические узлы, была очевидна уже на стадии семантической интерпретации слабых связей (см. гл. 6).

Первые крупные единицы, которые могут приобрести внетекстовую значимость, — это объекты и ситуации (Сит). Граница между ними не всегда очевидна. Этапы преобразований, на которых происходит сборка этих первых сложных единиц, назовем ситуативным анализом (СитАн); он собирает кирпичики и блоки, нз которых строится знание. СИТ — та «средняя» (подчеркнем, что лингвистическая) единица, которая еще сохраняет черты единиц поверхностного уровня и при этом обладает всеми необходимыми свойствами единиц высшего уровня понимания, с нее начинается синтез единиц типа ФАКТ. Динамика построения единиц текстовых структур такова:

СемУ -+ ЭСит -» СИТ -+ Соб -+ ТФ -+ Факт(ПО).

133

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 133. Читать онлайн