ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 56. Читать онлайн

ленин единиц типа ЗГЛ программа использует признак рованности» записи и выдает сигналы возможной ошибк~

В комплексе правил, задающих стандарт документа, мс учтены и более тонкие различия, например жанровые о< сти текста.

После того как проработал комплекс программ-преп] ров и человек снял все вопросы, о которых сообщила процесс переходит в полностью автоматический режим, ) которого тот же комплекс ГрафАн работает уже не на ст рование массива и создание внешних дескрипций, а ка лингвистического этапа создания внутренней дескрипци

ф 17. Собственно графематический анара

На вход этапа ГрафАн текста поступает массив докуь котором каждый документ имеет свое имя с расширен» На выходе будет создан файл, имеющий то же имя, но рением».яга.

ГрафАн выполняет следующие функции:

а) делит поток текста на псевдослова, одновременна фицируя их. Этим единицам уже на этой стадии приписа! то информация для последующего анализа (например, Б во, состоящее из заглавных букв, Бб — слово, начиная заглавной буквы, и т.д.). Для этого задаются списки эл которыми являются буквы основного, в нашем случае 1 алфавита, буквы латинского и других алфавитов, цифр препинания и т.п.;

б) упорядочивает по частоте все выделенные лексеьп в) объединяет некоторые комбинации слов в более единицы — «устойчивые обороты» (ставит признаки начал оборота: ОБ( ...ОБ2);

r) дает специальный признак словам — потенциалынам (ИМ?);

д) в ряде очевидных случаев снимает омонимию точк признак ЛЖ — ложная точка);

e) ведет счет и контроль пунктов перечислений;

ж) выделяет и нумерует абзацы. Начальное слово абз< признак АБЗ с соответствующим номером, конечный э~ признак УП, что означает условно-предложение. В рассь мом корпусе текстов абзац состоит, как правило, из одн ложения. УП выделяются на основе расположения пусть ных строк текста.

На выходе ГрафАн строится несколько файлов, из н> ной — Графематическое представление. Это первая из м структур, образующих внутреннюю дескрипцию текста

56

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 56. Читать онлайн