ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 55. Читать онлайн

мер: мено разбивае |авиеиию

СТРУКТ синей де

I *.Srl

'.lerrr t представ-

х объекта

ментов, иа

еит *.ref

сновного параметр :умента и

самосто- ИЛ. Перине само ого докун для ос-

умента, в

о роль.

hdr всегда еется уиирый строi програм-

hCr всегда

: является

юкумеита. еквизитах

rrro вклюшием, их мер:

АВТОР[0] Б. Ельцин

АВТОР(1] Е. Гайдар

Пример внешней дескрипции:

Стандарты оформления документов

Узнавание границ документов опирается на понятие стандарта оформления документов, который в свою очередь определяется расположением таких частей документа, как заголовок, подпись, гриф и т.п.

Для проведения успешною анализа текста программа HEADER каждый раз должна определять, какому стандарту удовлетворяет загруженный в нее документ. Программе заранее задано несколько стандартов, и перед запуском пользователь может указать номер стандарта, по которому нужно анализировать входной текст. Программа работала с lrrm þ стандартами:

1. Стандарт законодательного акта «Дата вверху».

2. Стандарт законодательного акта «Дата внизу».

3. Стандарт законов «Со статусом».

4. Стандарт советско-американских документов.

5. Свободный текст.

Количество и вид стандартов должны задаваться в зависимости от того, с какими массивами имеет дело реально работающая система.

Программа HEADER, перебирая все известные ей стандарты, пытается найти самый подходящий. Им будет стандарт, по которому опозналось наибольшее число частей текста, при этом ни их размеры, ни их расположение в тексте можно не учитывать. Поэтому если входной документ полностью удовлетворяет какомуто из заданных стандартов, программа сможет найти его. При выде-

55

НАЧАЛО

ИНСТ

КЛАСС ДОК

ТИП ДОК

ДАТА ПОДЛ

ЗГЛ

ХВХОД

N ТЕКСТ

N ВЫХОД

ПОДПИСЬ

МЕСТО ПОДП

ДОЛЖ ПОДП

КОЛ ПРИЛ

МАССИВ

РАЗМЕР

КОНЕЦ

1002513

Правительство РФ

Распоряжение

Распоряжение Правительства РФ

01/12/1992

иет

C:~РКОСЕ88~11ч;unknown.arj; $2012000.TXT

12О-р

С:gPROCESS(OUT;unknown.arj; S201200.ТХТ

С Шахрай

Москва

Заместитель Лредседателя Правительства РФ

0

Собрание законодательных актов РФ

652 байт 88 строк

07/08/1996

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 55. Читать онлайн