ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 19. Читать онлайн

га, будем :ржатель-

оме авто-

:кот, если го текста. опросы к ывающий ,анию па:кет, если занятости например сравнить общего и >езультате а извлечь лку чело-

осы

~блица

ия:

щ, нужно к знаний, етной обст должен поритмы) m на язык ~езультату. ~лько язык лет функяла» текст грограмме емому Т2. у из переесятки та-

Нас интересует, в какой мере за всеми этими переходами стоит единый механизм. Ведь чтобы придти к пониманию в конце цепочки, необходимо, чтобы на всех переходах (от уровня к уровI IIo) также достигалось «понимание». Эту задачу отнесем к компетенции теории AIIT.

В 3. Основные задачи и классы систем АПТ

Вычислительная лингвистика еще не устоялась как научная дисциплина; ее методы, приемы, понятия оттачиваются в многочисленных опытах создания разных систем АПТ.

С одной стороны, машинные ресурсы сейчас так велики, что позволяют хранить в компактном виде все то, что человечество накопило в текстовом виде. С другой стороны, далеко не все тексты заслуживают того, чтобы их хранить в оригинале, и вычислительные способности ЭВМ, а также интеллектуальный потенциал человека открывают возможность преобразовывать тексты совсем в другой вцд, не эквивалентный исходному, но зато или более краткий (аннотации, рефераты), или более удобный для дальнейшего использования в формальных системах (например, в форме баз данных, баз знаний).

Конечно, в каждой культуре существует огромный класс художественных произведений, которые являются национальным богатством и которые всегда хранятся полностью, образуя лаляотеюсетовые базы данных. Так, в Институте русского языка Российской академии наук создан и наполняется Машинный фонд русского языка, где основную часть составляет Фонд художественных произведений [см.: Машинный фонд..., 1986]. Чтобы получить сведения о том, каков словарный запас каждого автора, какие у него излюбленные слова и выражения, какие слова он ввел в обиход и в каких контекстах они встречаются, какие употребляемые им слова вышли из обихода, и другие подобные сведения, не нужно просматривать все тексты подряд, достаточно запросить ияфолмациояно-поисковую систему. Работу такой системы в значительной мере обеспечивает ВЛ, выполняя довольно простые функции, в основном морфологического уровня (например, сводит все словоформы одного слова к его основному, словарному виду для последующего подсчета, сравнения и др.). Но если бы мы захотели сравнить два произведения по содержанию, потребовалась бы гораздо более сложная система, таких систем АПТ пока не существует.

Есть и другие виды текстовых источников, которые требуют хранения полнотекстовых массивов. Это, например, все распорядительные документы (указы президента и постановления и распоряжения правительства) какого-либо государства, а также вся юридическая документация (законопроекты, законы, постанов-

19

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 19. Читать онлайн