ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 7. Читать онлайн

:ото-

спегную ичевари исазбно

(Ру;емы ! ин-

спо~емы

~ных тек- иро- до- Ос- сти«ны, дей~ате- яас- зло'«ПТ емы very, ече- бна~ной .' баз

:ГГ) .ции щде по~вой se u «ий, sop-

:ра- ми-

По сути дела, СГТ — это вторая часть того подхода, который принят в системах АПТ типа «перевод-реферат на основе базы знаний».

Глава 11 завершает рассмотрение систем и методов АПТ авторским эскизом такой интегральной информационно-переводческой системы, работа которой состоит в постоянном наполнении Базы текстовых фактов (БТФ). «Текстовой» она названа не только потому, что создается при анализе текстов и включает те знания, которые несет конкретный текст, но и потому, что значения ее полей могут быть заполнены свободным текстовым материалом, не скованным заранее заданными форматами в основном количественного характера, как в стандартных БД. БТФ собирает информацию из текстов общего прльзования и гуманитарного характера. В качестве примера были проанализированы тексты СМИ, дана иллюстрация возможных результирующих записей в такой БТФ. Архитектура БТФ позволяет использовать ее в разных прикладных задачах: реферирования, перевода, информационного поиска и обобщения данных, синтеза на ее основе других частных баз данных, генерации новых текстов и т.п. В задаче построения БТФ и производных от нее «продуктов» и подсистем должны быть использованы все наработанные к настоящему моменту и охарактеризованные в данном пособии лингвистические ресурсы.

Глава 12 дает представление о комплексе словарей, обслуживающих систему АПТ полного состава (от ЕТ до получения Информации адресатом). Последовательность процедур анализа должна обслуживаться комплексом соответственно ориентированных словарей, каждый из которых имеет дело со специфическими для данного уровня единицами и информацией к ним. Подробно описан основной инструмент семантического анализа текста в системе ПОЛИТЕКСТ — словарь РУСЛАН, поскольку состав полей этого словаря близок к универсальному. Он содержит исчерпывающую лингвистическую информацию, сведения об энциклопедических и информационно-тезаурусных связях слов, а также данные, позволяющие строить единицы типа Ситуация и настраивать словарь на разные задачи. Описание слов в словаре ведется «сверху вниз», в соответствии с уровнями лингвистического анализа. Основная направленность разрабатываемой версии РУСЛАНа — обеспечить построение Базы текстовых фактов для заданного массива русских текстов. Продолжением этого общеязыкового словаря являются спецсловари того типа, который описан в главе 8.

Глава 13 называет те лингвистические ресурсы, на которые может опираться любая система АПТ (reusable resources), к их числу относятся массивы одно- и двуязычных общих словарей, терминологических словарей и тезаурусов. Но главным ресурсом считаются большие корпуса собственно текстов, их изучением зани-

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 7. Читать онлайн