ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 103. Читать онлайн

установ дим снес перево , что все

и аналивди ниц :истемо гическо з форму

с» и в ре > до син чожений ой скол ~овую си ми (вед цами ба ы бинар :р запис ху-вниз» не лекси а предло окумент утренни >ориться ьй интел ак важи

ra:

вное

расхожде

нтическ

представ

тическо

гервнчно

гтичес

уктуру н

мантиче

,жду дв

тношени

сс еманти

В развиваемой нами информационно-лингвистической модели понимания текста предлагается различать, как минимум, струк- гуры двух уровней: семантическое представление текста и инфор,мационное нредетавление (ИнфП) текста. То и другое — законные семантические структуры текста. СемП — это внутреннее представление содержания текста, результат чисто лингвистического (средствами лингвистического аппарата) понимания, выраженный лексическим материалом текста. ИнфП — его внешнее представление, отражающее то, как текст воспринимается внешней средой. ИнфП отличается от СемП текста тем, что в нем отражеllo в сжатом виде не все содержание текста, а только тот его фрагмент, который соответствует заданной извне точке зрения, формулировке, запросу и т.п. ИнфП — результат относительного понимания, оно должно быть выражено в единицах воспринимающей системы (т.е. в единицах «встречного текста»).

Та и другая структуры — сжатые представления текста, но кригерий сжатия в СемП определяется внутренними ресурсами сисгемы, — это результат лингвистического сжатия, задаваемого ~ рамматическими и словарными средствами. В ИнфП критерий гхсатия задается требованиями внешней системы (вопросом пользователя, заданием аспекта предметной области), в терминах которых должно быть переформулировано СемП. Так, СемП ответа на ~>опрос к тексту есть одно из возможных ИнфП этого текста, если ио СемП сформулировано в единицах, понятных автору вопроса.

В рамках ИЛМ есть необходимость выделить еще одну — когнитивную (или концептуальную) структуру, или базу знаний текста; возможны другие эквиваленты (так, в нашем подходе это База ~ скстовых фактов). БТФ должна представить основное содержание ~скста, по возможности полно, в той традиции, той форме и на н>м языке, которые сложились к настоящему моменту в науке о яредставлении общечеловеческих знаний. Очевидно, что в нее >юлжны попадать лишь те сведения из текста, которых там до это- ~ о не было, эти новые знания дополняют или изменяют содержимое имеющейся базы знаний. Если БЗн по данной области знаний гще не существует, текстовые когнитивные структуры будут ее началом. Именно линтвистам принадлежит первое слово, как о»- рсделить ту идеальную (близкую к идеалу) форму фиксирования снаний в разных областях, которая позволит входить в разные участки сложной сети общих знаний, сравнивать их, дополнять, включать более конкретные сведения из одной ПО в другую и т.п.

Окончательная структура текста — это граф, вершинами и ребрами (или узлами и связями) которого должны оказаться только волноцеиные единицы, т.е. наиболее значимые и для содержания вмого текста как целого, и с точки зрения информационной сре>ьс, подключенной к анализу этого текста, и с учетом характера синиц, помещаемых обычно в базы данных.

103

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 103. Читать онлайн