ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 73. Читать онлайн

гы, ваиы

:о- гаroe же >ва ям :ти и,- га- и- гй- газа.

гке гы. гся >она гся ем

>озй, ин за-

Я».

гв

>и-

гн-

зв-

гьгве гна

4) дефисное написание числительных (цифры-окончание) преобразуется в одно слово, в качестве леммы пишется число. Например, 17-ому — 17, с соответствующей морфологической информацией;

5) если словоформе соответствует несколько одинаковых лемм, отличающихся только МИ, одинаковые леммы объединяются в одну строку с приписыванием ей всех МИ;

6) проверяются отдельные конкретные слова. Например, слопоформе его соответствуют леммы ЕГО и ОН (или ОНО). Если перед этим словом есть предлог, то оставляется только лемма ЕГО, гак как после предлога лексемы он или оно были бы представлены словоформой него.

На этап постморфологического анализа переданы также две ееморфологические функции:

1) вызов семантического словаря (по имени леммы, которое является также входом в Русский общесемантический словарь, к информации которого могут обращаться следующие прикладные программы. Словам, совпавшим со входами в семантический словарь, приписывается их адрес (номер байта) в этом словаре;

2) сравнение с БД: если некоторая последовательность лемм совпала со входами в одну из БД, то начальная и конечная леммы найденного словосочетания отмечаются соответствующими индексами (11... t2, п1... n2, g1 ...g2).

Все сложные единицы ЛексП с пометами должны интерпретироваться на этапе семантического анализа. Так, сложный узел ЛексП (американо-китайско-индийско-советское) станет одним синтаксическим узлом и введется отношением «определение» в СинП, но в СемП может быть снова разбит на части, между которыми установятся семантические отношения.

Такие единицы, если в их составе один знак «-» (дефис), ищутся в словаре сначала игнорируя дефис, так система справляется со знаком переноса, затем включая его, так должны быть опознаны устоявшиеся и потому включенные в словарь образования типа Ин-т, Ун-mидр.

В эту же категорию попадут в числе прочих и случайным образом сокращенные слова, такие, как соотв-щих, след-гний, лай-рии и другие сокращения, встречающиеся в бюрократических документах. Восстановление в автоматическом или диалоговом режиме до канонического вида слова приведет к изменению его лексического типа: сложный узел становится лексемой и затем синтаксическим узлом.

Добытая на этапе первичного анализа информация идет дальше по двум разным каналам: уточненная морфологическая информация идет в синтаксический анализ, а леммы — в семантический словарь и далее — в семантический анализ (СемАн). Эти два процесса могут быть реализованы параллельно.

73

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 73. Читать онлайн