ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 217. Читать онлайн

,и-

Л-

rcих ал га:тих

гь-

ю- нля се. игу

ги но и- геые ы-

'ия

[О-

отэго (ем

случае русского. Какие шаги нужны и можно ли вообще произвольную запись в БЗн перевести на ИЯП, чтобы получить СемП знаний, совместимое с СемП текста? Чтобы понять это, рассмотрим единицы, используемые в разных БД, например стандартной табличной формы. Какие в них отношения и какие узлы? Обозначим их СпецОтношения (СпецО), и СпецУзлы, или СпецУ, соответственно.

СпецОтношениями могут быль объявлены имена полей БД или заголовки столбцов таблиц и т. пл например, Размер пласта, Обьем добычи за год, Количество жертв, Средний размер зарплаты рабочего и многие другие. Еще более разнообразны и специфичны имена объектов (СпецУзлов), заполняющих объявленные слоты таблиц БД (5 тыс. руб./месяц, 80 тью, дол./год, 100 тонн в сутки и др.). СпецУ и СпецО не совпадают с текстовыми единицами СемУ и СемО.

Прежде всего это различия в объеме понятий и их ранге, положении в той и другой структуре. Например, свободному словосочетанию ЕТ соответствует СпецОтношение, имя графы БД-таблицы (количество жертв или общее число работающих пенсионеров), или значение графы (3 тыс. руб.); простому узлу СемП соответствует важный онтологический предикат (угон, убийство, теракт); свободное словосочетание ET (в сутки перекачивается 10 тыс. тонн нефти) распределится между именем отношения (суточная норма), значением параметра (10 тыс. тонн) и названием всей таблицы (нефть) и т.д. В концептуальных структурах некоторых IE-систем не различается статус узлов и отношений. Например, для ситуации пропаока автомобиля (онтологический предикат) наряду с такими вполне лингвистическими отношениями, как Исходная точка (откуда пропал), заданы спецотношения Угонщик (в лингвистическом СемП — это Агент угона) и Место обнаружения (лингвистически Конечная точка — куда угпали автомобиль). Эти примеры демонстрируют произвольность задания спецединиц и их сложность по сравнению с лингвистическими узлами и отношениями.

Такие несоответствия в форме выражения и типах единиц не позволяют проводить прямое сравнение и взаимообмен между СемП текста и структурой знаний. Значит, нужно понизить уровень сравниваемых структур. Для единиц БД нужно сделать для этого по крайней мере два шага.

1. Разукрупнение записей на языке представления знаний данного ПО, составление полного лексикона, состоящего из двух списков — СпецО и СпецУ. Не исключено, что какие-то из этих единиц могут совпасп с единицами СемП, собранными в ходе глобального анализа текстов той же ПО. Но с большинством других ПО он не образует никаких пересечений, и вряд ли вообще возможен единый лексикон для всех ПО. Его нельзя считать поэтому информа-

217

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 217. Читать онлайн