ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 75. Читать онлайн

эй в

ныв

зна>нец

<гви-

варя раз- ман- про>аси- пссо-

кор>ракания ьные гиче-

осто>генезки к >зель-

<ый мотор). Многие префиксоиды могут выступать и как отдель«»>е самостоятельные слова (ср.: дизель и дизель-мотор), а некотон»>е не могут (электро-, вибро-, псевдо-).

Если в морфологическом словаре первые легче исчислить, при» исав каждой основе набор префиксов, которые могут сочетаться : ней, то вторые соединяются более свободно, ср.: виброзлект>юдвигагпель, светло-малиновый берет, тлжелотонный грузовик, франьо-немецко-японско-русские переговоры и т.п. В словаре можно зафиксировать некоторое количество частотных сложных слов (противоправный, многонациональный, антимонопольный), но большин: > во подобных, почти свободных образований (полупопуллрный, кваттеорил, суперинтеллигент, виноманил и другие -мании, -фобии и I. и.) останется за бортом, и для них все равно требуется отдель<юе решение, словарное и алгоритмическое.

Помещение всех или многих таких слов в словарь словоформ привело бы к колоссальному увеличению его объема, да и невозможно успеть за всеми окказиональньгми соединениями смыслов (противнокисленький вкус, изматываю>цедлиннал зевота). Такая же ><роблема встает в отношении сложносокращенных слов типа Наркомпрос, Транссибнефть и т.п., хотя они связаны больше с опре<сленными предметными областями и при настройке на тип массивов можно даже задать список продуктивных словообразующих <остей.

Но если даже эта проблема решена компактным образом в чорфологическом плане, она встанет на уровне семантической интерпретации, ведь каждый префикс несет с собой нерегулярное изменение в значении слова.

После проведения синтаксического анализа и, возможно, сле<ующих этапов система может вернуться к МорфП. Это будет вторичный, уточненный морфологический анализ. Он позволит дать окончательную информацию о текстовой форме (или несколько «аборов информаций при неоднозначном разборе всего предлог<ения) и каноническую форму — с новым вычленением основы. )та операция особенно нужна для слов, относящихся к типу ФИО, нли других не опознанных по словарю слов. Подобные трудности > величивают неоднозначность уровня ГрафАн. Так, во фразе Со>он Диванов обнаружился также на Ленинском проспекте первые >ва слова могут быть признаны именем с фамилией, как Соломон Иванов. В нашей системе они получат сначала признак «ИМ?», означающий «не имя ли это?» После нахождения этих слов в словаре эта гипотеза скорее всего будет снята. Но такая гипотеза долкна быть выдвинута в системе, не имеющей основного словаря (основ или словоформ).

На дальнейших этапах, при выходе на межфразовый уровень, может угочниться основная форма слова (срл Горбачевский фонд и >

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 75. Читать онлайн