ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 13. Читать онлайн

фор;при, как зные свой тре- стревсех >ане-

я по> ко- тек>сад«кто- уалььных кому «вля- ложо ни

ания «ется «втоской

юнг«оватов), ,ино>иваимя >й не ; таке по-

«сти«ный i on-

р«деленную задачу, принимающий на входе данные в определенном формате, и т.д. Как правило, такой комплекс имеет полное у>аконенное технологическое обеспечение, начиная от способа ~ >олучения входных данных и кончая установленным кругом пользо,ателей, с учетом требований которых этот комплекс создавался. !'акой комплекс всегда имеет сопровождение, т.е. группу работ- пиков, обеспечивающих ero бесперебойное тестирование и функционирование. В группу сопровождения обычно входят и авторы разработки, которые, во-первых, ответственны за концептуальную сторону системы, а во-вторых, получают полезные сведения о результатах работы, о том, как ее оценивают пользователи и т.д.,- есе эти сведения могут быть учтены для улучшения данной или при разработке следующей версии системы. <Система» в таком понимании имеет обычно собственное имя, чему мы знаем мнох«ество примеров (системы машинною перевода СИСТРАН, АРИЭЛЬ, ЗТАП, ФРАП, ЯРАП, ПРОМТ, а также ИПС: СКОБКИ, БИТ и др.).

Во втором значении это слово не имеет конкретного денотата, а обозначает нечто целое, т.е. организованную по определенным законам совокупность, сложно организованный абстрактный комплекс, а потому требует указания при нем конкретной сущности, ср.: система взглядов, бухгалтерская система, система правил, взаиморасчетов и т.д. В этом абстрактном смысле система не имеет имени.

Работы над проектом ПОЛИТЕКСТ велись с начала 1990-х гг. в рамках Центра информационных исследований (ЦИИ), который был учрежден в Институте США и Канады РАН (ИСКРАН). Прежде чем реализовывать систему в первом значении, т.е. как действующее устройство, мы спроектировали систему во втором значении этого слова — как систему установок и решений, позволяющих видеть проблему АПТ достаточно широко.

Выросшая из одною корня, работа расслоилась на два потока; лингвистическое и тематическое (информационное) направления в анализе массивов политических текстов. По замыслу, они должны были дополнять друг друга, а будущей системе было дано имя РОССИЯ. При переходе в НИВЦ МГУ было сохранено одно, информационное, направление, ставшее университетской информационной системой РОССИЯ (УИС РОССИЯ).

На основе лингвистической ветви проекта ПОЛИТЕКСТ в 2000 — 2001 гг. бьиа создана пробная версия системы МП с русского языка на английский ДИАЛИНГ, в которой реализован полный цикл понимания с семантическим компонентом, опирающимся на Русский ОбщеСемантический Словарь и построенный по его модели английский словарь ]Сокирко, 2001]. В рассыпанном виде проект ПОЛИТЕКСТ продолжает жить и развиваться в составе разных коллективов и систем.

13

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 13. Читать онлайн