ПравообладателямАвтоматическое понимание текстов. Системы, модели, ресурсы, Леонтьева Нина
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Леонтьева Нина Николаевна djvu   Читать

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия - идея "мягкого" понимания текста; представлена экспериментальная лингвистическая система политекст, осуществляющая гибкое соединение лингвистических и предметных знаний.

Для студентов лингвистических факультетов вузов. Может быть рекомендовано для тех, кто интересуется искусственным интеллектом, структурной и прикладной лингвистикой, информатикой.







DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н.
Страница 267. Читать онлайн

в) массивы КЛ — это надежный источник формирования словарей, в том числе двуязычных, и выуживания информации, которую надо включать в словарную статью (иллюстрации слово- значений, сведения об актантной структуре слова и др.); это источник создания конкордансов, словников, тезаурусов и других инструментов, необходимых для автоматического анализа произвольных текстов. Составление словарей — одно-, дву- или многоязычных — должно подтверждаться, если не полностью базироваться на КЛ массивах.

Тем самым КЛ не исключает, а дополняет традиционную лингвистику, становится опорой общей лексикографии. Ведь лексикография работает не только с простыми единицами и их контекстом, но и с большими текстовыми сегментами, единицы которых определены на лексическом и синтаксическом, включая порядок слов, уровнях (многословные единицы, термины, коллокации, обороты). Традиционная лингвистика все больше tt)otrttàется в более крупных, чем слово, единицах и в обосновании их выделения обращением в КЛ; она тяготеет к изучению семантической связности (lexical solidarities, collocations, set phrases, valencies, case roles, thematic roles, semantic frames and scripts). КЛ проясняет понятие текстового сегмента эвристическим определением семантической связности: совместной встречаемостью схем {цепочек), которые тем самым связаны определенными семантическими отношениями.

Статистика совместной встречаемости и явное выражение шаблонов (комбинации квантитатнвных и категориальных признаков) позволяют изучать «размытые» значения (/иду meanings). КЛ допускает втягивать пользователя в дискурс и включать его определения в универсум цитат и контекстов [см.: International JournaL,

1996 и др.].

Журнал International Journal of Corpus Linguisucs сохраняет скептическое отношение к концептуальным (и любым задаваемым «сверху») методам лингвистического анализа и в отношении многоязыковой корпусной лингвистики.

Я 75. Многоязыковая корпусная

лингвистика

Эмпирической базой для нее служит (виртуальный) массив всех текстов, когда-либо переведенных на другой язык, вместе со своими переводами. Теоретическая основа та же, что и для одноязыковых корпусов, т.е. значением текстовой единицы считается парафраза, а полное значение текстового сегмента в этом дискурсивном универсуме заключено в истории (сумме) всех переводных эквивалентов этого сегмента.

»г

[l

[[4

» «

гг

)',;

,,6'

',[

[~»;,

[['

1,

~)'

( !,']

(

267

Обложка.
DJVU. Автоматическое понимание текстов. Системы, модели, ресурсы. Леонтьева Н. Н. Страница 267. Читать онлайн