ПравообладателямАвтоматическая обработка текстов на естественном языке и компьютерная лингвистика, Большакова Елена
Книжная полка
перейти на полку → Хочу прочитатьЧитаюПрочитана
ИзбранноеВладею
Чтобы воспользоваться книжной полкой выполните вход либо зарегистрируйтесь
← Назад
Скачать: , Большакова Елена Игоревна pdf   Читать

В учебном пособии рассматриваются базовые вопросы компьютерной лингвистики: от теории лингвистического и математического моделирования до вариантов технологических решений. Дается лингвистическая интерпретация основных лингвистических объектов и единиц анализа. Приведены сведения, необходимые для создания отдельных подсистем, отвечающих за анализ текстов на естественном языке. Рассматриваются вопросы построения систем классификации и кластеризации текстовых данных, основы фрактальной теории текстовой информации.

Издание предназначено для студентов и аспирантов высших учебных заведений, работающих в области обработки текстов на естественном языке.

[учебное пособие для вузов по направлению 231300 "Прикладная математика"]







PDF. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. Большакова Е. И.
Страница 37. Читать онлайн

° колокации-клише (напр., миллионов долларов, миллиарда долларов), которые при

переходе к более обьемным сочетаниям могут входить в состав конструкций;

° сочетания, имеющие все показатели конструкций (как правило, компоненты

конструкций «введения источника информации»):

о с глаголом — напр., сообщает РИА, как сообщает, это сообщать,

о с существительным — напр., со ссылкой, па ссылкам.

Таблица 4. Биграммы с наиболее высокими значениями меры t-score (в норядкс убывания значения меры>. Материал портала testa.ru 2009 года

об этом

ОБ ЭТО

ОДИН ИЗ

по словам

ПО СЛОВО

а также

со ссылкой

А ТАКЖЕ

ссылкой на

ПО ДАННЫЕ

ССЫЛКА НА

по данным

СО ССЫЛКА В РЕЗУЛЬТАТ

к оме того

РИА Новости

этом сообщает

КРОМЕ ТОТ

РИА НОВОСТЬ

п и этом

В ЧАСТНОСТЬ

ЭТО СООБЩАТЬ

МИЛЛИОН ДОЛЛАР

в том

в России

во в емя

В РОССИЯ

пока не

МИЛЛИАРД ДОЛЛАР

ВО ВРЕМЯ

о том

в ез льтате

ПРИ ЭТО

настоящее в емя

В КОТОРЫИ

миллионов долла ов

КАК СООБЩАТЬ

О ТОМ

связи с

сообшает РИА

В ХОД

в ез льтате

В ТОТ

в частности

В СВОИ

ПОКА HE

миллиа да долла ов

как сообщает

38

Для научных текстов также выделяется ряд типов t-score-сочетаний,

маркирующих научный функциональный стиль (см. табл. 2 и 3):

° составные служебные и дискурсивные слова, напр., (no) крайней мере, (в) первую

очередь, (с) точки зрения, (no) гггеньиеи лгере, прежде всего;

° конструкции и сходные с ними составные обороты; дает возможность, зависит

om vs. (в) зависимости от, (в) отчичие от vs. отличается от н т.д.

Во введении мы сформулировали — в качестве условного приближения

предположение о том, что производная служебная лексика (напр., предлоги в

течение, в качестве) и дискурсивные слова (напр., no крайней лгере, .чозгсепг быть)

расположена в некоторой серединной зоне, равноудаленной и от «ядерных

кодллокаций», и от «ядерных конструкций». Чем выше предикативность (особенно

для дискурсивных слов и наречных образований), тем они оказываются ближе к

конструкциям. Другим параметром является степень устойчивости, чем выше она,

тем эти единицы оказываются ближе к полюсам сосредоточения коллокаций как

Обложка.
PDF. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. Большакова Е. И. Страница 37. Читать онлайн