Том 18 №3-4

АВТОМАТИЧЕСКИЙ АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТОВ ПО ОТНОШЕНИЮ К ЗАДАННОМУ ОБЪЕКТУ И ЕГО ХАРАКТЕРИСТИКАМ
Аннотация: Статья посвящена рассмотрению подходов к анализу тональности текстов по отношению к заданному объекту, а также его характеристикам (аспектам). Для решения задачи анализа тональности по отношению к характеристикам сущности необходимо решать также задачи извлечения аспектов для сущности, категоризацию или кластеризацию аспектов по аспектным категориям, опреде-ление тональности текста по отношению к заданному аспекту или аспектной ка-тегории. Также в статье описывается задание по анализу тональности отзывов пользователей в рамках открытого тестирования систем анализа тональности SentiRuEval.
СЕМАНТИЧЕСКОЕ СХОДСТВО В ЗАДАЧЕ АСПЕКТНО-ЭМОЦИОНАЛЬНОГО АНАЛИЗА
Аннотация: Исследуется проблема аспектно-эмоционального анализа текста. По срав-нению с общим анализом тональности такой вариант является более сложным по причине наличия ряда сопутствующих подзадач, таких, как выделение аспектных терминов, определение тональности по отношению к этим терминам и аспектным категориям. Однако решение данной проблемы значительно расширяет возможности систем автоматического анализа неструктурированного текста. Приведен обзор предыдущих работ в области аспектно-эмоционального анализа, описаны обучающие и тестовые данные семинара SentiRuEval. Для за-дачи извлечения аспектных терминов использовано векторное пространство распределенных представлений слов. Тональность аспектных терминов опреде-ляется на основе функций совместной информации и семантического сходства. Приведены сравнительные результаты на тестовых данных и заключительные выводы.
ТЕСТИРОВАНИЕ МЕТОДОВ АНАЛИЗА ТОНАЛЬНОСТИ ТЕКСТА, ОСНОВАННЫХ НА СЛОВАРЯХ
Аннотация: Технологии анализа тональности текста развиваются интенсивно, что обу-словлено ростом объемов открытых источников, представляющих мнения поль-зователей интернета по различным вопросам. В статье описаны методы для анализа тональности текстов отзывов и коротких сообщений (твитов), приводятся результаты оценки их качества, которая производилась в рамках российского семинара SentiRuEval-2015.
ИСПОЛЬЗОВАНИЕ СИНТАКСИСА ДЛЯ АНАЛИЗА ТОНАЛЬНОСТИ ТВИТОВ НА РУССКОМ ЯЗЫКЕ
Аннотация: Представлен подход к решению задачи анализа тональности в рамках те-стирования SentiRuEval – открытого соревнования систем анализа тональности на русском языке. Описанный алгоритм был применен в дорожке по анализу то-нальности твитов о банках и телекоммуникационных компаниях. Для этих данных была разработана и оценена классификация на три класса: положительный, отрицательный и нейтральный. Для решения поставленной задачи использовались различные алгоритмы машинного обучения. Признаками для классификатора являлись лингвистические данные, полученные из текста с помощью разработанного нами морфо-синтаксического анализатора. Нормализованные слова, а также синтаксические связи, оказались решающими признаками для достижения наилучшего резуль-тата, который был получен с помощью статистического алгоритма опорных век-торов. Оценка, проведенная организаторами конкурса, выявила высокое качество предложенного подхода, который занял первую строчку по трем из четырех мерам качества.
ОПЫТ ПОСТРОЕНИЯ СИСТЕМЫ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ТОНАЛЬНОСТИ ОБЪЕКТОВ НА ОСНОВЕ СИНТАКТИКО-СЕМАНТИЧЕСКОГО АНАЛИЗАТОРА
Аннотация: Исследуется применение лингвистического подхода для решения задачи автоматического определения тональности объекта. Исследование проводилось в рамках цикла тестирования систем автоматического анализа тональности SentiRuEval. Задание, предложенное организаторами дорожки, заключалось в том, чтобы определить мнение пользователя (положительное, отрицательное или нейтральное) по отношению к операторам сотовой связи на материале сообщений социальной сети Twitter и новостей. Авторы настоящей работы исключили новостные сообщения из тестовой коллекции, так как формальные тексты существенно отличаются от неформальных по своей структуре и лексике и, сле-довательно, требуют другого подхода. При решении поставленной задачи был использован лингвистический метод, основанный на синтактико-семантическом анализе. Согласно этому подходу тональная лексика привязывается к объекту на одной из двух последовательных стадий. Первая стадия включает в себя исполь-зование семантических шаблонов, которые сравниваются с деревом синтаксиче-ского разбора предложения; вторая стадия использует эвристики для связывания тональной лексики с объектом оценки в случае, когда синтаксические связи между ними отсутствуют. Машинное обучение не применялось. Метод проде-монстрировал очень хорошие результаты, которые примерно совпадают с лучшими результатами методов с использованием машинного обучения и гибридных методов.
ИЗВЛЕЧЕНИЕ АСПЕКТОВ ТОВАРОВ ИЛИ УСЛУГ ИЗ ОТЗЫВОВ ПОТРЕБИТЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ МОДЕЛИ УСЛОВНЫХ СЛУЧАЙНЫХ ПОЛЕЙ
Аннотация: Описана система, принимавшая участие в соревновании SentiRuEval-2015 по автоматическому извлечению аспектов из отзывов и оценке этих аспектов по тональности. В основе разработанной системы лежит алгоритм условных слу-чайных полей (CRF), она использовалась в решении двух подзадач и тестирова-лась на двух предметных областях: рестораны и автомобили. Для обеих задач и обеих предметных областей показаны высокие показатели метрики полноты. Это означает, что система может вполне успешно находить аспектные термины. Вместе с тем, полученный низкий показатель точности свидетельствует о том, что система принимает за аспектные достаточно много терминов, которые ас-пектными не являются. В целом же система показала сравнительно хорошие ре-зультаты по сравнению с другими участниками соревнования.