ОСОБЕННОСТИ ПРОВЕДЕНИЯ КОНТЕНТ-АНАЛИЗА В СОЦИАЛЬНЫХ МЕДИА

Борисова А.С.
Волгоградский институт управления, филиал РАНХиГС при Президенте РФ

ОСОБЕННОСТИ ПРОВЕДЕНИЯ КОНТЕНТ-АНАЛИЗА В СОЦИАЛЬНЫХ МЕДИА

Аннотация

В статье проведен анализ современных социальных медиа как источников информации для исследований по различным дисциплинам. Обоснована необходимость систематического мониторинга социальных сетей и сайтов для выявления, при наличии, провокационной информации. В статье также выделены основные этапы проведения контент-анализа. В результате исследования сделан вывод о целесообразности сочетания количественного и качественного методов для проведения контент-анализа в социальных медиа.

Ключевые слова: контент-анализ, социальные медиа, социальные сети, методология.
Keywords: content analysis, social media, social networks, methodology.

За последние несколько лет социальные медиа стали неотъемлемым компонентом общественной жизни, влияющим на убеждения, ценности и отношения людей, а также их намерения и поведение. Социальные медиа включают в себя интерактивные интернет-приложения, поддерживающие идеологическую и технологическую концепцию Web 2.0. К ним можно отнести социальные сети, блоги и микроблоги, сайты отзывов, форумы, видео и аудиохостинги и другие инструменты для создания и обмена пользовательским контентом.

Основным отличием социальных медиа от традиционных интернет-СМИ является переход от вещательного монолога, т.е. направления потока информации «один-ко-многим», к социальному диалогу, т.е. направлению потока информации «многие-ко-многим». Через социальные медиа пользователи могут загружать фотографии, видео, музыку, картинки и тексты, чтобы делиться идеями, чувствами, мнениями и опытом с другими членами интернет-сообщества. Социальные сети позволяют общаться и сотрудничать людям в огромных масштабах без географических, временных и системных ограничений.

Информация пользователей, их комментарии, размещенные в социальных сетях, анализируются и широко используются в исследованиях по различным дисциплинам, включая политологию, коммуникации, журналистику и бизнес. С помощью социальных медиа можно оказывать влияние на формирование общественного мнения, а публикуемый контент может служить индикатором для мониторинга изменения отношения пользователей к заслуживающим внимания или спорным вопросам.

Одной из особенностей социальных сетей является высокая скорость распространения информации. При этом моментально расходятся не только положительные высказывания, но и критика. Зачастую всплеск негатива за несколько часов может превратиться в настоящий информационный взрыв, и с каждым часом напряженность будет только возрастать.

Примером распространения подобной дезинформации было размещение фейковых новостей о сокрытии официальными структурами числа погибших при пожаре в торговом центре «Зимняя вишня» в Кемерово в марте 2018 года [1]. Лица с антисоциальными мотивами специально распространили в социальных сетях ложную информацию для увеличения социальной напряженности и тревожности, роста недоверия к органам государственной власти. Возможностью публиковать контент в социальных медиа анонимно часто пользуются интернет-тролли, демонстрирующие различные формы деструктивного поведения [2].

Отслеживать дезинформацию в социальных медиа эффективнее всего на латентной стадии, поскольку чем раньше получится начать кампанию по нейтрализации негатива, тем более эффективной и менее затратной она получится. Для этого необходимо систематически проводить контент-анализ источников средств массовой информации, сайтов, социальных сетей, для выявления, при наличии, их провокационной направленности.

Контент-анализ представляет собой метод качественно-количественного анализа содержания данных с целью выявления или измерения различных отраженных в них фактов и тенденций [3]. Объектами контент-анализа могут быть документы, сообщения, комментарии в социальных сетях и форумах, размещаемые видео и аудиофайлы.
Можно выделить следующие этапы проведения контент-анализа в социальных медиа.

Этап 1: Определение цели и объема исследования.
Для большинства исследований выбор четких целей обычно является наиболее важным шагом. Примерами могут быть пассивный поиск информации провокационной направленности или определение отношения общества к конкретным политическим деятелям и т.д.

Этап 2: Определение ключевых условий поиска.
Определение правильных ключевых поисковых терминов является важным шагом к успешному анализу данных в социальных сетях. На данном этапе необходимо определить понятия или единицы, которые необходимо подсчитать в тексте, построить категории анализа, создать формы кодирования.

Традиционный контент-анализ предполагает субъективную интерпретацию человеком. Таким образом, процедура классификации должна быть надежной, чтобы обеспечить согласованность между разными кодерами во времени. В традиционном анализе контента исследовательская группа должна сформулировать схему кодирования и обучить кодеров до анализа характеристик сообщений. Исследователи и ученые в области лингвистики разработали алгоритмы и программное обеспечение для помощи в анализе контента, что помогло уменьшить субъективную интерпретацию среди программистов. Компьютерное лексическое программное обеспечение имеет несколько категорий. Некоторые простые лексические программы производят подсчет слов, тогда как другие производят как подсчет слов, так и совпадения.

Этап 3: Определение источников данных.
Определение наиболее полезных источников данных является еще одним важным шагом к анализу данных в социальных сетях.
В зависимости от целей исследования можно выделить следующие категории социальных медиа для проведения контент-анализа: сайты социальных сетей (например, Facebook), сайты обмена видео (например, YouTube), сайты обмена фотографиями (например, Flickr), сайты обзора продуктов и услуг (например, Yelp), интернет-сообщества (например, Chowhound), блоги (например, Gardenista), и микроблоги (например, Twitter).

Этап 4: Сбор данных.
Для сбора и анализа данных в социальных медиа был разработан ряд бесплатных и коммерческих программ и услуг [4]. Основное внимание этих инструментов направлено на предоставление сводной статистики данных. Веб-аналитика — например, подсчет слов, охват, объем, анализ настроений — может предоставить ценные моментальные срезы веб-контента. Предлагаемое ПО в этой области имеет следующие дополнительные функциональные возможности.

  • Измерение частоты хэштегов в наборе данных с течением времени с помощью кросс-таблицы. Эта информация отображает даты, когда выбранные хэштеги были наиболее и наименее популярны среди пользователей.
  • Автоматический импорт и мониторинг из Twitter, Reddit, RSS-каналов и общедоступных страниц Facebook .
  • Анализ метаданных. Наряду с неструктурированным текстом данные социальных сетей содержат ценные метаданные, которые можно автоматически импортировать в ПО в качестве переменных, что позволяет проводить более полный анализ набора данных. Эти метаданные различаются в зависимости от источника и могут включать в себя дату, количество лайков и комментариев, количество подписчиков и друзей, избранное и ретвиты, а также отзывы и комментарии.
  • Кластеризация и тематическое моделирование для поискового анализа текста. Одной из самых больших проблем в работе с данными социальных сетей является ее объем. Функции моделирования и кластеризации тем позволяют быстро просматривать темы, появляющиеся в большом наборе данных. Мониторинг соответствующих тем в социальном диалоге может дать полезную информацию, выявив доминирующие или меняющиеся мнения о ключевых игроках, проблемах, компаниях или продуктах.
  • Геокодирование. Метаданные также могут содержать информацию о местоположении либо в виде широты и долготы, либо в формах названия города, штата или страны, почтового индекса или IP-адреса.
  • Готовые словари контент-анализа. Предлагаемое на рынке ПО предоставляет возможность применить готовый словарь категоризации или создать пользовательский словарь категоризации ключевых слов и фраз, который позволит измерить определенные измерения вашего набора данных, включая настроения.

Этап 5: Преобразование данных.
В прошлом контент-анализ проводился в основном вручную, и исследователям приходилось субъективно интерпретировать текст по классификации. С развитием лексического программного обеспечения, семантического и статистического инструментария, исследователи могут объективно интерпретировать качественную информацию с более широкой точки зрения, выявляя основные ключевые атрибуты, факторы и темы.

Этап 6: Анализ данных.
Выделяют количественный и качественный анализ данных. Основным методом в большинстве исследований является количественный анализ содержания в силу дешевизны и простоты. Он предполагает сбор большого количества качественных данных и преобразование их в данные количественного характера, которые могут быть предметом дальнейшего статистического анализа, например, факторного.

Большинство лексических программных пакетов генерируют список ключевых слов вместе с их частотой. Ключевое слово может рассматриваться как ключевой атрибут, а подсчет частоты может рассматриваться как сила этого атрибута, встроенного в текст. С этой точки зрения контентный анализ с помощью лексического программного обеспечения может многократно применяться в нескольких аналогичных документах для идентификации таблицы частот. В этой таблице столбцы представляют ключевые атрибуты (то есть ключевые слова, полученные из автоматизированного лексического анализа основного файла), тогда как строки представляют силу атрибутов среди разных авторов или авторов. После заполнения таблицы частот таблица подвергается факторному анализу. Учитывая, что контекстная информация происходит из контент-анализа, исследовательский факторный анализ является наиболее подходящим методом для изучения лежащих в основе факторов.

В случае получения интересных количественных результатов возможно применение качественного объяснения контента. Качественный анализ текстов необходим, чтобы понять их глубокий смысл и возможные интерпретации публики. Таким образом, сочетание количественного и качественного методов является идеальным подходом для проведения контент-анализа в социальных медиа.

*Исследование выполнено при финансовой поддержке РФФИ и Администрации Волгоградской области в рамках научного проекта № 18-410-343006 «Повышение уровня доверия населения к региональным органам власти через Интернет-коммуникации».

Литература:

  1. Иванов А. Фейки кемеровской трагедии: разбираем ложные вбросы о пожаре в «Зимней вишне» // Комсомольская правда.– [Электронный ресурс].
  2. Борисова. А.С. Троллинг как новое социальное явление в системе интернет-коммуникации / А.С. Борисова // Теория и практика общественного развития.– 2019.– №8(138).– С. 13-16.
  3. Манаев, О.Т. Контент-анализ – описание метода.– [Электронный ресурс].
  4. Social media content analysis with a text analytics tool.– [Электронный ресурс].