О пандемии COVID-19 активно распространялась дезинформация, особенно в социальных сетях. Норвежское правительство хотело понять, откуда берется эта дезинформация и что нужно сделать, чтобы предотвратить ее распространение. Для этого правительство приняло решение отслеживать эмоции пользователей и дезинформацию в социальных сетях, особенно в Twitter.
Проблема
В сети выложено огромное количество данных, поэтому их сбор и сортировка для анализа и выработки решений отнимают много времени. Компании ALAN Analytics требовалось собрать большой объем качественных данных, а затем интегрировать их с помощью конвейера данных с имитационной моделью AnyLogic. Это позволило бы понять, как именно распространяются дезинформация и эмоциональное заражение, и как они повлияли на поведение людей во время пандемии COVID-19.
Решение
Компания ALAN предложила использовать многоагентную имитационную модель поведения на основе ИИ. Это агентная модель, в которой системы внутри каждого агента программируются таким образом, чтобы воспроизводить психологически реалистичное поведение, насколько это возможно или требуется для конкретного применения. Этот подход был выбран для исследования восприятия обществом COVID-19.
ALAN Analytics рассмотрела три вопроса:
- Кто готов был следовать государственным предписаниям?
- Когда именно дезинформация была более действенной (это позволило бы скопировать эти модели поведения и получить преимущество при информационной перегрузке в социальных сетях)?
- Как тревожность повлияла на политические убеждения и идентичность людей? Какой эффект оказала тревожность на распространение дезинформации и готовность людей следовать предписаниям?
В имитационной модели поведения было заложено три основных типа входных и выходных данных: поведенческий, психологический и цифровой. Поведенческие данные были получены из опросов. Цифровые были взяты из онлайн-источников, таких как Twitter. Психологические представляли собой комбинацию результатов опросов и цифровых данных.
Опросы проводились в течение двух волн COVID, чтобы можно было оценить изменения с течением времени. Мнения людей по поводу дезинформации позволили выделить два информационных кластера, что было учтено в модели.
Один кластер объединял людей, поддерживающих дезинформацию или теории заговора, а другой — тех, кто их не поддерживал. В промежутке между первым и вторым опросом оба эти кластера определились более четко. Эти данные были использованы, чтобы лучше определить поведенческие аспекты моделирования в отношении реакций на различные политики.
В модели использовались семантические сети, чтобы воспроизвести в ней личные и общественные мнения, поведение и идентичности. Некоторые различия социальных идентичностей удалось реконструировать с помощью многоподходного моделирования AnyLogic, добавив системную динамику к агентной модели.
Был проведен анализ данных из Twitter с целью получения представления о личности, ее заботах и страхах, в особенности в увязке с политическими предпочтениями. Анализ проводился с помощью CulturePulse API на всех языках, включая анимированные символы эмоций (эмодзи), после чего результаты были импортированы в AnyLogic. Важно отметить, что CulturePulse Pipeline — это не просто конвейер машинного обучения. В нем используется как подход на основе машинного обучения, так и лексический подход.
Благодаря ПО AnyLogic компания ALAN смогла построить и запустить модели, а также получить диаграммы состояний из нескольких моделей AnyLogic. Это позволило перенести аналитику данных из CulturePulse и построить единый конвейер данных для создания психологически реалистичной многоагентной ИИ-модели.
Результаты
Наиболее важным выводом этого исследования стало понимание того, что различные географические регионы имеют существенные культурные особенности. Дезинформация в Скандинавии может отличаться от дезинформации за ее пределами.
Поэтому методы борьбы с ней, способные сработать на Ближнем Востоке или в Северной Америке, в Скандинавии могут дать противоположный эффект. Таким образом, универсального способа борьбы с дезинформацией не существует. Кампания по борьбе с дезинформацией должна учитывать местные культурные особенности.
В будущем можно попытаться расширить эту платформу и использовать ее для анализа новых политик, способных снизить угрозу политического насилия. Данный подход хорошо подходит для агентного моделирования и обеспечиваемых с его помощью прогнозов.
Этот проект был представлен на конференции AnyLogic 2021 доктором Джастином Э. Лейном, техническим директором компании ALAN Analytics.
Презентация доступна в формате PDF.