2.2 Суета вокруг данных: государство, бизнес, граждане

Авторы раздела
Бегтин И. В.
Коршунова С. В.

Время чтения —
16 минут
На рынке данных выделяют три основные группы участников: государство, бизнес и граждан. Обычные люди являются основным источником данных, при этом имеют меньше всего возможностей контролировать, как и в каких целях собираются и обрабатываются их данные. Многие операторы данных собирают избыточные данные «на всякий случай».

2.2.1 Главный источник данных

Ключевым действующим лицом на рынке данных являются физические лица как основной и самый крупный источник данных. Их данные собирают, обрабатывают и продают всевозможные компании, технологические гиганты, государственные органы и службы. Среди всех видов данных, наверное, наибольший интерес представляют большие пользовательские данные и социальные данные, часто включающие ПД граждан.
Социальные данные — самое ценное сырье XXI века, «новая нефть». Как и настоящая нефть, данные не используются в первичном состоянии, прежде всего, их нужно переработать, в том числе с помощью ИИ, для этого проводится агрегирование, анализ, сравнение, фильтрация, и уже затем они используются при создании новых продуктов и сервисов. Собирая данные об одном пользователе, компании неизбежно получают данные о его друзьях, родных, коллегах, других людях, которые могли не давать своего согласия на сбор таких данных и даже не знать о нем.
Вайгенд А. Big Data: Вся технология в одной книге. М.: Litres, 2019.

В коммерческом секторе выделяется несколько групп участников с различными интересами и стратегиями развития. На рисунке 2 перечислены участники рынка мобильных устройств, собирающие социальные данные, фактически же участников рынка данных со стороны бизнеса гораздо больше, и они постоянно наращивают объём собранных данных пользователей.

При этом сами пользователи почти никогда не знают:

  • какие данные о них собираются;
  • у кого и насколько надежно они хранятся;
  • сколько компаний, людей и государственных органов скольких стран имеют доступ или возможность получить доступ к этим данным;
  • какие социальные связи с какими другими людьми прослеживаются;
  • как удалить свои данные в базах сторонних компаний, отозвать свое согласие и т. п.
Рисунок 2
Участники рынка цифровых данных: граждане, государство и бизнес
Согласно отчету «Развитие цифровой идентификации» (2019) компании EY, многие операторы данных, предоставляющие те или иные услуги, собирают избыточные данные «на всякий случай». Порой эти нарушения затрагивают одновременно миллионы пользователей, например вышеупомянутый сбор голосовых сообщений без ведома пользователей ИТ-гигантами (см. раздел 2.1.2.2). Почти 90% утечек персональных данных в России (в среднем в мире — 56%) — дело рук сотрудников компаний, в первую очередь операторов в банках и колл-центрах, у которых есть доступ к данным для выполнения своих должностных обязанностей. Одним из факторов, способствующих утечкам, исследователи назвали низкий уровень дохода: средняя зарплата этих сотрудников — всего 27 000 руб. Чем больше операторов хранит данные о пользователе, тем выше риск утечки. Как обнаружили исследователи EY, обычный россиянин оставляет свои данные в среднем в 15 организациях, а москвичи — в среднем в 24 организациях.
Безусловно, компании не ограничиваются сбором данных в собственных интересах. Пользователи получают множество бесплатных сервисов и других преимуществ (рисунок 3).
Рисунок 3
Бесплатные преимущества современной цифровой среды
Обмен данных на бесплатные сервисы прямо связан с проблемой инфляции приватности. Для пользователя цена услуг цифровых компаний растет с каждым запросом на данные, с каждым алгоритмом, который лучше извлекает знания из собранных данных, и т. д. Пользователь может только ограничить сбор данных. Даже если он удалит приложение, данные о нем у оператора (владельца приложения) останутся на многие годы, если не навсегда.
Для ИТ-корпораций крайне выгодно продолжать массовый сбор данных в нынешней ситуации, когда пользователям проще согласиться, чем разбираться детально, какие данные они отдают. Инфляция приватности и монополизация рынка цифровых услуг могут иметь разные последствия. Например, бесплатные сервисы постепенно станут платными, причем на фоне нарастания темпов инфляции сервисы постепенно будут только дорожать. Уже сейчас Google может ввести плату за поиск в интернете, пользование видеосервисом YouTube и почтовым сервисом Gmail. Введение даже небольшой платы, например 0,99 долл. в месяц, принесет компаниям миллиарды долларов.

Выдачу поиска в AppStore, официальном магазине приложений для iOS, компания Apple настроила таким образом, что там активно показываются прежде всего ее собственные приложения. Исследование New York Times показало, что в результатах поиска приложения, принадлежащие Apple, часто стоят выше других, причем они даже не всегда соответствуют запросу. К компании был подан коллективный антимонопольный иск, и в мае 2019 года Верховный суд США удовлетворил иск, после чего алгоритмы AppStore изменились: в выдаче стало намного меньше приложений от Apple.
Nicas J., Collins K. How Apple's Apps Topped Rivals in the App Store It Controls // The New York Times.
Liptak A., Nicas J. Supreme Court Allows Antitrust Lawsuit Against Apple to Proceed // The New York Times.
В настоящее время данные, полученные от граждан, ценятся и востребованы бизнесом выше, чем принятые из других источников. Огромное количество данных пользователи передают в процессе работы с устройствами ИВ. Вместе с тем данные из других источников зачастую имеют высокую значимость, например данные ИВ в промышленности.

2.2.2 Государство и граждане

Государственные органы накапливают обширные базы данных о гражданах и организациях через системы выдачи удостоверений личности, системы налогообложения и образования, здравоохранения и правосудия. Эти базы данных позволяют государственным органам определять приоритетные задачи и в целевом порядке использовать ресурсы. Совместное использование баз данных позволяет сопоставлять и увязывать разные наборы данных.
На рынке данных государство выступает в двух основных ролях:
Регулятор
обеспечивающий баланс сил с помощью законодательного регулирования сферы на основе диалога с обществом и защиту данных граждан;
Потребитель данных:
в государственных информационных системах данные используются для принятия государственных решений на всех уровнях, оказания государственных услуг, защиты национальных интересов и безопасности.
Конфликт интересов при исполнении этих двух ролей приводит к тому, что в некоторых случаях государство устраняется от законодательного ограничения бизнеса при обороте данных, концентрируясь на возможности использовать собранные данные о гражданах в своих целях. В основе действий государства должна лежать национальная концепция или стратегия развития рынка данных, охватывающая принципы (в том числе этические) госрегулирования рынка и степень участия государства. Появление соответствующих законов не разрушает рынок, а лишь корректирует его, при этом дает государству новые инструменты влияния на компании, занимающиеся сбором и обработкой данных.
Государство как общественный институт всегда было и будет заинтересовано получать максимальный объем информации о своих гражданах. Модель капитализма слежки на основе интернета, мобильных устройств и интернета вещей, внедренная дата-корпорациями во главе с Google, оказалась очень выгодной и для государства, а потому и особенно жизнеспособной. Такова одна из причин, почему государства не решаются кардинально ограничить возможности дата-корпораций в сфере сбора и обработки больших данных и персональных данных пользователей. Каждый гражданин должен иметь право знать, какие данные о нем и какие операторы хранят.
Смотрите раздел 5.2,
смотрите также: Zuboff S. The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power. New York: Public Affairs, 2019.
В любой стране, в том числе в России, подавляющее большинство обычных граждан не имеют достаточного уровня цифровой и правовой грамотности, к тому же нет достаточного нормативного правового регулирования для полной защиты их прав на цифровые данные. Соответственно, защитой граждан необходимо заниматься государству с помощью продуманного законодательного регулирования прав и обязанностей участников рынка данных. Каждый гражданин должен иметь право знать, какие данные о нем и какие операторы хранят. В западных странах развита система общественных организаций, и они фактически подталкивают государство к выполнению его функций, в том числе к улучшению регулирования. В России пока очень мало таких организаций, которые защищали бы интересы российских граждан в сфере данных, и еще реже интересы граждан представляют органы власти, которые пока все еще недостаточно разбираются в сфере цифровых технологий, чтобы обеспечить эффективно работающие на практике нормы права по защите данных граждан.
Бегтин И. Открытые данные — тренд государства будущего // Ассоциация участников рынка данных.
Каждый гражданин должен иметь право знать, какие данные о нем и какие операторы хранят.
В настоящее время в России об указанных проблемах говорят
Инициатива Минкомсвязи по созданию платформы цифровых профилей формально включает предоставление гражданам возможности управлять своим согласием на обработку ПД, в частности отзывать его. Согласие — это лишь одно из оснований для обработки ПД, и после его отзыва ПД могут продолжать обрабатываться. Есть иные инициативы, в том числе в сфере открытых данных, организации Национальной системы управления данными (НСУД) (подробнее см. в разделе 5.1).
«Мне нечего скрывать» // Роскомсвобода.
См. ст. 6 Федерального закона «О персональных данных» от 27.07.2006 №152-ФЗ (ред. 31.12.2017).
Бегтин И. Открытые данные – тренд государства будущего // Цифровая экономика 2024.

Законопроект о цифровом профиле гражданина России создает повышенный риск утечек персональных данных. ФСБ России выступило с критикой законопроекта Минкомсвязи РФ о цифровом профиле, указав в качестве главных недостатков повышение риска неправомерных сбора и обработки данных, несоответствие действующему Федеральному закону «О персональных данных», а также риск разглашения информации о лицах, подлежащих государственной защите. Мнения экспертов сводятся к тому, что хранение в одном месте такого количества данных о пользователях многократно повышает возможный ущерб в случае их утечки. Возможности госорганов в сфере защиты данных действительно зачастую оказываются недостаточными. В конце 2019 года стало известно об утечке персональных данных (включая ФИО, даты рождения, СНИЛС, ИНН, данные о детях и др.) около 28 000 пользователей «Госуслуг» в одном из российских регионов. В базе данных были не только ПД, но и токены авторизации для доступа в личные кабинеты пользователей. Публикация вышла раньше, чем уязвимость на сервере была закрыта, что дополнительно увеличивало риски для пострадавших граждан.
Степанова Ю., Новый В., Тишина Ю. Федеральная служба в опасности // Коммерсант.
О внесении изменений в отдельные законодательные акты (в части уточнения процедур идентификации и аутентификации) (законопроект) // Федеральный портал проектов нормативно-правовых актов.
Как потребители государственные органы и службы нуждаются в большом количестве актуальных и качественных данных в пригодном для анализа виде, чтобы использовать их для повышения эффективности госуправления:
самые различные данные пригодны для внедрения практик эффективного государственного управления на основе данных;
государственные данные муниципальных и региональных органов — для реализации актуальных, полезных проектов на местах за счет более полного отображения действительного положения дел;
качественная статистика, показывающая реальное положение дел в стране, регионах, муниципалитетах, — для принятия своевременных и точных управленческих решений;
данные о социальном статусе и материальном положении граждан — для перехода от заявительной системы социального обеспечения к созданию и развитию механизмов оказания адресной социальной помощи;
данные о передвижениях, проживании, пребывании горожан в течение дня — для модернизации инфраструктуры города, регулирования транспортных потоков, создания комфортной городской среды и формирования экосистемы «умных» городов в будущем;
данные из систем видеонаблюдения, от мобильных операторов и интернет-провайдеров — для обеспечения национальной безопасности и безопасности граждан.
Подробнее о практиках госуправления на основе данных см.: Государство как платформа: люди и технологии / РАНХиГС. М., 2019.
Российская система госуправления по многим признакам еще не готова к такому использованию данных отчасти из-за дефицита нужных компетенций у госслужащих, отчасти из-за отсутствия культуры работы с данными, несформированности культуры принятия решений на основе данных с учетом рисков создать этические проблемы, отсутствия качественных государственных данных и т. д. Например, в 2017 году 78% государственных учреждений в России не использовали специальные ведомственные почтовые сервисы, а предпочитали почтовые сервисы Mail.ru и Яндекса, которые не являются достаточно надежными. В России культура работы с данными и с защитой персональных данных по-прежнему недостаточно развита и в коммерческой среде, и среди госслужащих, и среди самих граждан.
Как следствие, есть высокий риск появления этических проблем и принятия решений, только усугубляющих их. Например, даже если возникают инициативы, изначально направленные на благо, их реализация с недостаточной степенью надежности и слабая подготовка госсектора способны привести к тому, что инициативы (например, вышеупомянутый цифровой профиль) окажутся потенциально опасными.

Некорректная работа с данными государства может создать проблемы этического плана:

  • непреднамеренное создание алгоритмов и систем принятия решений, дискриминирующих отдельные группы населения из-за недостаточно тщательного отбора данных для обучения алгоритмов;
  • конфликт интересов общества и отдельных групп граждан и общественное неприятие инициатив, в том числе из-за отсутствия информационной поддержки и предварительной работы с общественным мнением;
  • принятие на государственном уровне неверных решений с далеко идущими последствиями в виде финансовых, репутационных и иных потерь для государства;
  • непреднамеренное нарушение законодательства госслужащими по причине неэтичного использования данных, повлекшего за собой значительный ущерб.
Все эти проблемы требуют своевременного решения на всех уровнях — регулирования, правоприменения, создания соответствующей инфраструктуры, внедрения культуры работы с данными в органах власти и т. д.

2.2.3 Государство и бизнес

Государство по своей природе — структура гораздо более крупная, инертная и стабильная, чем отдельные компании, насколько бы крупными они ни были. По этой причине в освоении цифровых технологий государство чаще всего отстает от бизнеса.
Многие государства заинтересованы в том, чтобы использовать уже работающую инфраструктуру дата-корпораций, а не вкладывать огромные ресурсы в развитие своих.

По словам Михаила Мишустина, руководителя Федеральной налоговой службы России, в планах службы — использовать данные из аккаунтов налогоплательщиков в социальных сетях: «Трансформация налоговых органов в цифровые платформы, которые соединены с соцсетями, популярными цифровыми сервисами и другими онлайн-платформами, — это следующий шаг в развитии налогового администрирования». Известны многочисленные примеры, когда ФНС уже изучала эти данные в ручном режиме для выявления незаконного предпринимательства.