Схожим образом подробности о вас, а иногда и о ваших близких сообщают ваши покупки в интернете. Чтобы доставить вам заказ, Amazon нужны данные вашей кредитной карточки, в том числе ваши имя и адрес. Сообщить правильный адрес в ваших интересах, иначе посылка до вас не дойдет. В то же время история заказов может вводить в заблуждение, если в ней указаны вещи, которые покупались для кого-то еще. В Amazon можно помечать приобретаемый товар значком «в подарок», и тогда он не будет учитываться в рекомендациях для вас[100]. Алгоритмы обработки данных могут отделять то, что вы указали как покупку не для себя, от всех других ваших заказов. Когда вы покупаете блузку в подарок женщине, то, выбирая размер, сообщаете информацию о ее комплекции. Если это происходит за одну-две недели до Дня матери, а фамилия получательницы совпадает с вашей, алгоритмы Amazon могут сделать вывод о ваших родственных связях. Возможно, что ближе к следующему Дню матери Amazon порадует вас рекомендациями подарков по этому поводу.
Страничка Your Amazon предоставляет пользователям определенную прозрачность и свободу выбора. Возможность просматривать свою первичную информацию, в том числе историю покупок, позволяет контролировать данные, которые становятся основой для выработки персональных рекомендаций. В историю покупок можно включать и вещи, купленные в других местах, причем даже приобретения, сделанные много лет назад. В 2014 году похожий подход был применен в Facebook: «Журнал действий» представляет собой список запросов друзей, лайков, историй и фото с вашими тэгами, приглашений на мероприятия и многого другого. При желании можно удалять из истории отдельные элементы данных. А поскольку ваша цифровая личность в Facebook используется для персонификации рекламы, удаление части данных позволяет влиять на то, какие предложения вам будут присылать[101].
Удаление одного, двух или двадцати лайков из истории действий вряд ли изменит общий характер представления о вас. Исследования Дэвида Стиллуэлла из Психометрического центра Кембриджского университета показали, что действия в Facebook действительно достаточно точно отражают черты личности пользователя. Несколько тысяч пользователей Facebook прошли тест на «Большую пятерку» индивидуальных различий (открытость опыту, сознательность, экстравертность, доброжелательность и нейротизм), а затем Стиллуэлл предложил другой группе участников опыта оценить черты характера этих пользователей исходя из их профайлов. Обе оценки оказались удивительно схожими. Обычно образ человека в Facebook довольно точно отражает действительность – люди остаются самими собой, даже когда тщательно редактируют свои профайлы в социальных медиа[102]. Если совершенно незнакомые люди могут оценить основные черты вашего характера по ленте событий на вашей странице в Facebook, то алгоритмы тем более в состоянии это сделать. Чтобы иметь возможность держать друзей и знакомых в курсе своей жизни, придется мириться с выводами, к которым придут эти алго-ритмы.
В 2013 году Стиллуэлл, его коллега Майкл Косински и группа исследователей из Microsoft Research решили выяснить, насколько точно можно судить об интеллектуальном уровне, этнической принадлежности, политических взглядах, сексуальной ориентации и наличии наркозависимости по поведению человека в Facebook. Для этого они создали приложение YouAreWhatYouLike. По утверждению авторов, в 88 процентах случаев их модель «проводила точные различия между мужчинами гетеросексуальной и гомосексуальной ориентации» исключительно на основе лайков, причем не обязательно в темах, связанных с политикой или правами человека[103]. По данным исследования, достоверными признаками мужской гомосексуальности были, в частности, лайки на «Косметику MAC» и мюзикл «Злая», а среди явных признаков мужской гетеросексуальности была реакция на Wu Tang Clan[104][105]. Проверяя кандидатов на позицию, работодатели используют тесты на ай-кью и личностные качества. Вполне возможно, что в один прекрасный день вас попросят установить специальное приложение, чтобы оценить справедливость ваших утверждений о своей высокой организованности или стрессоустойчивости[106].
Данные о личных качествах могут формироваться и без активного участия человека. Один из таких примеров – несметное число фотографий, выложенных в сеть. Появление ваших изображений в интернете – вне вашего контроля, а права на них – и подавно. Если вас случайно сфотографировали во время какого-то мероприятия, идентификация вашей личности всего лишь вопрос времени. В лаборатории искусственного интеллекта Facebook, которую возглавляет Ян Лекун, разработана система DeepFace, которая может определять идентичность лиц на фотографиях с очень высокой точностью[107]. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.
Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее[108].
Люди предоставляют данные для переработки, чтобы получать результаты, помогающие в принятии решений. В базах данных, похожих на базу из примера Синтии Дворк, собирается относительно специфическая информация ограниченного объема. Это