Размер шрифта
-
+

BIG DATA. Вся технология в одной книге - стр. 49

. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.

Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее[108].

Люди предоставляют данные для переработки, чтобы получать результаты, помогающие в принятии решений. В базах данных, похожих на базу из примера Синтии Дворк, собирается относительно специфическая информация ограниченного объема. Это так называемые малые данные. Они не сопоставимы с уму непостижимым количеством «следов», которые накапливают современные центры обработки «больших данных». Чтобы получить от инфопереработчика нечто действительно полезное, надо предоставить ему точные исходные данные, например о ваших интересах и предпочтениях. Если вы не готовы поделиться этой информацией, придется удовлетвориться рекомендациями для среднестатистического гражданина, то есть тем, что пользуется популярностью или подходит большинству обывателей. Если вы предоставите неверные исходные данные, то, скорее всего, получите совершенно бесполезные результаты на выходе. Альтернатива выглядит так – незначительный выигрыш в приватности оборачивается проигрышем в полезности.

Что за псевдонимом?

Решение предоставлять или не предоставлять личную информацию влечет за собой последствия. В одной ситуации раскрытие своих идентификационных данных может оказаться рискованным или вредным; в другой ситуации то же самое может произойти, если они не предоставлены. Цифровые следы, оставленные нами, делают анонимность практически невозможной.

Страница 49