BIG DATA. Вся технология в одной книге
1
McLuhan, Marshall, with Wilfred Watson, From Cliché to Archetype (Berkeley: Gingko Press, 2011), p. 13. Первое издание этой книги увидело свет в 1970 году.
2
Pidd, Helen, “Germans Piece Together Millions of Lives Spied on by Stasi”, Guardian, March 13, 2011, http://www.theguardian.com/world/2011/mar/13/east-germany-stasi-files-zirndorf.
3
Koehler, John O., Stasi: The Untold Story of the East German Secret Police (Boulder, CO: Westview Press, 1999), p. 8.
4
Федеральный уполномоченный по архивам Государственной службы безопасности б. Германской Демократической Республики, “What Was the Stasi?”, Bundesregierung, http://www.bstu.bund.de/EN/PublicEducation/SchoolEducation/WhatWasTheStasi/_node.html.
5
Crocker, Andrew, “EFF Case Analysis: Appeals Court Rules NSA Phone Records Dragnet Is Illegal”, Electronic Frontier Foundation, May 9, 2015, https://www.eff.org/deeplinks/2015/05/eff-case-analysis-appeals-court-rules-nsa-phone-records-dragnet-illegal.
6
Kravets, David, “Worker Fired for Disabling GPS App That Tracked Her 24 Hours a Day”, ArsTechnica, May 11, 2015, http://arstechnica.com/tech-policy/2015/05/worker-fired-for-disabling-gps-app-that-tracked-her-24-hours-a-day.
7
В главе 3 я остановлюсь на экспериментах в социальных сетях более подробно. См. McNeal, Gregory S., “Facebook Manipulated User News Feeds to Create Emotional Responses”, Forbes, June 28, 2014, http://www.forbes.com/sites/gregorymcneal/2014/06/28/facebook-manipulated-user-news-feeds-to-create-emotional-contagion; и Booth, Robert, “Facebook Reveals News Feed Experiment to Control Emotions”, Guardian, June 29, 2014, https://www.theguardian.com/technology/2014/jun/29/facebook-users-emotions-news-feeds.
8
Sesame Credit – один из восьми пилотных проектов, призванных расширить сферу кредитования в стране к 2020 году. См. Shu, Catherine, “Data from Alibaba’s E-Commerce Sites Is Now Powering a Credit-Scoring Service”, TechCrunch, January 27, 2015, http://techcrunch.com/2015/01/27/data-from-alibabas-e-commerce-sites-is-now-powering-a-credit-scoring-service.
9
Hatton, Celia, “China ‘Social Credit’: Beijing Sets Up Huge System”, BBC News, October 26, 2015, http://www.bbc.com/news/world-asia-china-34592186.
10
Увидеть, чем я занимаюсь, можно на http://weigend.com/past (прошедшие мероприятия) and http://weigend.com/plans (текущие и будущие мероприятия).
11
Emerson, Ralph Waldo, The Prose Works of Ralph Waldo Emerson, vol. 1, rev. ed. (Boston: James R. Osgood, 1875), p. 220.
12
Я преподавал курс под названием «Революция социальных данных» в Стэнфордском университете (с 2008 года) и в Калифорнийском университете в Беркли (с 2011 года), но концептуальным представлением «социальные данные» стал заниматься еще задолго до этого. На самых ранних порах к социальным данным относили всего лишь обнародованную человеком информацию, вроде отзывов в Amazon и постов в социальных сетях.
13
Тем, кого интересуют подробности об отрывочных данных, рекомендую посмотреть видеозапись панельной дискуссии с моим участием на конференции DataEdge, которую проводил факультет информации Калифорнийского университета в Беркли в 2013 году. Она доступна на http://www.catchtalk.tv/events/dataedge/videos/sketchy-data-panel-discussion-dataedge-2013.
14
Огромная разница между подходами к защите данных между США и Европой состоит, в том числе, и в правоприменении. В США регулирующие органы для защиты граждан от рисков незаконного использования личных данных создаются отдельно для каждой отрасли, тогда как в Европе существуют единые законодательные нормы. См. издание Аппарата Президента США Big Data: Seizing Opportunities, Preserving Values, (Совместный доклад рабочей группы по большим данным и защите неприкосновенности личной жизни и Совет по развитию науки и техники), May 2014, pp. 17–18, https:// www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf.
15
Для понимания алгоритма обычно бывает нужно увидеть, как он работает с реальными данными, в идеале – вашими собственными в сочетании с данными других людей (что дает больше возможностей для сравнения). В соответствии с действующим законодательством большинство компаний не имеют права предоставить вам информацию о других людях без их согласия. Это ограничивает возможности расшифровки алгоритмов вашей жизни.
16
См., в частности, законопроект «О правах потребителя в области неприкосновенности частной жизни», внесенный Белым домом в феврале 2012 года, о котором говорится на стр.19–20 издания Аппарата Президента США Big Data: Seizing Opportunities, Preserving Values See.
17
Спасибо Эстер Дайсон, предложившей эту метафору с зеркалом и окном.
18
Comcast – американская компания, крупнейший в мире оператор кабельных и эфирных телесетей. – Прим. пер.
19
Если вы упустили это в СМИ, то можете послушать душераздирающую запись звонка на SoundCloud: Block, Ryan, “Comcastic Service Disconnection (Recording Starts 10 Mins into Call)”, SoundCloud, July 14, 2014, https://soundcloud.com/ryan-block-10 /comcastic-service.
20
Мой друг Док Серлс, соавтор The Cluetrain Manifesto и автор The Intention Economy, давно ратует за право выбора в взаимодействии потребителей и компаний, и я благодарен ему за предложение использовать этот термин для обозначения всей полноты аспектов личного волеизъявления, воплощенных в этом праве.
21
Miller, George A., “The Challenge of Universal Literacy”, Science 241 (September 9, 1988), p. 1293, http://science.sciencemag.org/content/241/4871/1293.
22
Я использую эту метафору в своей преподавательской работе уже много лет и дважды выступал на тему переработки первичных данных в 2011 году – в ООН и на конференции O’Reilly Strata Summit. Но в этом я не одинок. Среди тех, кто говорит о данных, как о новой нефти, – Клайв Хамби, участвовавший в создании клубной карты британской сети супермаркетов Tesco’s – одной из первых карт лояльности, учитывавшей все покупки в корзине покупателя. В ООН я выступал в рамках программы Global Pulse, запущенной по инициативе Генерального секретаря. Видеозапись доступна на http://www.youtube.com/watch?v=lbmsDH8RJA4.
23
“Planet of the Phones”, The Economist, February 28, 2015, http://www.economist.com/news/leaders/21645180-smartphone-ubiquitous-addictive-and-transformative-planet-phones; Rogowsky, Mark, “More Than Half of Us Have Smartphones, Giving Apple and Google Much to Smile About”, Forbes, June 6, 2013, http://www.forbes.com/sites/markrogowsky/2013/06/06/more-than-half-of-us-have-smartphones-giving-apple-and-google-much-to-smile-about.
24
Lunden, Ingrid, “80 % of All Online Adults Now Own a Smartphone, Less Than 10 % Use Wearables”, TechCrunch, January 12, 2015, http://techcrunch.com/2015/01/12/80-of-all-online-adults-now-own-a-smartphone-less-than-10-use-wearables.
25
Tecmark, “Smartphone Usage Statistics 2014: UK Survey of Smartphone Users”, October 8, 2014, http://www.tecmark.co.uk/smartphone-usage-data-uk-2014.
26
Miller, George A., “The Challenge of Universal Literacy”, Science 241 (September 9, 1988), p. 1293.
27
Madison, James H., “Changing Patterns of Urban Retailing: The 1920s”, Business and Economic History, vol. 5 (1976), p. 104, http://www.thebhc.org/sites/default/files/beh/BEHprint/v005/p0102-p0111.pdf.
28
Clark, Anna, “The Tyranny of the ZIP Code”, New Republic, March 8, 2013, https://newrepublic.com/article/112558/zip-code-history-how-they-define-us.
29
“Образцово-показательные граждане” – название одного из сегментов Acxiom. См. Hicken, Melanie, “What Type of Consumer Are You?”, CNNMoney, April 19, 2013, http://money.cnn.com/2013/04/18/pf/consumer-type/. “Барские дома” и “Селяне с дробовиками” – две категории программы «Potential Rating Index by Zip Markets» (PRIZM), которую разработала маркетинговая фирма Claritas, созданная в 1990-х годах. Сейчас Claritas – одно из подразделений Nielsen Company – компании, собирающей для производителей информацию о продажах их продукции в рознице и измеряющей телеаудиторию. См. Kotler, Philip, and Kevin Lane Keller, Marketing Management 14 (Upper Saddle River, NJ: Prentice-Hall, 2012), p. 215. “Пригородные наседки” – категория базы данных розничной сети Best Buy’, которая содержит информацию о 75 миллионах домохозяйств-покупателей и является одной из самых смелых попыток крупной розницы использовать данные для персонализации предложений. См. Kotler, Philip, and Kevin Lane Keller, Marketing Management 14 (Upper Saddle River, NJ: Prentice-Hall, 2012), p. 71; и Zmuda, Natalie, “Best Buy Touts Data Project as Key to Turnaround”, Advertising Age, February 27, 2014, http://adage.com/article/datadriven-marketing/buy-touts-data-project-key-turnaround/291897.
30
Tynan, Dan, “Acxiom Exposed: A Peek Inside One of the World’s Largest Data Brokers”, IT World, May 15, 2013, http://www.itworld.com/article/2710610/it-management/acxiom-exposed – a-peek-inside-one-of-the-world-s-largest-data-brokers.html.
31
Acxiom Corporation Annual Report 2000, June 26, 2000, p. 3, http://www.getfilings.com/o0000733269–00–000012.html.
32
Менее, чем через десять лет после того, как Дон Пепперс и Марта Роджерс предложили радикально новый подход к маркетингу в своей книге The One to One Future. См. Peppers, Don, and Martha Rogers, The One to One Future: Building Relationships One Customer at a Time (New York: Doubleday, 1993).
33
Заголовок статьи репортера Bloomberg Businessweek Брэда Стоуна получил широкое распространение в качестве обозначения бизнес-идеи Джеффа Безоса. См. Stone, Brad, The Everything Store (New York: Little, Brown, 2013), p. 13. (Русское издание – Стоун, Брэд “The Everything Store. Джефф Безос и эра Amazon”. Азбука Аттикус, 2014). Тем не менее, «амазонцы» считают свою компанию в первую очередь аналитической компанией, и, кстати говоря, идея ее создания осенила Джеффа, когда он работал в хедж-фонде D. E. Shaw & Company, совершившем революцию в спекулятивных биржевых операциях за счет использования все новых и новых источников данных.
34
Такой подход к персонализации на основе каждого конкретного случая с сегментацией на уровне одной десятой родился в разговоре с моим частым сообщником в деле социальных данных Гэмом Диасом – руководителем и основателем MoData.
35
Duhigg, Charles, “How Companies Learn Your Secrets”, New York Times Magazine, February 16, 2012, http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html.
36
Доля предварительного просмотра товаров в Amazon перед покупкой в рознице возросла с 30 процентов в 2012 году до примерно 50 в 2015-м. См. Ludwig, Sean, “Forrester: 30 % of Online Shoppers Research Amazon Before Buying”, VentureBeat, July 26, 2012, http://venture beat.com/2012/07/26/amazon-online-shoppers-research; Mulpuru, Sucharita, and Brian K. Walker, “Why Amazon Matters Now More Than Ever”, Forrester Research, July 26, 2012, https://www.forrester.com/Amazon/fulltext/-/E-RES76262; и Cassidy, Mike, “Survey: Amazon Is Burying the Competition in Search”, BloomReach, October 6, 2015, http:// bloomreach.com/2015/10/survey-amazon-is-burying-the-competiton-in-search.
37
В 2015 году Facebook сообщала о 1,59 миллиарде посещений в месяц при среднем количестве ежедневных посетителей в 1.04 миллиарда. См. Mike, “Facebook Reports Soaring Revenue, Buoyed by Mobile Ads”, New York Times, January 27, 2016, http://www.nytimes. com/2016/01/28/technology/facebook-earnings-zuckerberg.html.
38
У Google нет регулярной отчетности о количестве поисков в ее сервисах. Тем не менее в ее отчете “Zeitgeist” за 2012 год говорилось о 3,3 миллиардах поисковых запросов ежедневно. См. https://www.google.com/zeitgeist/2012/#the-world.
39
Who Owns the Future? В России книга не издавалась. – Ред.
40
Lanier, Jaron, Who Owns the Future? (New York: Simon & Schuster, 2013), pp. 273–274.
41
Facebook Annual Report 2015, January 28, 2016, https://investor.fb.com/financials /default.aspx.
42
Gittins, J. C., “Bandit Processes and Dynamic Allocation Indices”, Journal of the Royal Statistical Society B (Methodological) 41, no. 2 (1979), pp. 148–177, http://www.jstor.org /stable/2985029.
43
Спасибо одному из заслуженных разработчиков Microsoft Яну О. Педерсену за его рассказ о том, как решалась проблема исследования/использования в Yahoo! (где он прежде работал главным научным сотрудником поисковой системы) на примере поискового запроса «ягуар».
44
Гарднер рассмотрел так называемую «задачу секретаря» в журнале Scientific American за февраль/март 1960 года. См. Gardner, Martin, Martin Gardner’s New Mathematical Diversions (New York: Simon & Schuster, 1966), p. 35.
45
Founded in 1998 by myself, Christian Pirkner, Elion Chin, and Tom Sulzer, MoodLogic, которую в 1998 году создали Кристиан Пиркнео, Элион Чин, Том Сулцер и я, была одной из первых систем музыкальных рекомендаций. На пике популярности на сайте присутствовали оценки более миллиона треков от примерно 50 000 пользователей. В 2006 году программное обеспечение и информационный массив компании были куплены All Media Guide – компанией группы.
46
Glassdoor создали в 2008 году Рич Бартон, Тим Бессе и Роберт Хоман, до этого работавшие в Expedia – портале бронирования туристических и гостиничных услуг. Бартон был также в числе создателей Zillow – инфопереработчика в сфере недвижимости.
47
Общенациональный лонгитюдный опрос молодежи 1979 года, охватывающий американцев 1957–1964 года рождения, начинался с выборки в 11 000 гражданских лиц; общенациональный лонгитюдный опрос молодежи 1997 года, охватывающий американцев 1980–1984 года рождения, начинался с выборки в 8000 гражданских лиц. Более подробно – на https://www.nlsinfo.org.
48
Одна из наиболее часто цитируемых фраз Шерлока Холмса. This is one of Sherlock Holmes’s most frequently quoted lines of dialogue. См. Артур Конан Дойл, «Приключение в ‘Лесных Буках’» – Doyle, Sir Arthur Conan, “The Adventure of the Copper Beeches”, Strand Magazine (June 1892).
49
Inrix – одна из многих коммерческих организаций, анализирующих данные о местоположении мобильных телефонов с целью изучения траспортных потоков. В анализе используются также данные Garmin и других специализированных GPS- устройств навигации и информирования о состоянии дорожного движения.
50
Мой друг Джон Сквайр, генеральный директор DynamicAction, а в прошлом – главный стратег IBM Smarter Commerce, подчеркивает важность комбинирования данных из разных источников фразой «Ценность – в объединении».
51
Из беседы автора с Клаудией Перлич, главным научным сотрудником Dstillery, 25 января 2015 года. Клаудиа – моя хорошая знакомая, она была моей студенткой в Колорадском университете в Боулдере и Нью-Йоркском университете.
52
Finley, Klint, “Christmas Delivery Fiasco Shows Why Amazon Wants Its Own UPS”, Wired, December 30, 2013, http://www.wired.com/2013/12/amazon_ups.
53
Kastrenakes, Jacob, “Amazon Guarantees Packages Ordered Through Friday Will Arrive Before Christmas”, The Verge, December 16, 2014, http://www.theverge.com/2014/12/16/7401299/amazon-sets-dec-19th-cutoff-for-christmas-free-shipping.
54
Snyder, Brett, “Sabre Makes the Wrong Choice by Removing American Airlines”, CBS News Moneywatch, January 7, 2011, http://www.cbsnews.com/news/sabre-makes-the-wrong-choice-by-removing-american-airlines.
55
American Airlines, “November Line of Sale Analysis”, memo to R. E. Murray from S. D. Nason, December 3, 1981.
56
Tefft, Sheila, “Reservation Systems’ Bias a Sore Spot for Smaller Airlines”, Chicago Tribune, February 11, 1983, http://archives.chicagotribune.com/1983/02/11/page/87/article/new-technology.
57
Whiteley, David, An Introduction to Information Systems (New York: Palgrave Macmillan, 2013), p. 109.
58
С вступлением в силу Закона о либерализации авиаперевозок в 1978 году Совет по гражданской авиации ввел регламент антидискриминационных мер. See Pearlstein, Debra J., and Robert E. Iloch et al., eds., Antitrust Law Developments, vol. 1 (Chicago: American Bar Association, 2002), p. 1428.
59
Я консультировал Agoda в 2004–2007 гг. В ноябре 2007 года компания была поглощена Priceline.
60
В технике предписывающая аналитика называется «теорией управления».
61
Hern, Alex, “Why Google Has 200M Reasons to Put Engineers over Designers”, Guardian, February 5, 2014, http://www.theguardian.com/technology/2014/feb/05/why-google-engineers-designers.
62
Kohavi, Ron, Roger Longbotham, and Toby Walker, “Online Experiments: Practical Lessons”, IEEE Computer 43, no. 9 (September 2010), pp. 82–85, http://www.computer.org/csdl/mags/co/2010/09/mco2010090082-abs.html.
63
Döpfner, Mathias, “An Open Letter to Eric Schmidt: Why We Fear Google”, Frankfurter Allgemeine Zeitung, April 17, 2014, http://www.faz.net/aktuell/feuilleton/debatten/mathias-doepfner-s-open-letter-to-eric-schmidt-12900860.html
64
Цитируется по Hochschild, Jennifer L., “How Ideas Affect Actions”, in Robert Goodin and Charles Tilly, eds., Oxford Handbook of Contextual Political Analysis (Oxford: Oxford University Press, 2006), pp. 284–296.
65
CERN – Conceil Europeen pour la Recherche Nucleaire, Европейский центр ядерных исследований. – Ред.
66
На русском языке роман издавался несколько раз. Первое издание – издательский дом «Ладомир», 1994 г. В 2008 г. вышел в издательстве «Эксмо». – Ред.
67
Название романа Музиля Der Mann ohne Eigenschaften в буквальном переводе на английский звучало бы как «Человек без своего собственного». Подозреваю, что английский издатель был обеспокоен тем, чтобы читатели не решили, что у главного героя полностью отсутствует имущество.
68
Заслуга моего знакомства с представлением о камине как о технологическом средстве обеспечения тайны личной жизни принадлежит блистательному Джону Тэйсому – основателю BlinkBox Music и Reuters Venture Capital. Возможность сохранять определенную приватность при доступе к услугам инфопереработчиков всегда была одной из приоритетных задач в работе Джона. См. Taysom, John, “How Much Privacy Do We Need?”, presentation at the Alan Turing Institute Financial Summit, British Library, London, October 14, 2015.
69
Это особенно справедливо в отношении Англии, где земли переходили из общинной в частную собственность в процессе консолидации мелких земельных наделов. В числе других сельскохозяйственных инноваций того времени, способствовавших переменам, были севооборот, селекция в животноводстве, более эффективный железный плуг, более эффективная мелиорация и развитие сети каналов. См. Overton, Mark, Agricultural Revolution in England: The Transformation of the Agrarian Economy 1500–1850 (Cambridge: Cambridge University Press, 1996).
70
«Пенсильванский камин» Бенджамина Франклина был на самом деле печью, а не частью здания, но конструкция его дымохода была, бесспорно, революционной. См. Butler, Orville R., “Smoke Gets in Your Eye: The Development of the House Chimney”, n.d., http://www.ultimatehistoryproject.com/chimneys.html.
71
Этот рассказ о тайном голосовании в большой степени основывается на увлекательной статье Лепор: Lepore, Jill, “Rock, Paper, Scissors: How We Used to Vote”, The New Yorker, October 13, 2008, http://www.newyorker.com/reporting/2008/10/13/081013fa_fact_lepore.
72
Сохранившаяся переписка Милля свидетельствует о том, что самое позднее в 1853 году он уже придерживался прямо противоположных взглядов. См. Buchstein, Hubertus, “Public Voting and Political Modernization”, in John Elster, ed., Secrecy and Publicity in Votes and Debates (Cambridge: Cambridge University Press, 2015), pp. 29, 30.
73
Mill, John Stuart, “Thoughts on Parliamentary Reform”, in Dissertations and Discussions: Political, Philosophical, and Historical, vol. 4 (New York: Henry Holt, 1873), pp. 36–37.
74
Buchstein, “Public Voting and Political Modernization”, p. 31.
75
Я с изумлением узнал, что, получив патент на механический аппарат для голосования с коленчатым рычагом в 1869 году, Томас Эдисон обнаружил, что спроса на него нет. Политики хотели слышать свою аудиторию и, как можно с уверенностью предполагать, влиять на нее. Рычажный аппарат Эдисона приобрел сторонников лишь в конце 1950-х годов. См. Stephey, M. J., “A Brief History of Ballots in America”, Time, November 3, 2008, http://content.time.com/time/politics/article/0,8599,1855857,00.html.
76
Разумеется, на протяжении многих десятилетий некоторые категории американцев не допускались к голосованию на выборах на основе так называемых «экзаменов избирателей» – проверок на грамотность, которые местные избирательные комиссии специально устраивали предназначенным для отсева преимущественно черным жителям Юга.
77
Warren, Samuel D., and Louis D. Brandeis, “The Right to Privacy”, Harvard Law Review 4, no. 5 (December 15, 1890), http://groups.csail.mit.edu/mac/classes/6.805/articles/ privacy/Privacy_brand_warr2.html. NOTES TO CHAPTER XXX 243
78
Glancy, Dorothy J., “The Invention of the Right to Privacy”, Arizona Law Review 21, no. 1 (Spring 1979), pp. 9–10, http://digitalcommons.law.scu.edu/facpubs/317.
79
Само это решение означало, что учитель имел право преподавать немецкий, но прецедент использовался впоследствии в качестве основания «права на личную жизнь» во многих других ситуациях – в диапазоне от решения супружеской пары прибегнуть к аборту (дело «Американская федерация планирования семьи против Кейси») до решения однополой пары на секс по взаимному согласию (дело «Лоуренс против штата Техас»). См. Meyer v. Nebraska, 262 US Supreme Court 390 (1923), p. 399, https://supreme.justia.com/cases/federal/us/262/390/case.html.
80
Пресс-релиз Google, “Google’s Targeted Keyword Ad Program Shows Strong Momentum with Advertisers”, August 16, 2000, http://googlepress.blogspot.co.uk/2000/08/googles-targeted-keyword-ad-program.html.
81
Miller, Ross, “Gmail Now Has 1 Billion Monthly Active Users”, The Verge, February 1, 2016, http://www.theverge.com/2016/2/1/10889492/gmail-1-billion-google-alphabet.
82
Идея была не нова – впервые сравнение фотографий стало популярным на сайте “Hot or Not”, который выпускники Калифорнийского университета в Беркли Джеймс Хонг и Джим Янг запустили в октябре 2000 года.
83
Рапространенность Facebook частично ограничивается его блокировкой в ряде стран, в частности в КНР, где он почти полностью заблокирован как минимум с 2009 года. См. Chen, George, “China to Lift Ban on Facebook – But Only Within Shanghai Free-Trade Zone”, South China Morning Post, September 24, 2013, http://www.scmp.com/news/china/article/1316598/exclusive-china-lift-ban-facebook-only-within-shanghai-free-trade-zone.
84
Цифры из отчета Facebook за август 2016 года – http://newsroom.fb.com/company-info.
85
Я посещал одного из своих бывших студентов, ставшего одним из первых специалистов по обработке и анализу данных компании.
86
В разных странах удостоверением личности могут служить разные документы. Сегодня в США водительские права есть примерно у половины восемнадцатилетних, и это резкое падение по сравнению с ситуацией десятилетней давности, когда они были у двух третей их тогдашних сверстников. См. Halsey, Ashley III, “Fewer Teens Get Driver’s Licenses”, Washington Post, July 31, 2013, http://www.washingtonpost.com/local/trafficandcommuting/fewer-teens-get-drivers-licenses/2013/07/31/60a32aae-f9c7–11e2-a369-d1954abcb7e3_story.html. В 2012 году паспорт был у трети граждан США, а в 1989-м – у ничтожных трех процентов. См. Bender, Andrew, “Record Number of Americans Now Hold Passport”, Forbes, January 30, 2012, http://www.forbes.com/sites/andrewbender/2012/01/30/record-number-of-americans-now-hold-passports.
87
Возможно, Facebook выбрала возраст 13 лет, чтобы компании было проще соответствовать требованиям Закона о защите конфиденциальности детей в интернете (COPPA) 1998 года, требующего, чтобы коммерческие сайты, предназначенные для лиц младше тринадцати, получали согласие их родителей или опекунов на сбор личных данных. См. https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule.
88
Газета «Нью-Йорк Таймс» пишет, что эта карикатура, опубликованная 5 июля 1993 года, вопроизводилась в других СМИ больше, чем любая другая за всю историю существования журнала. См. Fleishman, Glenn, “Cartoon Captures Spirit of the Internet”, New York Times, December 14, 2000, http://www.nytimes.com/2000/12/14/technology/cartoon-captures-spirit-of-the-internet.html.
89
Суини провела этот эксперимент, будучи студенткой магистратуры МТИ. Сейчас она преподает государственное управление и технологии в Гарвардском университете и является директором его Лаборатории защиты информации
90
Ohm, Paul, “Broken Promises of Privacy: Responding to the Surprising Failure of Ano-nymization”, UCLA Law Review 57, no. 6 (August 2010), p. 1720, http://www.uclalawreview. org/broken-promises-of-privacy-responding-to-the-surprising-failure-of-anonymization-2.
91
Sweeney, Latanya, Uniqueness of Simple Demographics in the U. S. Population, Laboratory for International Data Privacy working paper LIDAP-WP4–2000, http://dataprivacylab.org/projects/identifiability/index.html.
92
Golle, Philippe, “Revisiting the Uniqueness of Simple Demographics in the U. S. Population”, Proceedings of the 5th ACM Workshop on Privacy in the Electronic Society (New York: Association for Computing Machinery, 2006), pp. 77–80, http://dl.acm.org/citation. cfm?id=1179615.
93
US Post Office FAQ, http://faq.usps.com. Если бы были присвоены все 90 000 возможных номеров (10000–99999), процент возможности точной идентификации людей был бы еще выше. Другая причина невозможности более высокого процента возможности точной идентификации состоит в неравномерном распределении населения США по почтовым индексам.
94
Barbaro, Michael, and Tom Zeller, Jr., “A Face Is Exposed for AOL Searcher No. 4417749”, New York Times, August 9, 2006, http://www.nytimes.com/2006/08/09/technology /09aol.html.
95
Singel, Ryan, “Netflix Spilled Your Brokeback Mountain Secret, Lawsuit Claims”, Wired, December 17, 2009, http://www.wired.com/2009/12/netflix-privacy-lawsuit.
96
Narayan, Arvind, and Vitaly Shmatikov, “Robust De-Anonymization of Large Sparse Datasets”, paper presented at the 2008 IEEE Symposium on Security and Privacy, Oakland, CA, May 18–21, 2008, pp. 111–125, http://dl.acm.org/citation.cfm?id=1398064.
97
Судя по Google Trends, “большие данные” не были на слуху у общественности до 2011 года.
98
Что касается темы самоубийства, метаанализ, проведенный учеными Оксфордского университета, показал, что «существенно более половины (59 процентов) опрошенных молодых людей сказали, что вели поик в интернете по слову ‘самоубийство’». См. Daine, Kate, Keith Hawton, Vinod Singaravelu, Anne Stewart, Sue Simkin, and Paul Montgomery, “The Power of the Web: A Systematic Review of Studies of the Influence of the Internet on Self-Harm and Suicide in Young People”, PLoS One 8, no. 10 (October 30, 2013), http://journals.plos.org/plosone/article?id=10.1371/journal. pone.0077555.
99
Эту цифру назвал сержант Калифонийской дорожной полиции Кевин Бриггс, выступая с рассказом о патрулировании моста Золотые Ворота на TED Talk. См. Briggs, Kevin, “The Bridge Between Suicide and Life”, TED Talk, March 21, 2014, https://www.ted.com/talks/kevin _briggs_the_bridge_between_suicide_and_life.
100
Вы можете сделать это на своей страничке “My Amazon”: https://www.amazon.com/gp/yourstore /iyr.
101
Facebook называет это «удалением», но эта информация не удаляется насовсем. Происходит это потому, что найти и вычистить все случаи ее появления на серверах значительно дороже, чем сохранять их, изменив способ пользования. Кроме того, в главе 3 мы убедимся, что Facebook постоянно экспериментирует, чтобы усовершенствовать взаимодействие с пользователями и повысить их активность. В одном из исследований рассматривалась самоцензура – случаи, когда люди начинали писать апдейты и комментарии, но в конечном итоге решали не публиковать их. Отмененные апдейты и комментарии нельзя удалить, поскольку их не публиковали, и тем не менее в Facebook изучают их контекст – всевозможные «как и где». См. Das, Sauvik, and Adam Kramer, “Self-Censorship on Facebook”, Proceedings of the 7th International AAAI Conference on Weblogs and Social Media, Cambridge, MA, July 8–11, 2013 (Palo Alto: AAAI Press, 2013), https://www.aaai.org/ocs/index.php/ICWSM/ICWSM13/paper/viewFile/6093/6350.
102
Bachrach, Yoram, Michal Kosinski, Thore Graepel, Pushmeet Kohli and David Stillwell, “Personality and Patterns of Facebook Usage”, Proceedings of the 4th Annual ACM Conference on Web Sciences, Evanston, IL, June 22–24, 2012 (New York: Association for Computing Machinery, 2012), pp. 24–32, http://dl.acm.org/citation.cfm?id=2380722.
103
Kosinski, Michal, David J. Stillwell and Thore Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, Proceedings of the National Academy of Sciences USA 110, no. 15 (April 9, 2013), p. 5802, http://www.pnas.org/content/early/2013/03/06/1218772110. Одна из трудностей, возникающих при оценке состоятельности подобных научных трудов, вызвана статистикой свойств личности. Так, если модель построена исходя из предпосылки гетеросексуальной ориентации 100 процентов анализируемых мужчин, она будет точной в 90 процентов случаев, поскольку примерно 10 процентов пользователей мужского пола указывают на наличие у себя «интереса к мужчинам». Тем не менее, выводы исследования на основе приложения YouAreWhatYouLike представляют интерес, особенно в силу того, что такие индивидуальные особенности, как, например, уровень интеллектуального развития, выявляются другими методами.
104
Хип-хоп-группа. – Ред.
105
Kosinski, Stillwell, and Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, p. 5804.
106
Для доступа к лайкам в Facebook исследователи использовали программный интерфейс приложения (API); им было труднее идентифицировать тех, кто использовал настройки приватности для ограничения доступа к своим лайкам, даже несмотря на их согласие участвовать в оценке индивидуальных особенностей. См. http://applymagicsauce.com. В интервью Косински говорил: «Это может приносить огромную пользу в деле подбора персонала»; Adams, Stephen, “‘Like’ Curly Fries on Facebook? Then You’re Clever”, Telegraph, March 12, 2013, http://www.telegraph.co.uk/technology/news/9923070/Like-curly-fries-on-Facebook-Then-youre-clever.html.
107
Simonite, Tom, “Facebook’s New AI Research Group Reports a Major Improvement in Face-Processing Software”, MIT Technology Review, March 17, 2014, http://www.technologyreview.com/news/525586/facebook-creates-software-that-matches-faces-almost-as-well-as-you-do; Taigman, Yaniv, Ming Yang, Marc’Aurelio Ranzato, and Lior Wolf, “DeepFace: Closing the Gap to Human-Level Performance in Face Verification”, paper presented at the IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, June 24–27, 2014, pp. 1701–1708, https://www.cs.toronto.edu/~ranzato/publications/taigman_cvpr14.pdf.
108
Синтия использует этот пример в своей лекции под названием «Я – в базе данных (Но никто об этом не знает)»; I’m in the Database (But Nobody Knows), Dean’s Lecture, University of California – Berkeley School of Information, February 4, 2015, http://www.ischool.berkeley.edu/newsandevents/events/deanslectures/20150204.
109
Формат паспортов стран был стандартизирован лишь вскоре после Первой мировой войны, но сама идея государственного документа, удостоверяющего личность путешественника, значительно старше – слово «паспорт» появилось в английском языке около 1540 года. См. Benedictus, Leo, “A Brief History of the Passport: From a Royal Letter to a Microchip”, Guardian, November 17, 2006, http://www.theguardian.com/travel/2006/nov/17/travelnews.
110
Подлинность чеков требовалось удостоверить – на ранних этапах это делалось путем сличения подписи на чеке с оригиналом из банковского досье. См. Quinn, Stephen, and William Roberds, “The Evolution of the Check as a Means of Payment: A Historical Survey”, Economic Review 93, no. 4 (December 2008), https://www.frbatlanta.org/-/media/Documents/research/publications/economic-review/2008/vol93no4_quinn_roberds.pdf.
111
Цитируется по: Leber, Jessica, “Forget Passwords: This Startup Wants to Authenticate Your Mind”, Fast Company Exist, July 24, 2014, http://www.fastcoexist.com/3033383/forget-passwords-this-startup-wants-to-authenticate-your-mind.
112
O’Hear, Steve, “Pre-Crime Startup BioCatch Authenticates Users via Touch and Your Phone’s Accelerometer”, TechCrunch, July 7, 2015, http://techcrunch.com/2015/07/07/pre-crime-startup-biocatch-authenticates-users-via-touch-and-your-phones-accelerometer.
113
Рост моторных навыков ребенка останавливается примерно в тринадцатилетнем возрасте (беседа автора с Лэйном Меррифилдом – генеральным директором FreshGrade и сооснователем Club Penguin, 21 января 2016 года). После приобретения Club Penguin компанией Disney в 2007 году Лэйн стал исполнительным вице-президентом интернет-подразделения этой медийной компании, а сейчас занимается над образовательным технологическим стартапом FreshGrade.
114
Цикл из 85 статей в поддержку ратификации Конституции США, печатавшихся с октября 1787 года по август 1788-го в нью-йоркских газетах The Independent Journal и The New York Packet. – Ред.
115
О первых попытках компьютерного анализа словесных моделей в статьях см. Mosteller, Frederick, and David Wallace, Inference and Disputed Authorship: The Federalist (Reading, MA: Addison-Wesley, 1964).
116
Anonymous, “Silly Novels by Lady Novelists”, Westminster Review, new series, vol. 10 (October 1856), p. 442.
117
Wilkes, Geoff, “Afterword”, in Alone in Berlin [Английское название романа Jeder stirbt für sich allein (“Каждый умирает в одиночку”)] (London: Penguin, 2009), pp. 578–579.
118
Фаллада не только совершил попытку самоубийства, что само по себе было сочтено постыдным, он договорился о совместном самоубийстве с другим человеком, которого ему удалось тем самым погубить. См. Oltermann, Philip, “The Cow, the Shoe, Then You”, London Review of Books 34, no. 5 (March 8, 2012), p. 27.
119
Основополагающая научная работа по этой теме – Friedman, Eric J., and Paul Resnick, “The Social Cost of Cheap Pseudonyms”, Journal of Economics and Management Strategy 10, no. 2 (Summer 2001), pp. 173–199, http://onlinelibrary.wiley.com/doi/10.1111 /j.1430–9134.2001.00173.x/abstract.
120
В Amazon обсуждались три варианта: практически анонимные отзывы, когда создать новое имя пользователя не составляет никакого труда; отслеживаемые отзывы под псевдонимом, когда пользователь может выбрать любое имя, но оно будет привязано к его эккаунту, удостоверенному действующей кредитной картой; или отзывы под настоящим именем, привязанным к дейстующей кредитной карте, но с возможностью использования первого инициала автора вместо имени в случае, если он не хочет показывать свой пол.
121
Rubin, Ben Fox, “Amazon Looks to Improve Customer-Reviews System with Machine Learning”, CNet, June 19, 2015, http://www.cnet.com/news/amazon-updates-customer-reviews-with-new-machine-learning-platform.
122
Rubin, Ben Fox, “Amazon Sues Alleged Reviews-for-Pay Sites”, CNet, April 9, 2015, http://www.cnet.com/news/amazon-sues-alleged-reviews-for-pay-sites. Оказалось, что некоторые компании отправляли заказной почтой пустую коробку или конверт, чтобы получить статус «Подтвержденной покупки».
123
Rudder, Christian, “How Your Race Affects the Messages You Get”, OkTrends blog, October 5, 2009, http://blog.okcupid.com/index.php/your-race-affects-whether-people-write-you-back; and “Race and Attraction, 2009–2014”, OkTrends blog, September 10, 2014, http://blog.okcupid.com/index.php/race-attraction-2009-2014. Еще больше интересных подробностей для тех, кто знакомится шаблонным образом, содержится в книге Руддера Dataclysm: Who We Are (When We Think No One’s Looking) (New York: Crown, 2014).
124
Занимаясь стартапом музыкальных рекомендаций MoodLogic, я часто говорил, что упускать из поля зрения функцию “skip” («пропустить») – ужасная ошибка: негативная обратная связь от пользователя, пропускающего трек, была невероятно полезна для совершенствования алгоритма рекомендаций. Равным образом, как и длинный клик, когда слушают трек целиком, хотя в этом случае уровень интереса нуждался в интерпретации на более длительной основе, исходя из количества повторных прослушиваний и оценок.
125
Nisbett, Richard E., and Timothy D. Wilson, “Telling More Than We Can Know: Verbal Reports on Mental Processes”, Psychological Review 84, no. 3 (March1977), pp. 231–259, http://psycnet.apa.org/psycinfo/1978–00295-001.
126
На эту удивительную гистограмму с пиком в возрасте 29 лет и провалом в 30 я впервые обратил внимание, работая с сайтом Gay.com. (Людей в возрасте 28 лет было значительно меньше, чем в возрасте 29, но больше, чем 30-летних). С той поры я видел ее на нескольких других сайтах, в том числе на китайском сайте знакомств Baihe, стоимость которого оценивалась в 2015 году в 250 миллионов долларов. Сфера знакомств в Китае невероятно чувствительна к возрасту, и при написании алгоритмов подбора пар пользователей следует учитывать жесткие рамки. См. Hufford, Austen, “Chinese Dating Site Jiayuan Agrees to Be Bought by Baihe”, Wall Street Journal, December 7, 2015, http://www.wsj.com/articles/chinese-dating-site-jiayuan-agrees-to-be-bought-by-baihe-1449501088.
127
Я был членом совета директоров Skout с 2007 по 2012 год. В июне 2016 года компанию приобрела MeetMe. См. Yeung, Ken, “MeetMe Acquires Mobile Flirting App Skout for $55 Million in Cash and Stock”, VentureBeat, June 27, 2016, http://venturebeat.com/2016/06/27/meetme-acquires-mobile-flirting-app-skout-for-55-million-in-cash-and-stock.
128
Brin, David, “Questions I Am Frequently Asked About (Part V): Transparency, Privacy and the Information Age”, Contrary Brin, April 10, 2013, http://davidbrin.blogspot.co.uk/2013/04/questions-i-am-frequently-asked-about.html. Reprinted with permission of the author.
129
“The Man Who Sued Google to Be Forgotten”, Reuters, May 30, 2014, http://www.newsweek.com/man-who-sued-google-be-forgotten-252854.
130
По состоянию на август 2016 года Google получила 520 000 запросов на удаление, что соответствовало 1,6 миллионам URL-адресов. See Google, “Transparency Report: European Privacy in Search”, August 8, 2016, https://www.google.com/transparencyreport/removals/europeprivacy.
131
Эти запросы – из числа двадцати трех, особо выделенных Google как имеющих очевидную причину для удовлетворения или отказа. См. Google, “Transparency Report: European Privacy in Search”, August 1, 2016, http://www.google.com/transparencyreport/removals/europeprivacy.
132
Хотя ведущим философом того времени был Иммануил Кант, теорию «свободы, основанной на самостоятельности, воле и личности человека» в германском праве развивал (под влиянием Канта) Фридрих Карл фон Савиньи. См. See Eberle, Edward J., “The German Idea of Freedom”, Oregon Review of International Law 10, no. 1 (2008), p. 16, http://docs.rwu.edu/law_fac_fs/56/.
133
Bloustein, Edward J., “Privacy as an Aspect of Human Dignity: An Answer to Dean Prosser”, New York University Law Review 39, no. 962 (December 1964), pр. 962–1007, http://heinonline.org/HOL/LandingPage?collection=journals&handle=hein.journals/nylr39&div=71