Сети города. Люди. Технологии. Власти - стр. 30
В случае больших массивов данных, например подробных карт или переписей населения, новые исследования проводятся редко (раз в десять лет, если говорить о переписях) и могут быть опубликованы через полтора-два года после сбора данных, а иногда и позднее. В конкретных областях, таких как изучение дорожного движения или общественного транспорта, исследования проводятся раз в несколько лет на основе ограниченной пространственно-временной выборки. Лишь немногие массивы данных публикуются ежемесячно (как, например, информация об уровне безработицы) или ежеквартально (как, например, отчеты о ВВП), бóльшая часть данных обновляется раз в год, так как их сбор требует значительных усилий. Как правило, эти данные недостаточно подробны, охватывают лишь крупные регионы или страну в целом и имеют низкие возможности разукрупнения (например, разбивки по классам населения или секторам экономики). Когда сбор данных осуществляется чаще, например при спутниковой съемке, муниципальные власти из‐за лицензионных расходов приобретают лишь отдельные снимки. В других случаях, таких как потребительские покупки (отчеты о которых можно получить, анализируя транзакции по кредитным картам), данные в основном хранятся в зашифрованном виде в финансовых учреждениях. Другими словами, хотя с 1980‐х по 2000‐е годы муниципальным администрациям и представителям правительственных структур был доступен определенный спектр цифровых данных о городе, а вместе с ним и все более современное программное обеспечение (например, GIS) для их обработки, источники данных были ограничены в пространстве, времени и областях применения.
Таблица 1. Сравнение понятий «малые» и «большие» данные[110]
После 2000 года ландшафт городских данных изменился, произошли значительные трансформации как в природе данных, так и в способах их производства, а именно – переход от малых к большим данным. Это означает, что производство данных становится непрерывным, обеспечивает полное покрытие в рамках одной системы, характеризуется высоким разрешением, связностью и подвижностью (см. таблицу 1) и охватывает различные сферы[111]. Ситуация относительного недостатка данных сменяется их переизбытком. Это в первую очередь относится к оперативным городским данным, поскольку традиционная инфраструктура города, включая транспорт (шоссе, железные дороги, автобусные маршруты, а также транспортные средства) и коммунальные службы (электроэнергия, вода, свет), превратилась в цифровую сеть, снабженную системами встроенных датчиков, механизмов управления, сканирующих устройств, приемоответчиков, камер, счетчиков и систем GPS, производящих непрерывный поток данных о состоянии и использовании инфраструктуры (и образующих интернет-вещей). Многие из этих систем производят персонифицированные данные, отслеживая проездные документы отдельных пассажиров, номерные знаки автомобилей, идентификаторы мобильных телефонов, лица и походку, автобусы/поезда/такси, показания счетчиков и т. п.