Big data простым языком
1
По некоторым оценкам используется цифра 760,6 мегабайт для ХХ-хромосом и 735,9 мегабайт для XY-хромосом, или используется оценка в 400 мегабайт на один сперматозоид, что, в принципе, еще больше.
2
Горелов И.Н., Седов К.Ф. Основы психолингвистики. М., 2001. С. 105–106. Тер-Минасова С.Г. Язык и межкультурная коммуникация. М., 2000. С. 29–30.
3
Горелов И.Н., Седов К.Ф. Основы психолингвистики. М., 2001. С. 105–106. Тер-Минасова С.Г. Язык и межкультурная коммуникация. М., 2000. С. 29–30.
4
Ханс Геста Рослинг – шведский врач, академик, профессор Каролинского института по вопросам международного здравоохранения, специалист по статистике и всемирно известный лектор.
5
E-Gov – технологично-центрированная, реактивная среда предоставления государственных сервисов в электронном формате. Начальный этап развития цифрового государства, который измеряется процентом покрываемых существующих сервисов в электронном виде.
6
В соответствии с 152-ФЗ «О персональных данных».
7
В соответствии с 152-ФЗ «О персональных данных».
8
В соответствии с письмом ФНС РФ от 23.11.15 № 11-06/0733, поле «ИНН» стало обязательным реквизитом при подаче справки 2-НДФЛ.
9
Позднее размер штрафа предлагалось увеличить до пятисот рублей с одной записи, где нет обязательного атрибута ИНН.
10
Эти главы я писал под действием сильных психотропных препаратов, поэтому они могут показаться вам глубокими и сложными.
Но без них практически невозможно понять, о чем здесь написано.
11
What data for data-driven learning? Alex Boulton, 2011 Nottingham. https://files.eric.ed.gov/fulltext/ED544438.pdf
12
Согласно Wikipedia, кóрпус (в данном значении множественное число – кóрпусы, не корпусá) – подобранная и обработанная по определенным правилам совокупность текстов, используемых в качестве базы для исследования языка.
13
Согласно Wikipedia, это – статистическая модель, имитирующая работу процесса, похожего на марковский процесс с неизвестными параметрами, и задачей ставится разгадывание неизвестных параметров на основе наблюдаемых. Полученные параметры могут быть использованы в дальнейшем анализе, например, для распознавания образов.
14
Strength in Numbers: How Does Data-Driven Decisionmaking Affect Firm Performance?
15
Книга «Черный Лебедь. Под знаком непредсказуемости» Насим Таллеб.
16
Рекомендую посмотреть документальный фильм – АльфаГо.
17
Приобретена Google.
18
Оценка известного писателя-фантаста Вернона Винджу – 2030, а известного изобретателя и футуролога Реймонда Курцвейла – 2045.
19
Известный эксперт Малькольм Чисхолм (Malcolm Chrishom), который работает в области управления данными более 25 лет, подготовил и опубликовал концепцию жизненного цикла данных.
20
По версии DAMA Internation – независимая некоммерческая профессиональная организация, разрабатывающая стандарты по управлению данными DMBOK (Data Management Book of Knowledge).
21
Например, по модели Johnson и Scholes.