Аннотация
Книга, предисловие к которой исследует науку о данных, начинается с описания ее основной цели — улучшения процессов принятия решений через использование анализа больших объемов данных. В современном мире наука о данных проникает в различные сферы жизни, начиная от рекламы и рекомендаций продуктов, заканчивая такими важными аспектами, как управление светофорами и анализ криминальной статистики. Описываются ключевые факторы, способствующие росту этой области, включая стремительное развитие технологий и огромные объемы данных, которые ежедневно генерируются.
Основные элементы науки о данных, представленные в книге, включают различные этапы проектов, фундаментальные концепции, а также инфраструктуру данных и машинное обучение. Автор обращает внимание на то, как данные могут быть использованы для решения реальных задач, подчеркивая важность их структурирования и анализа. Кроме того, рассматриваются этические вопросы, касающиеся сбора и использования данных, и последние изменения в законодательстве, регулирующем эту сферу.
Книга также затрагивает те сферы, в которых наука о данных, вероятно, окажет наибольшее влияние в будущем. Это может быть связано с новыми технологиями, которые требуют инновационных подходов к анализу и интерпретации данных.
В благодарностях авторов выделяются их семьи и друзья, чья поддержка оказалась жизненно важной в процессе написания книги. Особое внимание уделяется отцу одного из авторов, Джону Бернарду Келлехеру, который оказал значительное влияние на его жизнь, а также благодарности, выраженной другим героям — Брендану Грейсу, Дэниелу и Элеоноре, за содействие в сочетании работы и путешествий.
Далее отрывок описывает эволюцию науки о данных от древних времен до современности. Этот процесс начинается с простых методов записи информации, таких как зарубки на деревянных столбах, и первых форм письменности. Постепенно переходя к более сложным системам, книга охватывает появление реляционных баз данных и хранилищ данных.
Важное внимание уделяется современному состоянию данных, когда объем информации и ее разнообразие достигли неслыханных масштабов. Социальные сети, блоги, видео и онлайн-покупки создают огромные массивы данных, которые могут быть использованы для глубокого анализа и принятия информированных решений. Однако с этим возрастает необходимость структурирования «больших данных» и применения таких родов баз, как NoSQL, которые хранят данные в виде объектов. Это открывает новые горизонты для научного анализа, но одновременно создает сложности в правильном управлении и интерпретации полученной информации.
В заключение, книга охватывает основные технические инструменты и технологии, используемые в современной науке о данных, включая методы для хранения, сбора и анализа информации. Эти аспекты имеют ключевое значение для понимания и успешного освоения области, которая становится все более актуальной в нашем быстро меняющемся мире.