Роман с Data Science. Как монетизировать большие данные

Роман с Data Science. Как монетизировать большие данные

Дата публикации: 2021
Аннотация
Книга, из которой взяты эти отрывки, охватывает важные аспекты работы с данными, особенно в контексте анализа данных и принятия решений на основе статистики, возникшей в результате пандемии COVID-19. Основной акцент делается на выявлении причин неточностей в статистике, которая обеспечивалась различными факторами, как объективными, так и субъективными. **Ошибки в статистике COVID-19** Первый отрывок описывает, как различные аспекты могут повлиять на точность данных по заражениям COVID-19. Автор поясняет, что статистика может быть искаженной из-за погрешностей в сборе данных, различий в методах тестирования, а также человеческого фактора. Такие искажения важны для понимания реальности происходящего и требуют от аналитиков умения правильно интерпретировать информацию. Один из методов, упомянутых в отношении исправления ошибок, — это использование аналитических подходов для интерпретации чисел с учетом всех искажений. Автор предостерегает от опасности «аналитического паралича», когда слишком долгое и тщательное рассмотрение данных приводит к задержкам в принятии решений. Он подчеркивает важность быстрого реагирования и качественных решений, указывая на потенциальные ошибки, которые могут возникать из-за поспешных действий. Здесь приводится пример философии работы Джеффа Безоса, основателя Amazon, который подчеркивал важность принятия решений в духе "Дня 1", где акцент делается на внимательном отслеживании внешних трендов и скорости принятия решений. **Анализ данных и его методы** Во втором отрывке автор делится своими размышлениями о методах анализа данных, ссылаясь на свою встречу с известным аналитиком Ди Джеем Патилом. Он упоминает книгу «Building Data Science Teams», в которой рассматриваются ключевые принципы построения команды, занимающейся наукой о данных и основанной на анализе данных. Тут автор вводит понятия, разделяющие артефакты анализа данных на бизнес-анализ, машинное обучение и инженерию данных. Бизнес-анализ данных представлен как способ преобразования грубой транзакционной информации в понятный и доступный формат для коммерческих анализов. Важными темами становятся инсайты, гипотезы и процесс их проверки. Автор объясняет, как гипотезы могут формироваться и проверяться через методы, такие как А/Б-тесты, что позволяет оценивать изменения на бизнес-метрики, такие как конверсия на сайте. **Практический пример** В завершении отрывка автор приводит собственный практический пример, в котором он проводит расследование, связанное с работой сервиса рекомендаций для интернет-магазина. Этот пример служит демонстрацией процесса проверки гипотез и анализа проблем, с которыми сталкиваются аналитики данных. Автор акцентирует внимание на том, что умение связывать практическое применение аналитики и принятие решений на ее основе жизненно важно для успеха бизнеса. Таким образом, книга подчеркивает значимость качественного анализа данных, баланса между скоростью принятия решений и их обоснованностью, а также важность создания соответствующей культуры в компаниях, основанной на стремлении к анализу и быстрой адаптации.