Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев…
Аннотация
Книга посвящена важности и доступности анализа данных в современном мире. Автор начинает с обсуждения своей мотивации к написанию, подчеркивая, что несмотря на распространенное мнение о том, что работа с данными является сложным занятием, эта область доступна не только экспертам в математике или информационных технологиях, но и представителям других профессий, таких как гуманитарии и менеджеры. Он делится своим опытом, отмечая, что сам начинал карьеру с анализа данных, и утверждает, что статистика и аналитика проникают во все сферы бизнеса и социально-экономических исследований.
Автор намерен объяснить читателям, как правильно строить модели для анализа гипотез и получения выводов. Основная часть книги будет сосредоточена на практическом применении методов анализа данных, которые читатели смогут сразу использовать в своей профессиональной деятельности. Автор также намерен осветить современные технологии, такие как машинное обучение и искусственный интеллект, подчеркивая их важность в контексте анализа данных и требований, предъявляемых современным рынком труда.
Книга будет полезна как для начинающих в аналитике, так и для тех, кто хочет углубить свои знания в этой области. Автор предлагает практические упражнения и рекомендации по освоению популярных программ для анализа данных, таких как Excel и PSPP. Это даст возможность читателям практиковаться на реальных данных, а также глубже понять темы, изложенные в книге. В завершение автор напоминает о доступности онлайн-курса на платформе UDEMY, который поможет дополнительно освоить изучаемые в книге навыки.
Далее книга исследует противоречие между интуитивным и аналитическим подходами к принятию бизнес-решений. Автор замечает, что многие руководители склонны полагаться на свою интуицию и личный опыт, что приводит к успеху в ряде случаев, однако подчеркивает, что такие примеры не исключают важность применения аналитических методов. Интуиция рассматривается как «свернутый опыт», и для ее эффективного использования необходимо вдумчиво работать с данными и выявлять ключевые взаимосвязи.
Аналитическая работа, по мнению автора, включает в себя сбор и упорядочивание данных с целью создания моделей реальности, которые помогают лучше понять процессы. В этом контексте обсуждаются инструменты для анализа данных, такие как Excel и SPSS, отмечая, что выбор программного обеспечения должен зависеть от личных предпочтений пользователя, а не от субъективного мнения о качестве программ. Важно также отметить, что эти программы работают в тандеме с человеческими способностями, дополняя их, но не заменяя.
Книга подчеркивает несколько ключевых аспектов, важных при работе с данными. Автор настаивает на необходимости интеграции интуитивного и аналитического мышления, а также на важности создания модели, которая предшествует анализу данных. Статистический анализ не только помогает выявить скрытые закономерности, но и превращает объемы данных в полезные знания. Кроме того, важным аспектом статистики является различие между описательной и аналитической статистикой, каждая из которых играет свою роль в интерпретации данных.
Введение в основные концепции статистического анализа показывает читателю, как важно понимать данные в нашей жизни, где они повсеместно присутствуют. Проблема не заключается в массовом сборе данных, а в умении выделить ценные сведения, способствующие принятию обоснованных решений. Описательная статистика позволяет нам просто описывать данные, тогда как аналитическая помогает установить взаимосвязи и выявить закономерности между переменными.
Ключевым понятием является различие между генеральной совокупностью и выборкой. Генеральная совокупность — это вся группа объектов, интересующих исследователя, а выборка — это ее часть, выбранная для анализа. Если создание данных невозможно из-за масштабов генеральной совокупности, правильный отбор выборки становится критически важным для получения точных выводов. Репрезентативная выборка создает основу для надежных результатов.
Обсуждаются также переменные, которые представляют собой характеристики наблюдаемых объектов. Каждое наблюдение можно охарактеризовать множеством переменных — от зарплаты и места жительства до личных привычек. Понимание переменных и их значения позволяет проводить анализ данных и сравнения, что немаловажно для статистического исследования. Важные методы формирования выборки, такие как случайный отбор, стратифицированные выборки и серийный отбор, помогают обеспечить, что выборка будет адекватно отражать генеральную совокупность.
Таким образом, книга не только вводит читателя в основные концепции и методы анализа данных, но и акцентирует внимание на важности их применения в современных условиях. Автор создает основу для понимания статистики как важного инструмента, используемого для извлечения информативных и полезных выводов из массовых данных.