Книги, которые помогут изучить основы анализа данных и стать специалистом в данной области.

За последние несколько лет я прочел существенное количество книг об анализе данных и выделил семь, на мой взгляд, лучших из них. Вместе данные книги являются основой изучения анализа данных. В них вы найдете все, что вам необходимо знать.

Несмотря на то, что все они доставляют удовольствие при прочтении, ни одна из них не является книгой легкого чтения. Так что если вы решили начать с этих книг, то выделите под это немного времени и сил. Оно того стоит! Если вы совместите данные знания с бесплатным практическим курсом по анализу данных, о котором я писал ранее, то этого будет вполне достаточно, чтобы получить начальный уровень знаний специалиста по обработке данных. (На мой взгляд, по крайней мере.)

Примечание: вы могли заметить, что я включил в список 4 книги O’Reilly, если вам это кажется подозрительным, то могу вас заверить, что я никак не связан с данным издательством. Просто я, правда, считаю их очень полезными.

lean-analytics

Первая для прочтения книга содержит основы бизнес-мышления о том, как использовать данные. Книга рассказывает о стартапах, но я считаю, что это больше, чем просто книга о стартапах. Вы изучите, почему важно фокусироваться на одной ключевой метрике, а также узнаете о 6 основных видах онлайн-бизнеса и стратегиях работы с данными в каждом из них.

business value

Если “Lean Analytics” – это книга о бизнесе и данных для стартапов, то данная книга о бизнесе и данных для больших компаний. Звучит менее красиво, чем первая, но всегда есть шанс получить ценные знания от крупных компаний. Например, как страховые компании используют прогнозную аналитику или с какими вопросами, касающихся данных, сталкиваются банки.

naked statistics

Я постоянно рекламирую эту книгу на своих каналах. Она предназначена не только для специалистов по обработке данных, в ней содержатся основы статистического анализа с которыми, я считаю, должен ознакомиться каждый. Книга содержит большое количество историй, читая которые, вы узнаете, как не быть обманутым заголовками, наподобие “Как мы ускорили курс обмена валют на 1300%, изменив только одно слово” и т.п.

doing_data_science

Последняя книга, прежде чем мы перейдем к действительно технической литературе. Данная книга поднимает уровень знаний, полученный из первых трёх книг, на новый уровень. В ней происходит углубленное изучение таких тем, как регрессионные модели, фильтрация спама, рекомендательные машины и даже big data.

data-science-at-the-command-line

Другая вещь, которую я постоянно рекламирую, это изучение основ программирования. Со знанием основ программирования, вам будет проще получать, очищать, преобразовывать и анализировать данные. Эта книга расширит ваши возможности в области анализа данных. И когда вы решите начать, я рекомендую начать с данной книги. Так как это единственная книга, содержащая информацию об анализе данных и командной строки, которую я видел. Однако, одной бывает более чем достаточно, чтобы покрыть все.

python for data analysis

Вторым языком программирования для изучения анализа данных является Питон. Он не слишком сложный и широко применяется. В Питоне вы можете делать практически все, что связано с анализом, прогнозированием и даже машинным обучением. Это тяжелая книга (более чем 400 страниц), но она охватывает все, что связанно с Питоном.

i heart logs

Последняя книга данного списка содержит всего 60 страниц, но она очень техническая. Эта книга даст вам хорошее представление о технической стороне сбора и обработки данных. Вероятнее всего, вы, как аналитик или специалист по обработке данных, не будете использовать эти знания напрямую, но, по крайней мере, будете знать, с какими данными работают специалисты по инфраструктуре различных компаний.

Вот и все!

Как я уже говорил, если вы будете придерживаться этого списка, то совместите его с бесплатным практическим курсом по анализу данных, и тогда у вас будут крепкие знания в области анализа данных.

Вы пропустили

AEGIS Algorithms Android Angular Apache Airflow Apache Druid Apache Flink Apache Spark API API Canvas AppSec Architecture Artificial Intelligence Astro Authentication Authorization AutoGPT AWS AWS Aurora AWS Boto3 AWS EC2 AWS Lambda Azure Babylon.js Backend bash Beautiful Soup Bento UI Big Data Binary Tree Browser API Bun Career Cassandra Charts ChatGPT Chrome Extension Clean Code CLI ClickHouse Coding Codux Combine Compose Computer Context Fusion Copilot Cosmo Route CProgramming cron Cryptography CSS CTF Cypress DALL-E Data Analysis Data science Database dbt dbt Cloud deno Design Design Patterns Detekt Development Distributed Systems Django Docker Docker Hub Drizzle DRY DuckDB Express FastAPI Flask Flutter For Beginners Front End Development Game Development GCN GCP Geospatial Git GitHub Actions GitHub Pages Gitlab GMS GoFr Golang Google Google Sheets Google Wire GPT-3 GPT3 Gradio Gradle Grafana Graphic Design GraphQL gRPC Guidance HMS Hotwire HTML Huawei HuggingFace IndexedDB InfoSec Interview iOS Jackknife Java JavaScript Jetpack Compose JSON Kafka Kotlin Kubernetes LangChain Laravel Linux LlaMA LLM localStorage Logging Machine Learning Magento Math Mermaid Micro Frontends Mobile Mobile App Development mondayDB MongoDB Mongoose MySQL Naming NestJS NET NetMock Networks NextJS NLP Node.js Nodejs NoSQL NPM OOP OpenAI OTP Pandas PDF PHP Playwright Plotly Polars PostgreSQL Prefect Productivity Programming Prometheus Puppeteer Pushover Python Pytorch Quarkus Rabbitmq RAG Ramda Raspberry Pi React React Native Reactor Redis REST API Revolut Riverpod RProgramming Ruby Ruby on Rails Rust Scalene SCDB ScyllaDB Selenium Servers Sklearn SLO SnowFlake Snowkase Software Architecture Software Development Solara Solid Spring Boot SQL SQLite Streamlit SudoLang Supabase Swift SwiftUI Tailwind CSS Taipy Terraform Testing Transformers TURN TypeScript Ubuntu UI Design Unix UX UX Design Vim Vite VSCode Vue Web Architecture Web Components Web Development Web Frameworks Web Scraping Web-разработка Webassembly Websocket Whisper Widgets WordPress YAML YouTube Zed Наука о данных Разное Тренды

Как исследовать и визуализировать данные МО для обнаружения объектов на изображениях