10 лучших видео на YouTube об анализе данных, которые вам стоит посмотреть, если вы решили начать его изучать или хотите продвинуться в этой сфере.
Образование и будущее. После просмотра топ 10 самых популярных видео, содержащих слова «анализ данных» и/или «аналитик данных» в названии, выставленные за последние 2 года, становится ясно, что на данный момент главные вопросы сводятся к следующим: «кто такой аналитик данных и как им стать» и «будущее анализа данных»
Скринкасты и записи конференций всё ещё являются самыми распространёнными способами связи с общественностью, в то время как очевидно отсутствие документальных фильмов, а обществом правит подавляющее количество развлекательного контента, который прорывается в круги более обширной аудитории, которая не интересуется технологиями. Средняя продолжительность видео нашего топа — около 65 минут, в то время как среднее количество просмотров — 160 001. Даже такое количество просмотров не может давать окончательную оценку популярности. Согласно исследованиям, в 2015 году среднее количество просмотров видео на YouTube о Науке и технологиях было 6 638, в то время как Образовательная категория набирала 4 872 просмотров.
1. Введение в анализ данных с R — анализ данных. Часть 1 — (566 тыс. просмотров)
Дэвид Лангерб, руководитель отдела Бизнес-аналитики в Microsoft, предлагает серии коротких, но подробных видеоуроков об анализе данных, используя R (язык программирования — прим. переводчика) на примере «нестареющей» задачи от компании Kaggle — Titanic 101 (требуется завершить анализ того, у каких людей вероятность выжить при крушении Титаника была выше — прим. переводчика). С точки зрения общения с аудиторией, подача материала проста и эффективна: скринкаст с аудиосопровождением.
2. Методы Прогнозирования. Анализ данных с R — (168 тыс. просмотров)
Трёхчасовая лекция, предложенная нам каналом Simplilearn занимает второе место нашего «Топ 10», что впечатляет, учитывая что средняя длина топ 50-ти видео на YouTube — около 3-х минут. Этот урок — четвертая часть из серии лекций, предлагающих как практический подход с некими объяснениями, так и теоретическую часть, описывающую прогнозирование. Он охватывает основные типы моделей регрессии и некоторые их приложения через тематические исследования. Неторопливый темп скринкаста с озвучкой (иногда, правда, может показаться немного монотонным) отлично подойдет новичкам. Полный курс «Сертифицированной подготовки по анализу данных на языке R», выложенный каналом Simplilearn доступен по ссылке.
3. Руководство по анализу данных для начинающих — Часть 1. Что такое анализ данных? Инструменты анализа данных. Edureka — (150 тыс. просмотров)
Третье место занимает очередное руководство по анализу данных с использованием R, Apache Mahout и фреймворк Hadoop. Первая часть этой серии, выложенная каналом Edureka!, даёт основные понятия и введение в теоретическую часть анализа данных (что такое анализ данных, какие проблемы он пытается решить и какие у него перспективы), фреймворк Hadoop, R и машинное обучение с использованием Mahout и заканчивает более практическим подходом к теме. Самые просматриваемые видео по анализу данных на YouTube, как видите, не следуют «золотому правилу» длительности и это видео — не исключение, длится оно 2 часа 32 минуты и 55 секунд.
4. «Анализ данных: куда мы стремимся?» — Доктор ДиДжей Пэтил (Strata + Hadoop 2015) — (113 тыс. просмотров)
«Понимание данных имеет потенциал изменить всё, чем мы занимаемся, к лучшему» — Барак Обама
Речь доктора ДиДжей Пятила на конференции O’Reilly по Strata + Hadoop начинается с обращения Барака Обамы, поддерживающего развитие и использование анализа данных. Это первое видео в нашем с вами топе, которое обеспечивает нам более широкую картину понимания анализа данных, его культуру и возможные последствия, вместо руководства типа «как сделать то или иное?». Дискуссия очень заманчива, так как доктор Пэтил подчёркивает некоторые критические моменты, объясняя, как раскрыть весь потенциал анализа данных в бизнесе и обществе. Если вы заинтересованы в том, чтоб иметь более точное представление об этой теме, это видео определенно для вас!
5. Анализ данных — Часть 1 — Построение возможностей Прогнозного анализа — (128 тыс. просмотров)
Серийные видеолекции о «подходе к современной аналитике» для людей, у которых нет за спиной опыта работы с анализом данных. Лекция очень простая и понятная: 1 час и 52 минуты скринкастинга с аудиосопровождением. Это видео — краткий обзор моделей и методов, связанных с Бизнес аналитикой, Прогнозным анализом и технологиями Больших данных (наприм. Hadoop). Вам так же будет показан потенциал аналитики в контексте бизнеса. Презентация, присутствующая в видео, доступна по ссылке.
6. Как стать аналитиком данных — Анализ данных в Сан-Франциско — (74 тыс. просмотров)
Данное видео — запись презентации Райана Орбана из Zipfian Academy и Дэнниса О’Бриена из Idle Games под названием «Становясь аналитиком данных». Райан Орбан предлагает краткий обзор того, что же все-таки такое анализ данных, почему в нем нуждаются и какими тропами стоит идти, чтобы стать аналитиком данных (магистр/кандидат наук в области анализа данных, стажировки, самообразование и интересные программы), а так же о дисциплине, касающейся анализа данных. В своей презентации Дэннис О’Бриен рассказывает о том, каково это быть аналитиком данных в начинающем стартапе, излагая полученные им знания и свое понимание темы изнутри.
7. Анализ данных — Технический университет Эйндховена — (60 тыс. просмотров)
Впечатляющее представление своих новых факультетов в сфере анализа данных от Технического университета Эйндховена. Стиль подачи материала кинематографический с применением компьютерной графики, чтобы передать дух научно-фантастического кино, такого как Особое мнение и Начало, используя различные технологии, в том числе Oculus Rift и мульти-тач интерфейсы. По ссылкам вы найдете описания их программ бакалавриата и магистратуры.
8. Один день из жизни аналитика данных — (212 тыс. просмотров)
YouTube-канал RCRtv покажет нам один день из жизни аналитика данных, работающего в компании AT&T Foundry в Плейно, Техас. Видео представляет собой интервью со старшим аналитиком данных — Картиком Райагопаланом, который отвечает на такие вопросы, как: чем занимается аналитик данных, какое у него образование, как оставаться на передовой технологий, какими инструментами он пользуется и какие советы он может дать стремящемуся стать аналитиком данных.
9. Аналитик данных vs исследователь данных, их роль и задачи — (97 тыс. просмотров)
Скринкаст от канала Bigdata Simplified рассказывает нам о разнице между аналитиком данных и исследователем данных. Видео делает уклон на то, как генерируются данные, каково их значение и как «высвободить их силу». Напоследок вам расскажут о том, какими качествами должен обладать аналитик данных и что характерно для исследователя данных.
10. Будущее анализа данных — Анализ данных в Стэнфорде — (69 тыс. просмотров)
Доктор Эйан Эшли, профессор факультета Медицины и генетики при Стенфордском университете, доктор Вийаи Пандэ, профессор факультета Химии при Стенфордском университете, доктор Гектор Гарциа-Молина, профессор факультета Инженерии и Электро-инженерии при Стенфордском университете, и доктор Джон Хеннесси, ректор Стенфордского университета, все вместе около 26 минут проводят интереснейшую конференцию по анализу данных. Вопросы на которые они пытаются ответить: «насколько реальна эта новая дисциплина?», «какие возможности и препятствия она представляет?», «как Стенфорд может продвинуть анализ данных в исследованиях и образовании?».
Послесловие:
Недавно мне довелось пообщаться с людьми из разных стартапов, занимающихся анализом данных. Все они задаются вопросом, как достучаться до пользователей или же до бизнесменов, до венчурного капитала и так далее.
На этом этапе я выражу свою точку зрения в некоторых вопросах:
1. Можно ли говорить об анализе данных ссылаясь только на анализ данных? Топ 10 самых просматриваемых видео на YouTube уж точно не для технически-необразованной аудитории, а для тех, кто уже предостаточно знает об этой сфере. Так вот почему мы не строим дискуссии на более горячих темах, таких как политика, урбанизм, безопасность, здоровье, культура и приватность?
2. Вместо того чтобы концентрироваться на адаптации компаний из тех, что не берут во внимание данные в те, что берут, а следовательно и на найме аналитиков данных, почему бы нам не сконцентрироваться сначала на продвижении анализа данных в массы.
Я лично считаю, что общение в сфере анализа данных — это большая проблема. Ключевой оценкой масштабности должно быть количество технически-образованных людей, которые стремятся узнать побольше и развиваться в этой сфере. Анализ данных не должен быть Святым Граалем, но это безусловно то, что может изменить наш с вами мир.
Заключительный анализ:
Как следствие этих мыслей, я решил проанализировать текст метаданных первых 500 самых просматриваемых видео на YouTube, начиная с 2014 года, содержащие слова «анализ данных» и/или «аналитик данных» в названии. Как только я собрал все метаданные, я связал воедино все тэги, описания и названия. После, я использовал word2vec из Python-фреймворка genism.
Подавляющее большинство — 30725 слов — были связаны с «бизнесом» (работа, карьера, менеджмент, индустрия и т. д.), «образование» (университет, курсы, изучение, руководство, программирование и т. д.) и «методы и инструменты анализа данных» (машинное обучение, алгоритмы и т. д.). Такие слова как «будущее» и «общественность» заняли всего лишь 0,13% общего количества, а самые близкие по значению к «будущему» слова, опять-таки, связаны с «бизнесом» (работа, карьера, информация, продукт, директор). «Журнализм», «прогресс», «политика» и «психология» заняли меньше 0,016% в областях, где речь заходила об анализе данных. Эта тема даже не претендует на известность.
Вот что мы получили после этого простого анализа:
1. Анализ данных — это неизведанная тема. Только те, кто уже знает о ней, развиваются в этой сфере. Особенно с помощью руководств, уроков и ради достижения собственной образовательно цели. Другие — нет.
2. На данный момент анализ данных (с точки зрения средства связи) неразрывно связан с бизнесом/карьерой.
3. Существует очевидное отсутствие упоминаний об анализе данных в «популярных темах»
Биография автора: Марко Насуто — аналитик данных, авиа-космический инженер и кинорежиссер. Работает на данный момент в Дэнмарке.