Наиболее востребованные технические навыки для аналитиков данных

Какие технологические навыки ищут работодатели в аналитиках данных? Как они соотносятся с навыками, желаемыми для инженеров данных и ученых данных?

Я проанализировал онлайн списки вакансий с января 2020 года, чтобы найти ответы. В этой статье я поделюсь ответами и предложу предлагаемый путь обучения для начинающих аналитиков данных.

Это моя третья статья, в которой рассматриваются технические навыки на позициях с интенсивным использованием данных.

Без лишних слов, вот лучшие 10 технологий из списков вакансий аналитика данных по состоянию на январь 2020 года.

Роль аналитика данных

Аналитики данных превращают данные в информацию. Они играют жизненно важную роль, делая данные действенными для лиц, принимающих решения. ?

Аналитики данных часто берут данные, предоставленные инженерами данных, анализируют их и дают рекомендации. Они создают визуализации для отображения своих результатов в информационных панелях и презентациях. ?

В отличие от исследователей данных, аналитики данных обычно не создают прогностические модели, основанные на алгоритмах машинного обучения.

Вот расширенная диаграмма, показывающая 30 наиболее распространенных технологий.

Вот те же данные в табличной форме.

Многие другие ключевые слова технологии были найдены; это были 30 самых высоких результатов. Давайте посмотрим на самые распространенные технологии.

SQL — это сокращение от языка структурированных запросов. Он отображается в более чем половине всех списков. SQL используется для работы с реляционными базами данных. SQL поставляется во многих вариантах, включая MySQL, Oracle, SQL Server, PostgreSQL и SQLite. Каждая версия имеет большую часть одного и того же основного API. Есть качественные бесплатные предложения.

Excel почти так же распространен, как SQL. Это доминирующая программа электронных таблиц. Это часть пакета программных средств Microsoft Office 365 . Хотя он не может обрабатывать огромные объемы данных, такие как базы данных SQL, Excel отлично подходит для быстрого анализа. Google Sheets — это конкурент с бесплатной версией и схожими основными функциями.

Tableau появляется примерно в четверти списков. Это программное обеспечение для бизнес-аналитики, позволяющее легко создавать визуализации и информационные панели. Возможности визуализации в Tableau намного лучше, чем в Excel. У Tableau есть бесплатная публичная версия, но если вы хотите сохранить конфиденциальность данных, вам нужно выложить деньги.

Python появляется примерно в четверти списков. Это очень популярный бесплатный язык программирования с открытым исходным кодом для работы с данными, веб-сайтами и сценариями. Это основной язык для машинного обучения. ?

R также находится в более чем 20% списков. Это популярный бесплатный язык с открытым исходным кодом для статистики, особенно в научных кругах.

Сравнение с Data Engineer и Data Scientist

Общее количество списков составило 16 325 для Data Analyst , 12 013 для Data Engineer и 9 396 для Data Scientist. Таким образом, аналитические работы относительно распространены. ?

В приведенной ниже таблице показаны 10 наиболее распространенных технологий для списков аналитиков данных. Баллы за списки данных исследователей и инженеров данных также отображаются для каждого ключевого слова.

Несколько основных моментов:

  • SQL очень популярен для всех трех рабочих мест.
  • Excel более чем в четыре раза чаще встречается в списках аналитиков данных, чем списки ученых и инженеров данных.
  • Python, хотя он встречается примерно в четверти списков аналитиков данных, примерно в три раза более популярен в списках вакансий исследователей данных и инженеров данных.
  • R гораздо реже встречается на должностях аналитика данных и инженера данных, чем в списках работы ученого.
  • PowerPoint гораздо чаще встречается в списках аналитиков данных.

Что касается тенденций, мой анализ списков вакансий исследователей данных показал, что и R, и SAS имели большие падения популярности с 2018 по 2019 годы.

Стоит отметить, что в списках вакансий инженера данных было упомянуто гораздо больше технологий, чем в списках работы аналитика данных.

Совет

Если вы хотите стать аналитиком данных или стать более конкурентоспособным, я предлагаю вам изучить следующие технологии в порядке приоритета.

Учитесь Excel . Это быстрее, чем SQL. Я знал Excel по школе и по работе, но научился лучше, готовясь к сертификационному экзамену Microsoft Excel.

Выучи Табло. Tableau позволяет быстро создавать великолепные визуализации с помощью интерфейса перетаскивания.

Покажите, вы можете сделать презентацию PowerPoint . Есть много MOOC, которые обучают Microsoft PowerPoint.

Если вы продемонстрировали, что можете использовать вышеуказанные технологии для анализа и общения, вы должны быть достойным кандидатом на многие должности начального уровня. ?

Если вы знакомы с вышеперечисленными навыками и хотите освоить новые навыки или получить право на большее количество должностей, я предлагаю вам изучить Python . Python отлично подходит, если вы хотите перейти к проектированию данных и науке о данных. ?

Книга My Memorable Python предназначена для начинающих. Он доступен для Kindle и печатной копии с Amazon, а также в форме .epub и .pdf здесь .

Как найти себе специалистов по данным?

Как найти себе специалистов по данным

1. Подбирайте кадры в сильнейших университетах своей страны, а также в тех вузах, которые успели ввести у себя профильные программы.
2. Изучите состав интернет-сообществ, членов которых объединяет интерес к инструментам работы с данными. Хорошо начать с поклонников языков программирования R и Python.
3. Ищите специалистов по данным на LinkedIn — они почти все там, и вы сможете разобраться, если ли у них необходимые профессиональные навыки.
4. Посещайте конференции специалистов по данным и их неформальные мероприятия.
5. Дружите с венчурными капиталистами, которые за последний год наверняка получили самые разные предложения, связанные с «большими данными».
6. Проводите на специальных сайтах конкурсы вроде соревнований по спортивному программированию, которые устраивают компании Kaggle или Top Coder. Охотьтесь за участниками с самым высоким творческим потенциалом.
7. Если претендент не умеет программировать, отказывайте ему сразу. Необязательно, чтобы человек был специалистом мирового уровня, но хотя бы на «тройку» он справляться должен. К тому же убедитесь, что кандидат может быстро осваивать новые технологии и методики.
8. Удостоверьтесь, что претендент способен увидеть в наборе данных «сюжет» и связно объяснить основную идею, подсказанную данными. Проверьте, насколько он «чувствует» числа и может ли он изложить то, что они говорят, общедоступным языком — визуально или вербально.
9. Подумайте, не слишком ли кандидат далек от мира бизнеса. Плохо, если ему трудно ответить на вопрос, как его работа могла бы помочь вам в решении менеджерских проблем.
10. Спрашивайте соискателей об их любимых идеях и методах анализа, о том, как они совершенствуют свое мастерство. Может, они получили сертификат о прохождении курса обучения в Стэнфорде — онлайнового Machine Learning course или создали онлайновый архив программ, чтобы делиться с другими (скажем, на GitHub)?

Специалисты по аналитике

Специалисты по аналитике

По-настоящему хороший аналитик должен будоражить людей… Я знаю, что я первый получаю данные, а значит, я первый узнаю историю. Открывать что-то новое увлекательно.
Дэн Мюррей

Человеческий фактор – важный компонент компании с управлением на основе данных. Кто такие специалисты по аналитике и как должна быть организована их работа?
Эта статья посвящена специалистам по аналитике: разным их типам и навыкам, которыми они должны обладать. Мы рассмотрим самые разные позиции и познакомимся с людьми, которые их занимают. Кроме того, мы обсудим плюсы и минусы разных организационных структур для выполнения аналитической работы.
Continue reading