Топ-10 штатов и компаний в США, где выгодно работать в области анализа данных
- Анна Пантелеева
- 25 мая 2019 г.
- 4 мин. чтения
Обновлено: 5 февр. 2020 г.
Создатели онлайн-курса «Data Visualization and Communication with Tableau» внесли дополнительную интригу в курсовой проект, потому что стейкхолдеры анализа -- сами студенты и их коллеги в области анализа данных, которые хотели бы найти выгодную работу в США.
Цель проекта -- провести анализ зарплат в США по профессиям в области анализа данных, скорректировать результаты, учитывая уровень жизни в разных штатах Америки и построить дашборд, который бы помог соискателям найти направления для поиска самых выгодных рабочих мест.

Источники данных
Когда американская компания берет на работу иностранных технических специалистов, она подает заявление в американское правительство на получение грин-карты или рабочей визы для этого сотрудника. Собирая информацию из этих заявлений, правительство США отслеживает рабочие людские потоки и контролирует соблюдение равенства прав иммигрантов и граждан США. В заявлении помимо годового оклада указывается средняя зарплата на данной позиции сотрудника с аналогичными навыками и опытом работы, которая установлена в компании, и называется «доминирующая заработная плата» (the prevailing wage). Так, исходные данные общедоступны, были собраны Управлением по иностранным делам Министерства труда США:
167278 записей, включая заявления на визы H1-B и другие, а также визы на постоянное проживание
Период с 2008 по 2015 годы
Каждая запись содержит данные в 24 полях, с информацией о заявителе (месте проживания, образования, опыт работы), описание рабочей позиции (оклад и доминирующая зарплата, название позиции и категория), требуемая виза, компании и ее месте нахождения
Данные были предварительно очищены и подготовлены к анализу, путем добавления дополнительного поля с наименованием профессиональной подкатегории для упрощения анализа, приведения к общему годовому показателю по зарплатам и т.п.
Дополнительный источник данных был введен для проработки гипотезы о том, что разный уровень жизни в разных штатах США может сильно сказаться на конечном доходе соискателя.
Это набор данных от Бюро Экономического Анализа (агентство Министерства торговли США), содержащий коэффициенты регионального ценового паритета в каждом штате США, плюс Вашингтон и округ Колумбия. Например, если у штата региональный ценовой паритет равен 120,4, то жить в этом штате было бы примерно на 20,4% дороже, чем в среднем по стране. И наоборот, если другой штат имеет региональный ценовой паритет 91,5, то там стоимость жизни на 8,5% меньше, чем в среднем по стране. Поэтому величины заработных плат можно скорректировать на величину данного индекса, чтобы оценить реальный доход.
Метрики
Доминирующий уровень годовой зарплаты (prevailing wage per year)
Медианный годовой оклад (median paid wage per year)
Гипотезы
Сколько можно заработать на различных работах (профессиональных категориях), связанных с анализом данных?
Зависят ли эти зарплаты от типа визы?
Зависит ли заработная плата от места расположения офиса компании (по штатам)?
На позициях в области анализа данных выгодно работать только в тех штатах, в которых наибольшая концентрация IT компаний (таких как Калифорния, Вашингтон, Северная Каролина, Колорадо, Техас, Нью Йорк, Массачусетс и Алабама, Мейн в качестве контрольного штата, где, как предполагается нет высокотехнологичных компаний)
Изменяются ли зарплаты со временем и как? Спрос на сотрудников этих профессий растет со временем, растут ли зарплаты?
Есть ли компании, которые систематически оплачивают труд своих сотрудников (не граждан США) гораздо выше или ниже медианного уровня преобладающих зарплат?
Если учесть уровень жизни в разных штатах, то как это скажется на конечный доход?
Какие приемы и навыки использованы во время проекта:
Планирование SPAP (Структурированный пирамидальный аналитический план)
Анализ данных в Tableau worksheets (гистограммы, анализ выбросов, точечные диаграммы, ящик с усами, тренд-линии с доверительными интервалами, вычисления (условные, индексация, арифметические), древовидная диаграмма, слияние датасетов, параметры)
Создание финального дашборда для целевой аудитории и публикация в Tableau Public
Выводы
Зарплаты для разных профессиональных категорий варьируются и исчисляются несколькими десятками тысяч в год.
Тип визы не влияет на оклад, но зарплаты в разных штатах могут варьироваться, особенно это относится к профессиям технических специальностей в области анализа данных.
Наиболее высокооплачиваемые профессии это датасайентист и программный инженер в лидирующих по уровню зарплат штатах Калифорния, Массачусетс, Нью Йорк и Вашингтон.
Анализ изменения зарплат со временем показал, что медианный уровень зарплат остается практически неизменными со временем, но при этом увеличивается как шанс получения заработка значительно выше среднего (рост максимумов, особенно для профессий датасайентист и программный инженер), так и риск получения зарплаты гораздо ниже среднего уровня (снижение минимумов, особенно это касается профессий аналитик данных и бизнес-аналитик).

Отрицательная величина разницы между медианным оплачиваемым годовым окладом и медианным уровнем доминирующих зарплат чаще возникает в профессиях бизнес-аналитик и программный инженер, гораздо реже у датасайентистов и аналитиков данных. Выявлено примерно семь компаний, которые более пяти раз значительно занижали оклады от медианных уровней для специальности программный инженер.

Подтвердилась гипотеза о том, что в штатах с более низким уровнем жизни при относительно равном уровне зарплат выгоднее работать, поскольку конечный доход будет выше. А в штатах с высоким уровнем жизни существенная часть дохода будет уходить на оплату текущих бытовых нужд, что особенно не выгодно, если учитывать наличие риска получения работы с окладом ниже среднего.
Архитектура дашборда
Цель дашборда помочь определить те компании, куда имеет смысл обратиться в поиске работы в области анализа данных в США.
Дашборд имеет две составляющие: штат США и компании, где самые высокие медианные уровни зарплат, скорректированные на коэффициент уровня жизни. Вертикальная столбчатая гистограмма наверху с топом штатов служит еще и фильтром для нижней горизонтальной гистограммы с топом компаний в каждом штате.
Пользователь выбирает нужную профессию в выпадающем списке фильтра вверху дашборда, кликает на интересующий штат на первой гистограмме и получает на нижней гистограмме топ компаний, где наиболее высокие уровни доходов в выбранном штате.
Дашборд можно посмотреть онлайн в Tableau Public здесь.
Спасибо за ваше внимание и интерес к моему проекту!
Вопросы и комментарии, пожалуйста, пишите на почту: 4.anna.panteleeva@gmail.com
Comentários