Считаем среднюю ЗП маркетолога при помощи API hh.ru и скрипта python

Недавно я начал изучение языка программирования python. Для развития навыка программирования я придумал себе задачу.

Посчитать минимальную среднюю ЗП по запросу интернет маркетолог на сайте hh.ru, по региону Россия. Сейчас по запросу интернет маркетолог на сайте найдено 2490 вакансий.

hh

Если мы попробуем вручную посчитать среднюю ЗП по всем этим вакансиям, то нам нужно будет выписать все зарплаты в эксель для подсчета средней величины. Мне кажется на выписывание 2000 вакансий уйдет не меньше 2 часов. В такие моменты понимаешь, как круто уметь программировать.

Наш скрипт справится с этой задачей за 30 секунд. А если предположить, что вам нужно делать подобные операции ежедневно, то программа поможет сэкономить вам огромное количество времени.

Для решения этой задачи будем использовать api hh, про работу с ним можно почитать в блоге на хабре

Алгоритм решения задачи

  1. При помощи цикла получаем 200 страниц — результатов выдачи по запросу интернет маркетолог. Всего получаем информацию по 2000 вакансий. Данные получаем в формате json
  2. Разбиваем данные, получаем множество словарей и ищем в словарях ключ salary  в нем хранится информация о зарплате, после ищем значение по ключу from, в нем хранится минимальная ЗП по вакансии
  3. Суммируем значения всех вакансий по ключу from и подсчитывает при помощи счетчика количество обработанных вакансий
  4. Делим сумму всех зарплат на количество обработанных вакансий. Получаем среднюю минимальную ЗП.

Ниже я добавил получившийся скрипт с подробными комментариями

В результате выполнения скрипта мы узнаем, что средняя минимальная ЗП по России по запросу интернет маркетолог, на момент его выполнения 44688,44

Еще месяц назад, написать такой скрипт мне казалось чем-то не реальным, т.к. я практически не умел программировать и ничего не знал о python. Если вы работаете с данными, то советую начать учить python, он облегчит вам жизнь.

Теперь я хочу разобраться, как это скрипт закинуть на сервер и заставить работать самостоятельно по расписанию и сохранять результат выполнения в файл на отдельной строке. Об этом я напишу в следующей статье.

Автоматизируйте или автоматизируют вас))