Получаем данные из api Google analytics при помощи python
Для того, что бы начать работать с API google analytics у вас на компьютере должен быть установлен python, а также должен быть pip. PIP система управления пакетами, которая используется для установки и управления программными пакетами, написанными на Python. Если вы провели установку python из пакета Anaconda, как описано в моей предыдущей статье, то pip у вас тоже установлен.
В нашей задаче есть 3 подзадачи:
1) Создать сервисный аккаунт в google консоли
2) Настроить доступ к google analytics
3) Установить на компьютер python библиотеку для работы с core reporting api GA.
Давайте обо всем по порядку.
1) Создание сервисного аккаунта
У вас должен быть аккаунт в google. Переходим по ссылке https://console.cloud.google.com/
Перед вами появится консоль google cloud.
Принимаем условия во всплывающем окне и нам становится доступна консоль.
В левом верхнем углу нажмите “выберите проект”
После создайте свой проект, нажмите «создать проект».
Введите произвольное название проекта и нажмите «создать».
Нужно подождать некоторое время и проект будет создан. После этого нужно включить доступ к api google analytics для этого проекта.
Открываем боковое меню нажав на “гамбургер” в верхнем левом углу и переходим в раздел API и сервисы → библиотека.
Ищем google analytics, для этого используем поисковую строку.
Выбираем google analytics reporting api
В открывшемся окне нажимаем кнопку «включить»
После мы попадаем в интерфейс управления analytics reporting API и нажимаем на кнопку создать учетные данные.
Мы попадаем на новую страницу, где в разделе добавление учетных данных нужно кликнуть по ссылке “сервисный аккаунт”.
В открывшейся странице создаем сервисный аккаунт, нажимаем на соответствующую кнопку.
Указываем произвольное название сервисного аккаунта и нажимаем кнопку «создать».
На втором шаге нажмите кнопку «продолжить».
На 3 шаге находим кнопку “Создать ключ” и нажимаем на неё.
Выбираем тип ключа JSON и нажимаем «создать».
К вам на компьютер скачивается JSON файл, откройте его при помощи блокнота. Нужно скопировать значение из поля client_email (то что в кавычках, после двоеточия). Этот файл нам понадобится в дальнейшем, не забывайте о нём.
Теперь нужно перейти в аккаунт google analytics и открыть доступ на уровне аккаунта для скопированного e-mail адреса.
2) Настройка google analytics
Переходим в аккаунт GA и на вкладке аккаунт выбираем вкладку управления пользователями.
В правом верхнем углу нажимаем на плюсик и добавляем пользователя.
Вставляем e-mail сервисного аккаунта, который мы скопировали из JSON файла и нажимаем кнопку добавить.
Мы завершили настройку сервисного аккаунта. Теперь перейдем к установке библиотеки и её настройке.
3) Установка библиотеки для работы с GA
В данной статье я буду использовать библиотеку gaapi4py, ознакомиться с ней можно на github (если вы знаете другие клевые библиотеки для работы с GA, то пишите их в комментарии). Эта библиотека позволяет выгружать данные из core reporting API четвертой версии.
Чтобы установить библиотеку надо открыть командную строку В windows её можно найти если написать cmd в поиске меню пуск.
Кликните на cmd, у вас откроется консоль, в консоль нужно ввести команду
1 |
pip install gaapi4py |
и нажать enter.
Потом на экране начнут появляться строки — это процесс установки библиотеки, когда он закончится успешно, на экране будет сообщение об этом.
Работа с jupyter notebook
Для работы будем использовать jupyter notebook, о нём я немного писал в предыдущей статье “Как установить python на компьютер”
Открываем jupyter notebook и создаем новый notebook. Теперь нам нужен JSON файл, который мы скачали при создании сервисного аккаунта. Переименуйте этот файл, например в etl1.json. Необходимо поместить этот файл в папку где мы создали наш ноутбук, он нужен для работы всей нашей системы.
Выше пример размещения notebook и json файла на моём компьютере.
Возвращаемся к нашему notebook и копируем с github пример кода из раздела quick start и вставляем в наш notebook.
Теперь нужно немного настроить этот код. Перед 3 строкой ставим решетку, чтобы закомментировать код в этой строке, в 5 строке указываем название нашего json файла(он должен лежать в папке с ноутбуком, либо нужно прописать полный путь до файла).
Строки 8 — 20 это тело запроса, который будет отправлен в GA, обязательно в строке 9 — view_id замените значение на id вашего представления google analytics из которого вы хотите выгрузить данные.
Также в запросе можно менять диапазон дат, параметры, метрики и фильтры. Подробнее о настройках можно прочесть на github. Подбирать параметры и метрики можно через вот этот сервис google
После того как были сделаны настройки можно нажать ctrl+enter и этот код запустится, произойдет запрос к api google analytics и если все сделано правильно вы получите запрошенные данные в виде pandas dataframe.
В нашем примере мы запросили в качестве параметров источники/каналы трафика по датам, а в качестве метрик количество сессий. Также был задан фильтр, что нам нужны только данные по источнику google / organic. Ниже полученый ответ в виде таблицы.
Вы можете продолжить работать с полученными данными при помощи pandas, если вы не знакомы с pandas, то можете пройти вводный бесплатный курс на яндекс практикуме, чтобы ознакомиться с этой библиотекой, так же вот большая подборка материалов для изучения pandas.