Получаем данные из api Google analytics при помощи python

Для того, что бы начать работать с API google analytics у вас на компьютере должен быть установлен python, а также должен быть pip. PIP система управления пакетами, которая используется для установки и управления программными пакетами, написанными на Python. Если вы провели установку python из пакета Anaconda, как описано в моей предыдущей статье, то pip у вас тоже установлен.

В нашей задаче есть 3 подзадачи:
1) Создать сервисный аккаунт в google консоли

2) Настроить доступ к google analytics

3) Установить на компьютер python библиотеку для работы с core reporting api GA.
Давайте обо всем по порядку.

 

1) Создание сервисного аккаунта

У вас должен быть аккаунт в google. Переходим по ссылке https://console.cloud.google.com/ 

Перед вами появится консоль google cloud.

1pga

Принимаем условия во всплывающем окне и нам становится доступна консоль.

 

В левом верхнем углу нажмите “выберите проект”

2pga

 

После создайте свой проект, нажмите «создать проект».

3pga

 

 

Введите произвольное название проекта и нажмите «создать».

4pga

 

Нужно подождать некоторое время и проект будет создан. После этого нужно включить доступ к api google analytics для этого проекта.

 

Открываем боковое меню нажав на “гамбургер” в верхнем левом углу и переходим в раздел API и сервисы → библиотека.

5pga

 

 

 

Ищем google analytics, для этого используем поисковую строку.

6pga

 

 

Выбираем google analytics reporting api

7pga

 

 

В открывшемся окне нажимаем кнопку «включить»

8pga

 

 

После мы попадаем в интерфейс управления analytics reporting  API и нажимаем на кнопку создать учетные данные.

9pga

 

Мы попадаем на новую страницу, где в разделе добавление учетных данных нужно кликнуть по ссылке “сервисный аккаунт”.

10pga

 

В открывшейся странице создаем сервисный аккаунт, нажимаем на соответствующую кнопку.

11pga

 

Указываем произвольное название сервисного аккаунта и нажимаем кнопку «создать».

11pga2

 

 

На втором шаге нажмите кнопку «продолжить».

12pga

На 3 шаге находим кнопку “Создать ключ” и нажимаем на неё.

13pga

 

Выбираем тип ключа JSON и нажимаем «создать».

14pga

 

К вам на компьютер скачивается JSON файл, откройте его при помощи блокнота. Нужно скопировать значение из поля client_email (то что в кавычках, после двоеточия). Этот файл нам понадобится в дальнейшем, не забывайте о нём.

15pga

 

Теперь нужно перейти в аккаунт google analytics и открыть доступ на уровне аккаунта для скопированного e-mail адреса.

2) Настройка google analytics

Переходим в аккаунт GA и на вкладке аккаунт выбираем вкладку управления пользователями.

16pga

 

В правом верхнем углу нажимаем на плюсик и добавляем пользователя.

16pga2

 

Вставляем e-mail сервисного аккаунта, который мы скопировали из JSON файла и нажимаем кнопку добавить.

17pga

 

Мы завершили настройку сервисного аккаунта. Теперь перейдем к установке библиотеки и её настройке.

 

3) Установка библиотеки для работы с GA

В данной статье я буду использовать библиотеку gaapi4py, ознакомиться с ней можно на github (если вы знаете другие клевые библиотеки для работы с GA, то пишите их в комментарии). Эта библиотека позволяет выгружать данные из core reporting API четвертой версии.

18pga

 

Чтобы установить библиотеку надо открыть командную строку В windows её можно найти если написать cmd в поиске меню пуск.

19pga

 

Кликните на cmd, у вас откроется консоль, в консоль нужно ввести команду 

и нажать enter.

20pga

 

Потом на экране начнут появляться строки — это процесс установки библиотеки, когда он закончится успешно, на экране будет сообщение об этом.

 

Работа с jupyter notebook

Для работы будем использовать jupyter notebook, о нём я немного писал в предыдущей статье “Как установить python на компьютер”

Открываем jupyter notebook и создаем новый notebook. Теперь нам нужен JSON файл, который мы скачали при создании сервисного аккаунта. Переименуйте этот файл, например в etl1.json. Необходимо поместить этот файл в папку где мы создали наш ноутбук, он нужен для работы всей нашей системы.

21pga

Выше пример размещения notebook и json файла на моём компьютере.

Возвращаемся к нашему notebook и копируем с github пример кода из раздела quick start и вставляем в наш notebook.

22pga

Теперь нужно немного настроить этот код. Перед 3 строкой ставим решетку, чтобы закомментировать код в этой строке, в 5 строке указываем название нашего json файла(он должен лежать в папке с ноутбуком, либо нужно прописать полный путь до файла).

Строки 8 — 20 это тело запроса, который будет отправлен в GA, обязательно в строке 9 — view_id замените значение на id вашего представления google analytics из которого вы хотите выгрузить данные.

Также в запросе можно менять диапазон дат, параметры, метрики и фильтры. Подробнее о настройках можно прочесть на github. Подбирать параметры и метрики можно через вот этот сервис google

После того как были сделаны настройки можно нажать ctrl+enter и этот код запустится, произойдет запрос к api google analytics и если все сделано правильно вы получите запрошенные данные в виде  pandas dataframe.

В нашем примере мы запросили в качестве параметров источники/каналы трафика по датам, а в качестве метрик количество сессий. Также был задан фильтр, что нам нужны только данные по источнику google / organic. Ниже полученый ответ в виде таблицы.

23pga

 

Вы можете продолжить работать с полученными данными при помощи pandas, если вы не знакомы с pandas, то можете пройти вводный бесплатный курс на яндекс практикуме, чтобы ознакомиться с этой библиотекой, так же вот большая подборка материалов для изучения pandas.