Raw Data: 7 причин иметь под рукой «сырые» данные
Когда мы говорим о данных, то обычно ссылаемся на две категории: агрегированные и “сырые”. Агрегированные отчеты представляют неоспоримую ценность – все данные уже собраны в дэшборде, а измеренные показатели представляют результаты основных KPI.
Для чего же эти, на первый взгляд, бесконечные строки и колонки с цифрами “сырых” данных, если агрегированные отчеты уже связали все метрики и показатели? В конце концов, инсайты формируются на закономерностях, а не на данных отдельных пользователей. И в этом случае агрегированные отчеты действительно представляют большую ценность – они понятны, их легко использовать в работе и, опираясь на выведенные закономерности, совершать почти мгновенные действия, оптимизируя или изменяя рекламных кампаний.
Но какую бы неоспоримую ценность не представляли отчеты в дэшбордах, их явно недостаточно. Почти каждому маркетологу и аналитику нужны данные в своем первоначальном, т.е. “сыром” виде. Более того, у вас должен быть постоянный доступ к собственным “сырым” данным, даже если пока вы не можете самостоятельно управлять их передачей через Push или Pull API в реальном времени.
Итак, зачем нам “сырые” данные?
1) Кампании с прицельным таргетингом
Возможность проводить прицельные, узкотаргетированные кампании – это, пожалуй, самая важная причина получить доступ к “сырым” данным. Тщательный анализ таких данных поможет вам составить максимально точные пользовательские списки и когорты, формирующие ядро целевой аудитории для ретаргетинговых или даже шаблонных кампаний.
Например, мы говорим о ритейл-приложении: на основе IDFA вы можете выделить аудиторию и составить список пользователей, которые просмотрели определенный товар, но не совершили покупку. А если у вас игра, и вы работаете с ретаргетинговой сетью, которая способна собирать данные о комплексных событиях внутри приложения с многочисленными параметрами (rich-in app events), вы с легкостью составите список игроков, которые дошли до 25 уровня, совершили хотя бы одну покупку, но за последние четыре недели не провели ни одной игровой сессии.
2) Собственная кастомная аналитика
В большинстве своем агрегированные отчеты достаточно подробны, но вам может потребоваться собственный анализ, сформированный под конкретные нужды. С полноценным доступом к “сырым” данным вы или ваша команда аналитиков сможет использовать их как угодно: копайте так глубоко, как нужно вам! И, вполне возможно, вы сможете открыть для себя новые инсайты по разным срезам пользователей, их поведению и жизненному циклу.
3) Регулировать расхождения
В сложной и пока еще разрозненной мобильной экосистеме расхождения в показателях установочных кампаний – данность, с которой приходиться мириться. Причин для появления таких расхождений тысячи, будь то несостыковки с цифрами апсторов или рекламных сетей.
Вот несколько примеров спорных ситуаций по установочным кампаниям в рекламных сетях. Эти “разночтения” возникают по очень распространенным причинам, таким как:
Разные методы подсчета: сеть А выставляет рекламодателю счет за 10 000 установок, а трэкинг-провайдер приписывает этому источнику только 8 000. Если у рекламодателя есть доступ к “сырым” данным, он просто выгружает отчет из дэшборда и видит, что трэкинг-провайдер распределилспорные 2 000 инсталлов между другими сетями, которые обеспечили последний клик.
Основная причина таких расхождений – разные методы подсчета. Сеть А приписывает себе установки, фиксируя совпадение “клик-инсталл”. Но! Рекламная сеть не может знать, что происходило после атрибутированного клика, у нее нет доступа к данным других сетей, она попросту не может отследить всю воронку конверсии.
Технические неполадки: рекламодатель видит установки в дэшборде, но их не видит рекламная сеть, так как не получает постбэков, а это чревато заморозкой кампании. В таких ситуациях рекламодатель может отфильтровать “сырые” данные по логам и выявить проблему (будь то ошибки в настройках или конфигурации), исправить ее или оперативно поделиться информацией о сбое с партнёрами и расследовать причины позже.
Расхождения в данных случаются и с апсторами, и вот почему:
- Метрики апстора основаны на измерениях по пользователю, а не по устройству. Например, я использую один Gmail-аккаунт для установки приложений на моем телефоне и планшете (или члены семьи использовали мой аккаунт и установили приложение на своем устройстве). В этом случае магазин посчитает только одну установку, тогда как трэкинг-провайдер посчитает каждое устройство как отдельный инсталл.
- Апстор засчитает только одну установку, даже если пользователь установил, удалил и переустановил приложение. Наша система атрибутирует оба инсталла, если повторная установка произошла через три месяца после первоначальной.
- Когда рекламодатель начинает работать с AppsFlyer, и у нас нет исторических данных, мы считаем обновление приложения как установку, тогда как апстор– нет.
Данные магазинов нельзя оспорить. Единственное, что можно сделать в такой ситуации – понять, что привело к расхождениям и решить, какой метод подсчета будете использовать вы.
4) Мошенничество
В одном из последних отчетов компании White Ops, специализируется на цифровой безопасности, убытки рынка интернет-рекламы от действий мошенников оцениваются в $6,3 млрд. И хотя отчет не располагает полными данными о глубине и объему проникновения мошенничества в мобайле, потенциальные потери нашей индустрии от действий мошенников уже в 2015 году могут составить $1,5 млрд. Это большая угроза, а с ежегодным ростом бюджетов на мобильную рекламу риск только увеличивается.
Вот несколько способов выявить мошеннические действия при помощи “сырых” данных. Предположим, что речь идет о продвинутых мошенниках, способных создать новый идентификатор устройства. Наличие “сырых” данных поможет вам отследить подозрительную активность. В таких случаях надо искать определенные закономерности: множество установок или уникальных идентификаторов, которые приходят с одного IP, нелогичные временные промежутки инсталлов (каждую секунду, каждые пять секунд и т.д.) или обратить внимание на то, что большое число IDFA привязано к одному IDFV (идентификатор производителя).
5) Повторное вовлечение пользователя через сети, которые их привели
Вы можете связать “сырые” атрибуционные данные трэкинг-провайдера с собственными шаблонами и бизнес-моделями. Такие связки помогут вам проводить кампании по повторному вовлечению (re-engagement) через рекламные сети или каналы, которые привели этих пользователей. Например, мотивировать пользователей, приобретенных через кампанию в Tвиттере, писать твиты про ваш продукт.
6) Бэкап данных
Настройка передачи данных в режиме реального времени через push API имеет кучу преимуществ, так что вас не должно удивлять, что этой функцией пользуются даже самые продвинутые маркетологи. Но что произойдет, если вы получаете данные от трэкинг-провайдера только в режиме реального времени, а у вас сбои со связью? Ответ прост – вы потеряет все данные за период сбоя. Опция выгрузки “сырых” данных за определенный период из дэшборда застрахует от любых потерь
Подробнее: http://www.cossa.ru/articles/155/108982/
7) Меняйте вендоров когда угодно
Наличие всего массива многоуровневых данных дает вам полную свободу. Имея под рукой “сырые” данные, вы всегда можете забрать их с собой и начать работать с другим поставщиком, тогда как без них вы фактически привязаны к одному вендору, который распоряжается вашими данными. Очевидная вещь, но многие даже не задумываются об этом. Все данные по вашим кампаниям и приложениям принадлежат вам и только вам и это ваш самый ценный актив.
БЕЗ “СЫРЫХ” ДАННЫХ ВЫ ПРАКТИЧЕСКИ ПРИВЯЗАНЫ К ЕДИНСТВЕННОМУ ПОСТАВЩИКУ
Итого
Для того, чтобы выжать максимум пользы из своих данных, нужно получить все логи, в идеале через API-трансфер (если вы поддерживаете эту функцию), либо через прямой доступ из дэшборда. Ведь для того, чтобы двигаться вперед, ваши тылы должны быть надежно прикрыты в любой ситуации.