Привет, мы Adspect — облачная платформа для клоакинга рекламы и фильтрации ботов в веб-трафике, а также CPA-трекер. Время от времени мы проводим тесты различных типов и источников трафика на предмет наличия в них кликфрода, то есть накрутки кликов с помощью ботов.
В данной статье мы покажем результаты тестирования качества push-трафика из нескольких рекламных сетей: Dao.ad, Push.House, ByMyAds и RollerAds. В рамках наших тестов термин «качество» обозначает долю живого трафика в общей массе с точки зрения фильтрующего движка Adspect и не включает в себя поведенческие факторы и показатели конверсии — мы оцениваем только «машинную» чистоту трафика.
Почему это качество важно? По нему можно быстро составить впечатление о сетке и начать составлять блеклисты наиболее ботовых площадок, не дожидаясь первых конверсий, то есть не сливая тестовый бюджет в молоко. Впрочем, как вы увидите из данного материала, push-трафик в целом достаточно чистый и не слишком разнообразен в плане водящихся в нем зверьков. Это его отличие от других форматов, таких как popunder и нативка, происходит из специфики технической реализации Push API в браузерах: далеко не каждая система веб-автоматизации имеет программируемые средства для подписки, приема уведомлений и клика по ним, не говоря уже о более «тупых» средствах накрутки (cURL и других подобных примитивных HTTP-клиентах), в которых Push API вообще не реализован. Зачастую накрутка push-кликов делается вообще без использования push-подсистемы браузеров — эксплуатируются те или иные уязвимости push-сетей, которые позволяют недобросовестным вебмастерам маскировать другие виды трафика под push.
Трафик на нашей платформе обрабатывается в контексте потоков, которые по сути являются аналогами рекламных кампаний, то есть отдельными группами настроек для фильтрации с раздельным сбором статистики для удобства анализа и управления. Типовая настройка тестового потока в нашей системе приведена на скриншоте ниже:
Все фильтры, специфические для задачи клоаки, были отключены, чтобы максимально объективно оценить трафик именно на предмет ботовых и прочих невалидных кликов. В этом нам в первую очередь помогает технология сканирования JS-фингерпринтов — слепков данных с внутреннего устройства браузеров, которые могут очень многое рассказать о посетителях, если задавать правильные вопросы. Также отметим, что наша система относит к ботам трафик с IP-диапазонов, принадлежащих хостингам и датацентрам, потому что это и есть боты за редкими исключениями прокси- и VРN-сервисов. Как пишут Udger на своем сайте: «Если IP-адрес находится в диапазоне датацентров, то это не целевой посетитель, а программа на 99,9 %.» И мы с ними полностью согласны.
Dao.ad
Первая протестированная нами сетка — Dao.ad, в прошлом известная как DaoPush до появления у них popunder-формата. Это крупные и уверенно занимающие свое место на рынке ребята. Мы пролили их трафик с трех стран: US, RU и ID. Статистику в разрезе по странам вы можете видеть на скриншоте ниже:
Сначала пройдемся по важным для нас терминам и колонкам отчёта. GIVT (general invalid traffic, общий невалидный трафик) и SIVT (sophisticated invalid traffic, сложный невалидный трафик) — эти термины были введены американской MRC (Media Ratings Council) для категоризации ботового трафика по сложности его технического исполнения. Мы в Adspect понимаем эти термины следующим образом:
- GIVT — это посетители, отфильтрованные на ранних стадиях по IP-адресам (прокси, VРN), AS-номерам (хостинги, colocation, AV, недружественные корпорации и др.), user agent и прочим базовым атрибутам, а также системы неопределенной природы, не способные выполнить JavaScript-код для формирования и отправки нам фингерпринта — «тупые» боты, очень старые телефоны и браузеры, оборванные соединения и т.п.;
- SIVT — трафик, проходящий по встроенным базовым и пользовательским фильтрам, но осознанно отфильтрованный нами по JS-фингерпринтам — сюда включаются headless-браузеры, системы веб-автоматизации, системы автоматического QA для веб-приложений, а также те посетители, на которых указала наша система машинного обучения VLA™;
- Качество — эта колонка отражает процент одобренного трафика в общей массе, главный оценочный показатель, на который мы и будем смотреть.
Итак, качество push-трафика Dao.ad в разрезе по ГЕО получилось следующее:
- ID — 76 %
- RU — 89 %
- US — 81 %
Все три значения являются очень высокими, особенно на фоне традиционных форматов медийной рекламы, где доля фрода в несколько раз выше. Индонезия расположилась ниже всех за счет высокого GIVT, о точной природе которого можно лишь догадываться, но наиболее вероятно, что основная причина заключается в плохом качестве Интернет-соединения, это нормальное явление для стран третьего мира. По US также достаточно много GIVT в сравнении с SIVT, что также может быть обусловлено качеством связи (в глубинке везде полудохлый DSL, реже DOCSIS), но более вероятно, что это накрутка, т.к. ГЕО дорогое.
Некоторое количество осознанно отфильтрованных переходов были отнесены к GIVT из-за заблокированных IP-диапазонов (среди них могли быть люди с VРN или прокси) — больше половины выручки бизнеса Adspect приходится на клоакинг, поэтому мы вынуждены превентивно фильтровать переходы с IP-адресов, принадлежащих неблагонадежным организациям, в первую очередь датацентрам и хостинговым компаниям; доверия такому трафику нет.
Ниже можно посмотреть распределение показателей по операционным системам, браузерам и площадкам:
В целом распределение качества между срезами относительно равномерное.
Отфильтрованного как SIVT трафика мало, основные причины — потеря cookie при отправке фингерпринта (подозрительно, т.к. браузеры с отключенными cookies встречаются крайне редко), а также несколько переходов с разных вариаций Chrome Headless — собственно, накрутка в чистом виде, но ее предельно мало, и это хорошо. Любопытно, что 6 пушей умудрились прийти на WebView, в котором вообще нет механизма их доставки Push API, — это тоже накрутка кликов, вероятно, в фоновом режиме с прил.
Крупных площадок всего четыре, но и ставки были невысоки, так что выкупались лишь наиболее дешевые из них. С ростом цены площадок качество трафика на них также будет закономерно расти. Именно поэтому пролив самого дешевого трафика с любой сетки позволяет быстро составить адекватное впечатление о сетке в целом. Если уже на старте вы видите высокие показатели качества, как в Dao.ad, то после отсева площадок по ботовости и далее по конверту качество будет еще выше.
Наше резюме: в Dao.ad отличный трафик, среднее качество 81 % на входе это очень хороший результат. От себя порекомендуем ребятам встроить проверку на сохранение cookie между запросами к домену своей TDS.
Push.House
Второй сеткой в нашем обзоре будет Push.House. Как и Dao.ad, Push.House относится к хорошо известным и крупным push-сетям, которые уже давно на рынке. Следуя общей тенденции, у них со временем появились другие рекламные форматы, в том числе модные сейчас PWA (Progressive Web Apps), однако их мы оставим за рамками данного теста и сосредоточимся на push-трафике.
Как обычно, начнем с разреза по ГЕО:
Отличные результаты. В Push.House мы получили несколько больше доля нецелевых стран в сравнении с Dao.ad, но это часто бывает из-за разницы в GeoIP-базах у сетки и у трекера (у нас). Качество трафика по целевым странам распределилось следующим образом:
- RU — 87 %
- ID — 86 %
- US — 70 %
Здесь мы видим уже набившую оскомину картину: качество трафика из США проседает на фоне других стран. Мы еще увидим этот феномен далее в этой статье. Как и всегда, мы это объясняем обыкновенной рентабельностью накрутки: где больше платят, там и выгоднее фродить. Основная доля невалидного с нашей точки зрения трафика сосредоточена в GIVT и обусловлена обыкновенным отсевом по IP-адресам, то есть кликам из хостинговых сетей. Вероятно, часть из них все же живые люди, использующие VРN и прокси, но однозначно сказать мы сможем лишь в будущих тестах после релиза нашей системы многоуровневого фингерпринтинга Adspect Ubercloak, которая пока проходит первичное альфа-тестирование внутри компании.
Как бы там ни было, главная тенденция, которую мы видим — очень низкий SIVT, то есть трафик, производящий фингерпринты, практически весь чист от автоматики типа PhantomJS, Puppeteer и Selenium. Лишь несколько обработанных кликов были отфильтрованы из-за потери cookie или по признакам сложной автоматики, что делает Push.House честь в плане чистоты трафика. К слову о сложной автоматике: два клика по RU были под управлением наиболее свежей системы автоматизации Playwright от Google, которая примечательна тем, что обходит фильтры большинства современных антифродов, но все же палится нашей VLA — лучшее подтверждение того, что наша ставка на машинное обучение была верной. Намеченный на конец августа релиз Ubercloak окончательно прибьет Playwright как инструмент для модерации и фрода.
В остальном из интересных особенностей Push.House — только пуши с WebView, их было на порядок больше, чем в Dao.ad, однако эти клики прошли в своей массе тесты на ботовость и были направлены на ссылку для целевого трафика. Общая же картина достаточно однородна по всем срезам и производит однозначно положительное впечатление:
В качестве резюме хотим похвалить Роберта и его команду за очень качественный трафик — среднее качество 85 % на старте! Наши рекомендации: обратить внимание на US, это ГЕО чаще других бывает проблемным, а также в целом на IP-адреса серверных диапазонов. Тесты PWA от Push.House на очереди!
ByMyAds
ByMyAds — сравнительно молодая рекламная сеть, и ситуация с push-трафиком в ней заметно хуже, чем в Dao.ad и Push.House. Здесь мы сливали US, RU и FR. Сразу приведем рентгеновские снимки, анамнез читайте ниже:
Выше мы уже писали о проблемности US в плане накруток. В ByMyAds это особенно бросается в глаза, стоит лишь взглянуть на разбивку качества трафика по ГЕО:
- RU — 72 %
- FR — 63 %
- US — 14 % !!!
Лишь половина трафика была достоверно определена нами как живая — среднее качество трафика 51 %, сильно испорченное Штатами. Около 30 % всех кликов составляет GIVT малопонятной природы с user agent'ами тех версий браузеров, которые однозначно способны сформировать и отправить нам отпечаток, но почему-то этого не сделали (явный user agent spoofing). И здесь достаточно заметна доля SIVT в 17 %. где можно выделить следующие виды накрутки:
- переходы с WebView, в котором нет Push API
- клики с хостинговых диапазонов IP-адресов, их очень много по US
- переходы с чего-то, напоминающего мобильные приложения, но без конкретных опознавательных строк
- редкие клики с headless-браузеров (очевидно, что нет смысла усложнять накрутку, когда и более простой фрод проходит)
Что ж, господа ByMyAds, у вас впереди еще много работы, особенно по US. Пожелаем вам как можно скорее вычистить эти авгиевы конюшни. Большая часть нелегитимного трафика банально определяется по хостинговой принадлежности IP-адресов, так что для фильтрации всех этих ботов даже не нужно гнать трафик через Adspect — должно хватить любого трекера с мало-мальски адекватными базами ботовых IP-диапазонов. Трафик с России еще более-менее чистый, но в остальном слабовато.
RollerAds
В заключение приведем результаты одного из наших первых тестовых проливов — с другой молодой push-сетки RollerAds. Пролив был еще в конце мая и только Android по Соединенным штатам, а статистика ранее не публиковалась нигде, кроме Telegram-группы «Пуши в бурже», но мы посчитали, что хорошие результаты достойны более широкой огласки. Вероятно, в будущем мы сделаем широкий тест этой сетки, а пока просто похвалим их за чистый трафик!
Две кампании OLD и NEW — это старые и новые подписчики соответственно. Качество в районе 90% на самом деле даже выше, если учесть все доработки алгоритмов нашей системы, которые мы сделали с тех пор, так что трафик в RollerAds можно смело назвать одним из самых чистых. Мы не располагаем данными об их объемах, но сетка однозначно заслуживает внимания.
Итог
Подытожим суммарные результаты по всем четырем сеткам в порядке убывания качества:
- RollerAds — 89%
- Push.House — 85%
- Dao.ad — 81%
- ByMyAds — 51%
На этом все, делайте выводы. Для наших читателей у нас есть промокод CONVERSION.IM на скидку 25% при подписке. Всем чистого трафика и профита!