Оценка тенденций в рекламных маркетинговых электронных письмах на основе Python.

Бен Начлас

В электронных письмах, которые мы получаем ежедневно, содержится бесчисленное количество идей. Почему я написал скрипт на Python для анализа своего собственного?

Вдохновение: перегрузка

Вы помните дни, когда получение электронной почты было чем-то, что вызывало у вас восторг?

Да, вам, возможно, придется повернуть время вспять (уже на пару десятилетий!), но было время, когда электронное письмо обычно означало, что кто-то думает о вас и достаточно заботится о вас, чтобы отправить лично созданное сообщение. Даже в самом звуке «You’ve Got Mail» был элемент радостного удивления.

Но, как и все, это развивалось.

На протяжении многих лет количество отправляемых нами электронных писем продолжало резко увеличиваться, и общее количество, по оценкам, исчисляется сотнями миллиардов сообщений в день. По оценкам Statista, в прошлом, 2022 году, ежедневно отправлялось примерно 333,2 миллиарда электронных писем.

По мере того, как количество электронных писем продолжает расти, растет и наше понимание того, как они могут повлиять на нас. Ученые из разных дисциплин изучали влияние этих электронных писем на наш разум и тело. Исследователи со всего мира, включая гарвардских, признали, что у нас может развиться зависимость от выброса дофамина в павловском стиле, вызванного уведомлениями о новых сообщениях. Как хорошо, когда ты думаешь, что кто-то хочет поговорить с тобой!

Даже в самом звуке «You’ve Got Mail» был элемент радостного удивления.

Введите $$$

Вскоре это знание привело к пониманию того, как использовать эти эффекты для управления поведением человека. А именно, рекламные усилия начали фокусироваться на этом цикле обратной связи, чтобы увеличить взаимодействие с рекламными материалами. Подписавшись на рассылку новостей, вы получили скидку 15% на новую пару джоггеров, баллы! Но теперь вы все еще получаете электронные письма даже после того, как подошвы изношены.

Вы слишком хорошо знакомы с этими типами электронных писем — они приходят в наши почтовые ящики несколько раз в час, перегружены смайликами, переполнены оптимизмом, битком набиты дополнительными восклицательными знаками, провозглашающими последние предложения, ограниченные по времени, и поют песню сирены, чья очарование неотразимо даже для самого искушенного покупателя:

Распродажа!

Это была какая-то красочная перестановка этого слова, которая проникла через мои спам-фильтры на мой экран и, в конце концов, в мой разум.

«Разве эта компания не провела распродажу на прошлой неделе?»

Хотя мне хотелось бы думать, что я не придал этому особого значения, я мог бы поклясться, что видел аналогичную акцию от этой же компании всего несколько дней назад.

Действительно, они это сделали, и это заставило меня задуматься об учёном данных.

Копаем

Я знал, что захочу просмотреть свой почтовый ящик в поисках информации, но сделать это вручную было невозможно.

Моя самая активная учетная запись электронной почты для борьбы с нежелательной почтой — удачно названная «[email protected]» — накопила более 10 000 электронных писем с момента ее создания где-то в 2014 году. это обсуждение, с тех пор, как я начал пользоваться их услугами в 2018 году, исправно отправляли мне электронные письма. Я решил сосредоточиться, в частности, на их сообщениях и приступил к реализации кода Python, который выполнял бы это упражнение в масштабе.

Если вы хотите подробно изучить код, стоящий за этим исследованием, или использовать мой код для воссоздания своего собственного исследования, перейдите в мой репозиторий GitHub для подробного объяснения того, что находится под капотом.

Если вам не хочется ошеломленно смотреть на строки кода Python, читайте дальше, чтобы узнать о результатах!

Год распродажи

В рамках этого проекта было проанализировано более 600 электронных писем за почти шесть лет. Для каждого электронного письма была указана дата и соответствующая сумма рекламной продажи. Наконец, эти результаты были скомпилированы и представлены графически на следующих рисунках:

Итак, на что мы смотрим?

Каждая цифра представляет собой годовой объем электронных писем, относящихся к рекламным продажам одной компании. Длина каждой полосы (а также ее цветовой оттенок) соотносится с предлагаемой суммой продажи; чем длиннее планка, тем больше экономия. Работая по часовой стрелке по кругу, мы видим каждый месяц и частоту отправки электронных писем за период.

Первая тенденция, которая бросается в глаза, довольно очевидна: из года в год отправляется больше электронных писем, поскольку компании по всему Интернету наращивают свои целевые рекламные кампании. Разница между 2019 и 2022 годами особенно разительна.

Глядя дальше, мы начинаем видеть более тонкие закономерности в данных.

Понаблюдайте за тенденциями, связанными с крупными праздниками в США: например, День святого Валентина, Пасха и День матери — это периоды времени, когда распродажи особенно часты и привлекательны. Если вы хотите получить скидку на свой рождественский подарок, вам лучше купить его где-то в Черную пятницу или Киберпонедельник, иначе ваш следующий лучший выбор будет после Нового года. Учитывая тот факт, что эта компания продает фотопечать и сопутствующие товары, вполне логично, что мы увидим увеличение рекламных акций в эти знаменитые времена года.

Для моего следующего трюка…

Удовлетворенный первоначальными результатами визуализации, я решил глубже изучить эти электронные письма, используя анализ тональности.

Я выбрал скрытое распределение Дирихле (LDA) для этой модели, так как хотел исследовать отношения между словами и понятиями, которые часто встречаются в темах электронных писем.

Ниже на карте межтематических расстояний связанные слова и фразы сгруппированы в кластеры и показана частота каждого термина в общем корпусе текста:

Полученный рисунок помогает проиллюстрировать, как могут быть связаны конкретные концепции, а также дает подсказки относительно того, насколько вероятно (или нет) определенная тема в этих рекламных письмах.

Например, в Тематической группе 1 выше мы видим, что «премиум», «книги» и «альбомы» являются наиболее часто используемыми терминами. Мы можем склоняться к тому, чтобы дождаться распродажи, если хотим приобрести один из этих предметов, поскольку, вероятно, хорошая сделка не за горами. Кроме того, такие слова, как «последний», «последний» и «шанс», появляющиеся в верхней части этого списка, похоже, подрывают ощущение срочности, которое часто подразумевается их использованием.

Мы можем продолжать улучшать наше понимание, точно настраивая параметры модели и наблюдая за новыми закономерностями и закономерностями, которые в противном случае могли бы остаться незамеченными человеческим глазом.

Зачем беспокоиться?

На первый взгляд, это исследование сэкономит нам деньги или улучшит наш опыт?

Скорее всего нет.

Но может ли это иметь потенциальную ценность с точки зрения прогнозирования лучшего времени для покупки чего-либо?

С некоторыми экстраполяциями и предположениями, да.

Возможно, нецелесообразно проводить обширное исследование данных каждый раз, когда вы хотите купить настенное искусство, но полезно понимать некоторые факторы, которые входят в современный маркетинговый план. Python и его набор устанавливаемых модулей быстро увеличивают скорость и эффективность, с которыми мы можем анализировать большие наборы информации.

Нижняя линия

По мере того, как компании продолжают увеличивать свои рекламные бюджеты, мы можем ожидать, что рекламные электронные письма будут пытаться выделиться из потока маркетинговых материалов. Тем не менее, может быть благоразумно проявлять осторожность, соблазняясь соблазном яркой распродажи. Найдите минутку, чтобы подумать, действительно ли это оптимальное время для совершения покупки или это просто попытка привлечь ваше внимание и поощрить импульсивную покупку, которая отклоняется от ваших в остальном безупречных покупательских привычек.

В конце концов, достаточно ли привлекательна скидка 10%, чтобы вы могли купить пижаму ограниченного выпуска бренда KOOL-AID, о существовании которой вы даже не подозревали, но теперь не можете жить без нее?

Добавьте бесплатную доставку, и вы получите сделку.

Бен Наклас — лыжник, исследователь данных, писатель, медитатор и на 100% настоящий человек. В настоящее время он исследует разработку языковых моделей, которые по своей сути являются разумными, и надеется на более плавную интеграцию человека и машины в будущем. Когда он отключен от сети, его можно найти (или нет) в горах, лесах и реках, а также везде между ними. Оставьте ему сообщение в LinkedIn, но не ждите раскрытия каких-то тайников с порохом.