17 mei 2021 | Digital Analytics | Leestijd: 9 minuten

Zo haal je meerwaarde uit je first party data met machine learning

Artificial Intelligence en het wegvallen van veel third party data heeft en zal grote invloed hebben op onze toekomst als marketeers. Toch zijn er naast de techgiganten (Google, Facebook, Amazon, Microsoft) nog maar weinig bedrijven die AI gebruiken om meerwaarde te halen uit hun eigen website of CRM-data. Dit zal in de toekomst juist hét punt gaan worden waar je concurrentievoordeel mee kunt behalen

Ik laat je graag zien hoe je als marketeer met behulp van Machine Learning meerwaarde uit je first party data haalt.

First en third party data

Voor het aansturen van onze marketingcampagnes gebruiken we informatie welke zijn verkregen uit verschillende cookies. Cookies op de eigen website zijn een vorm van first party data. Het volgen van gebruikers op jouw website via een Facebook-cookie is een vorm van third party data. Beide cookies worden steeds meer uitgebannen door bekende browsers als Safari en Firefox. Als Google Chrome volgend jaar ook minder cookies gaat toestaan en de levensduur van cookies wordt verkort, ben je steeds meer toegewezen op je eigen first party data. Daarom vertel ik je graag hoe je hier meer mee kunt doen in dit blog.

Meer weten over dit specifieke onderwerp? We hebben een handige begrippenlijst samengesteld waar je meer informatie vindt over de first en third party cookies. Ook is er een handboek en cookie impact tool waarmee je je dataverlies per 2022 berekent.

Alles over de Cookieless Era

Machine Learning

De eerste stap richting AI is machine learning. Machine learning is ontstaan in de zoektocht naar artificial intelligence en is op dit moment een stuk toegankelijker wanneer je met jouw eigen datasets wilt werken. De focus van dit blog ligt op het toepassen van wiskundige modellen op datasets oftewel: Machine learning. Machine Learning wordt in het marketingveld bijvoorbeeld ook in ingezet door Google voor het optimaliseren van smartbidding biedstrategieën binnen Google Ads.

Definitie Machine Learning op Wikipedia:

Machine learning (ML) is the scientific study of algorithms and statistical models that computer systems use to perform a specific task without using explicit instructions

Voor machine learning zijn grote datasets nodig om voorspellingen te doen. Datasets waar jij misschien al over beschikt. Voorspellingen zijn mogelijk zodra je een wiskundig model hebt getraind om te werken met deze dataset, en dat is makkelijker / bereikbaarder dan je (waarschijnlijk) denkt.

Wat is een grote, bruikbare dataset?

Bij een grote dataset moet je denken aan een tabel met tientallen kolommen en bijvoorbeeld honderden rijen. Het is niet te zeggen hoe groot een dataset moet zijn om er een model mee te kunnen trainen. Dit hangt namelijk zowel van de complexiteit van jouw ‘probleem’ als de complexiteit van jouw model af.

Voorbeeld machine learning: Wie overleeft de Titanic-ramp?

Zo is het mogelijk om op basis van de passagierslijst van de Titanic te voorspellen welke passagiers een grotere kans hadden om de ramp te overleven.

Deze dataset bevat input variabelen en de gewenste voorspelling die wij willen doen, namelijk of mensen de ramp kunnen overleven
De groene kolommen zijn de ‘input variabelen’
Of ze het hebben overleefd is de ‘gewenste uitkomst’

Voorbeeld dataset: Passagiers Titanic

machine learning titanic traffic builders marketing

Wanneer jouw dataset groot genoeg is, kun je het model 70% van jouw data tonen inclusief de gewenste uitkomst.
Dit noemen we de trainingsset.
Zo leert het model dat je gebruikt welke variabelen de grootste invloed hadden op de overlevingskans.
In de bovenstaande tabel zijn op de verticale as de groene rijen de trainingset.
Wanneer je nu de overige 30% van de dataset (blauwe rijen) aan jouw model ‘voert’ kan deze op basis van de input variabelen een voorspelling doen.
Zo kunnen we bijvoorbeeld achterhalen wat de overlevingskans is van Rose en Jack.

Supervised Learning

Deze manier van leren noemen we supervised learning. Dit is vergelijkbaar met een baby die je plaatjes laat zien. Als je vaak genoeg verteld dat een plaatje van een koe een koe is gaat een baby dit op den duur ook zelf herkennen.

Maar hoe zet je supervised learning nu in voor marketingscampagnes? Aan de hand van 4 voorbeeldcases laat ik je zien hoe je je dataset verrijkt met Machine Learning. De uitkomsten kunen naast doelgroepen ook andere waardevolle inzichten opleveren.

De vier praktische voorbeelden die volgen, betreffen de volgende onderwerpen:

Conversiekans voorspellen op basis van E-commerce-data
Klanten clusteren op basis van E-commerce- en CRM-data
Churn voorspellen op basis van app data (SaaS bedrijf)
Customer Lifetime Value voorspellen op basis van E-commerce-data

Conversiekans voorspellen op basis van E-commerce data met machine learning

Benodigd: e-commerce dataset inclusief unieke bezoeker id’s

Als jij jouw e-commerce-data goed geordend hebt, is het mogelijk om op basis hiervan voorspellingen te doen.

Wanneer jouw bezoekers individueel identificeerbaar zijn met een unieke code kun je kijken welke acties op jouw website zijn ondernomen door gebruikers.
Vervolgens kun je ook zien welke gebruikers de afgelopen periode een transactie hebben gedaan op de website. (N.b.Bij het verzamelen van deze data kun je uiteraard ook de hulp inschakelen van het Traffic Builders Analytics of Datahive360 team.)

Wanneer jij deze data gebruikt om een model te trainen zal deze de meest waardevolle acties identificeren (input variabelen) voor het behalen van een transactie (gewenste output).

Voorbeelden van zo’n actie:

Tijd op de site;
Het aantal pagina’s wat een bezoeker heeft bekeken;
Of het aantal producten wat in een winkelmandje is gestopt.

Doelgroepen die je kunt aanmaken:

Google Analytics: Doelgroep van websitegebruikers die een bepaalde hoeveelheid producten in hun winkelmandje hebben gestopt.
Google Ads: Een similar audience van deze doelgroep

Inzet doelgroepen

Deze doelgroepen kunnen vervolgens worden gebruikt voor dynamische retargeting campagnes (laat ze via Display de laatste producten uit hun winkelmandje zien). Ook kan je de doelgroep een hoger bod meegeven binnen Google Ads.

Klanten clusteren op basis van E-commerce en CRM-data

Om de volgende doelgroep aan te maken heb je een koppeling nodig tussen jouw CRM-systeem en e-commerce-data. Voor veel mensen is dit eigenlijk al de grootste uitdaging. Bij Traffic Builders gebruiken wij Datahive360 om data uit verschillende systemen op te halen zodat we deze kunnen samenvoegen. Deze tool kun je zelf ook gratis uitproberen. Als je de data uit jouw CRM en E-commerce systeem in een dataset hebt kun je deze gaan analyseren. Hieronder leg ik uit hoe je waardevolle inzichten uit deze data kunt halen.

De inzichten

Er zijn wiskundige modellen die de verbanden tussen grote groepen datapunten herkennen. Deze modellen herkennen de datapuntgroepen met de kleinste onderlinge afstand. Zo kun je bijvoorbeeld klanten binnen jouw dataset clusteren die vaker dan gemiddeld producten retourneren.

Voorbeelden van relevante klantsegmenten:

Relatief nieuwe websitegebruikers die nog niks besteld hebben maar veel interactie op de website vertonen;
Klanten die al lang geen producten meer besteld hebben;
Waardevolle klanten die veel interactie tonen op de site en regelmatig bestellen.

Doelgroep voorbeeld

Op basis van deze segmenten kun je een remarketing campagne instellen. Deze campagne mikt op de heractivatie van de klanten die al lang niks meer besteld hebben. Een andere optie is om ze juist uit te sluiten. Dit is aan te raden wanneer je geen marketingbudget wilt steken in gebruikers waarvan de kans kleiner is dat ze gaan converteren.

Churn voorspellen op basis van app data (SaaS-bedrijf)

Stel je voor dat je een mobiele app beheert. In deze case wil je het aantal gebruikers dat jouw app verwijdert terugdringen.

Als jij een dataset hebt met uniek identificeerbare gebruikers en hun in-app-acties is het mogelijk om voorspellingen te doen over de kans dat gebruikers de app verwijderen (of niet actief gebruiken).
Gebruik bijvoorbeeld een dataset van 3 maanden die ook laat zien of gebruikers de app hebben verwijderd.
Geef vervolgens in een dataset de kolom ‘app verwijderd’ als voorspelbare waarde aan.
Train nu je model met een set van je data. Jouw model leert zo welke variabelen de kans op het verwijderen van de app verhogen.

Misschien leer je dat gebruikers die de eerste maand vijf spelletjes spelen de app de eerste drie maanden niet verwijderen. Om de churn te beperken besluit je op basis van deze learnings om gebruikers na het spelen van 5 spellen te belonen met een leuke extra.

Doelgroep:

Gebruikers die na drie maanden nog geen vijf spelletjes hebben gespeeld, plaats je in een doelgroep.
Deze doelgroep moedig je via een display of in app campagne aan om de app weer eens te gebruiken.

Customer Lifetime Value (CLTV) voorspellen op basis van E-commerce data

De wens van iedere marketeer: je campagnes optimaliseren voor waardevolle klanten.

Heb je e-commerce-data verzameld over een langere periode, dan weet je welke acties je gebruikers ondernemen en hoeveel ze bij jou op de site bestellen.
Op basis van deze data kun je voorspellingen doen over hun uitgavenpatroon in de komende periode.
Zo kun je de klantwaarde berekenen.

Hier gebruik je weer het principe van supervised learning. Je gebruikt namelijk een oude dataset met daarin klant interacties en de opbrengst over een bepaalde periode om jouw model te trainen. Vervolg kan het model voorspellingen gaan maken over de verwachte opbrengst in de toekomst.

Welke doelgroepen maak je hiermee?

Google Analytics: Doelgroep van je meest waardevolle klanten.
- Deze zou je een speciale aanbieding kunnen doen via de mail. Of je zou je op een speciale actie landingspagina kunnen laten landen.
Google Ads: Lookalikes van je meest en minst waardevolle klanten. Op deze doelgroepen zou je op en af kunnen bieden.

Samenvatting/conclusie

Heeft deze blog jou geïnteresseerd in de mogelijkheden van AI voor jouw campagnes? Ik raad je dan zeker ook aan om een training te volgen over dit onderwerp. Je kunt ook altijd zelf de tools gaan ontdekken. Zo gebruikte ik Orange en Dataiku welke beide gratis versies aanbieden om wiskundige modellen te trainen. Orange biedt ook een gebruiksvriendelijke onboarding inclusief filmpjes.

Veel makkelijker is het natuurlijk om over jouw vraagstukken te sparren met Traffic Builders. Wij kijken er naar uit om aan de slag te gaan met jouw e-commerce en CRM-data voor waardevolle inzichten!