Wat is een cohortanalyse?

Een ‘cohort’ wordt omschreven als ‘een groep personen die een bepaalde actie binnen een bepaald tijdsvak voltooid’. Binnen de wereld van Web Analytics zou een cohort dus bijvoorbeeld kunnen zijn: ‘Alle gebruikers die in Januari 2015 voor het eerst onze website bezochten’. Een cohort heeft dus veel overeenkomsten met een segment, maar heeft altijd een tijdcomponent in zich. 

Zodra een cohort bepaald is, kunnen we aan de slag met de daadwerkelijke cohortanalyse. 

Stel; we runnen een online software tool. Om meer potentiële leads te werven besluiten we een 30 dagen gratis trial weg te geven aan de lezers van een relevant vakblad. De actiecode is 1 week geldig.

Het valt te verwachten dat we in deze week veel nieuwe bezoekers en relatief veel nieuwe klanten (die gebruik maken van de gratis trial) ontvangen. Om echter iets zinnigs te kunnen zeggen over de daadwerkelijke waarde van deze nieuwe bezoekers en klanten, zullen we ze moeten volgen in een cohort. Dit cohort vergelijken we met de weken waarin we geen actiecode uitgaven.

Dit is wat het nieuwe Cohortanalyse rapport van Google Analytics ons laat doen. 

 

Hoe werkt dit in Google Analytics?

Het nieuwe (beta) rapport zit onder het kopje ‘Audience’  (in het Nederlands ‘Doelgroep’). Het kan zijn dat je dit rapport nu nog niet ziet.

 

Vervolgens zie je het scherm openen wat bestaat uit 3 delen:

 

Cohortcontroles 

Dit zijn de variabelen die je kunt gebruiken om je  cohort te wijzigen. 

1.     Cohort Type
Dit is waar het cohort op gebaseerd is. Vooralsnog geeft Google Analytics alleen de mogelijkheid om het cohort te baseren op ‘Acquisitie Datum’. Dit wil zeggen dat Google Analytics mensen toekent aan ‘het cohort 12 maart’ als 12 maart je eerste bezoek was aan de website.
Erg belangrijk is om te begrijpen wat Google Analyics een gebruiker noemt, niet overeen komt met een daadwerkelijke persoon. Een gebruiker is in feite een cookiebestand. Als men dus meerdere apparaten gebruikt of tussentijds cookies wist, ziet Google Analytics dit allemaal als losse gebruikers. 

2.     Cohort Size
De grootte van het cohort is in te stellen op Dag, Week en Maand. De selectie die je hier maakt heeft ook invloed op selector nummer 4: Date Range. Voor ons eerder genoemde voorbeeld met de actiecode die een week geldig is, zou de selectie op weekniveau logisch zijn.

3.     Cohort Metric 
Dit is het ‘event’ waar we het cohort op gaan beoordelen. Standaard staat dit op ‘retentie’ ingesteld; hoeveel gebruikers die op dag X binnen kwamen zijn terug gekomen op dag Y.
Je kunt echter ook besluiten om te focussen op transacties per gebruiker of revenue per gebruiker. We zijn immers niet perse geïnteresseerd in meer bezoekers, maar in meer transacties en omzet.

4.     Cohort Date Range
Als laatste stel je de date range in. Zoals eerder gezegd is deze variabel en afhankelijk van je keuze bij optie 2. Indien je voor een cohort grootte per dag hebt gekozen, zijn je date range opties 7, 14, 21 en 30 dagen. Als je voor een cohort van een week hebt gekozen krijg je de keuze uit 1, 3, 6, 9 of 12 weken. Indien je voor een maand hebt gekozen gaat het om 1, 2 of 3 maanden. Dit is het tijdsvak wat je terug kunt zien. Een erg belangrijk punt om bewust van te zijn is dat je dit rapport dus altijd slechts op de laatste 90 dagen (3 maanden) kunt gebruiken. 

Cohortgrafiek

 

Zodra je de controls naar wens hebt ingesteld, zie je de grafiek eronder verschijnen of veranderen. Deze grafiek neemt het gemiddelde van alle cohorten die je bekijkt en plot deze voor je. Als je wilt kun je ook specifieke cohorten plotten door op de knop te drukken waar nu ‘1 selected’ staat.

In dit geval is de gebruikersretentie per dag over de laatste 7 dagen geplot. Dag 0 heeft een retentie van 100%, aangezien dit de dag is waarop de bezoeker voor het eerst de site bezocht. Dag 1 heeft een retentie van ±5% wat dus wilt zeggen dat gemiddeld genomen over de laatste 7 dagen, 5% van de bezoekers een dag na het initiële bezoek terug kwam op de website.

 

De tabel onder de grafiek is echter veel interessanter. Hier zien we in de meest linker rij alle cohorten en vervolgens de gebruikers retentie per specifiek cohort. Dankzij de kleurcodering kun je al snel kijken waar potentiële afwijkingen zitten. 

Cohorten + segmenten (een tipje van de sluier)

Het wordt pas echt interessant als we onze cohortanalyse gaan segmenteren. Je past deze segmenten op dezelfde manier toe als op andere rapporten (bovenaan het rapport).

Zo zou je bijvoorbeeld kunnen onderzoeken waarom een bepaald cohort (bijv. van een bepaalde week) voor een hogere gebruikersretentie zorgt. Om dit te doen is de eerste logische stap om te zetten het verkeer op te splitsen naar herkomst. Als voorbeeld heb ik hier onder het verkeer vanuit de email nieuwsbrief gesegmenteerd.

 

Voor deze blogpost laat ik het hier bij. Ik hoop dat je geïnspireerd bent geraakt om zelf eens met dit rapport aan de slag te gaan en meer inzichten uit je gebruikers te halen!
 
Mocht je vragen hebben schroom dan niet om ze te stellen in de comments onder deze blogpost, of om me op Twitter aan te spreken via @rickdronkers.
 
Over Rick Dronkers

Rick DronkersRick is een auto-didact en entrepeneur. Hij maakte op jonge leeftijd al websites en rolde als webmaster via advertentie en affiliate netwerken in de wereld van online marketing. Sinds 2009 helpt hij klanten met het realiseren van hun online doelstellingen.

Bij Maxlead vertaalt Rick de web analytics van onze klanten naar toepasbare marketing adviezen.