L’analyse basée sur les sessions est-elle passée à la trappe ? Non. Voici pourquoi.

Written by Aleksandra Szczepańska

Published juillet 18, 2023

À partir du 1er juillet 2023, les propriétés Universal Analytics (UA) standard cesseront de traiter les nouveaux résultats. Cette nouvelle fait suite au plan de Google de mettre fin à l’UA et de le remplacer par sa solution de mesure de nouvelle génération : Google Analytics 4 (GA4).

Vous en avez probablement entendu parler dans le contexte de l’avenir de l’analyse alors que l’analyse basée sur les sessions est censée passer à la trappe.

Une idée que nous allons remettre en question dans cet article, tout en passant en revue les portées de l’analyse. Vous y trouverez également des cas d’utilisation pour lesquels le modèle basé sur la session pourrait s’avérer mieux adapté que le nouveau.

Session vs événement

Alors que Universal Analytics (une plateforme basée sur les sessions) et Google Analytics 4 (une plateforme basée sur les événements) fonctionnent tous les deux sur les événements et les sessions, ils sont configurés et comptabilisés différemment.

Une plateforme d’analyse basée sur les sessions utilise ces dernières comme base de tous les rapports. Une session fait référence à diverses interactions dans un laps de temps donné (généralement 30 minutes) et peut être considérée comme une boîte contenant toutes les actions d’un utilisateur effectuées sur votre site. 

Des plateformes comme Universal Analytics vous permettent également de suivre des événements spécifiques au sein de votre page, tels que les clics ou les défilements. Cependant, il faut d’abord les configurer.

Les modèles de mesure des données basés sur les événements offrent une vue plus centrée sur l’utilisateur des données au-delà des sessions de suivi et des pages vues. Alors que des éléments tels que les pages vues, le repérage du temps passé par les utilisateurs et les vues d’application/d’écran sont classés comme des types d’appels dans les analyses basées sur les sessions, dans ce modèle ils sont tous classifiés d’événements. Dans GA4, une session est un certain nombre d’événements type « session_start. » Le calcul de la session se fait côté client. Dans UA, en revanche, celui-ci est effectué sur le serveur lors du traitement. Les événements (nommés « appels ») qui appartiennent à la même session peuvent être regroupés via des segments de session. GA4 n’a pas cette portée car il ne regroupe pas les événements appartenant à la même session.

Si vous êtes intéressé par les différences entre l’analyse basée sur les sessions et l’analyse basée sur les événements, consultez l’article : Universal Analytics vs. Google Analytics 4: Data models and other key differences explained

Portées en analyse

Les portées sont indispensables pour saisir la différence entre les deux méthodes d’analyse.

La portée est la façon dont une plateforme d’analyse collecte et formate les données qu’elle reçoit. Elle a un impact significatif sur la façon dont vos données analytiques sont structurées et sur les résultats avec lesquels vous travaillez. Observons comment fonctionnent les portées dans les analyses basées sur les sessions et sur les événements.

Il existe quatre façons dont les plateformes d’analyse comme Universal Analytics évaluent les dimensions et métriques :

  • Portée définie au niveau de l’utilisateur – examine les données concernant les sessions agrégées et les appels d’un utilisateur (un appel est un événement, une page vue, etc.). Cela vous permet de saisir l’intégralité du parcours de l’utilisateur.
  • Portée définie au niveau de la session – regroupe les appels au cours de la session. Une « session » complète sera enregistrée à partir du moment où un utilisateur entre sur le site jusqu’à son départ, avec tous les appels réalisés dans ce laps de temps.
  • Portée définie au niveau de l’appel (événement) – capture chaque visionnement ou interaction sur le site pour mieux comprendre le comportement de l’utilisateur.
  • Portée définie au niveau du produit – spécifiquement destinée à l’utilisation du commerce électronique. Celle-là montre le comportement en fonction des produits spécifiques, comme les transactions ou les revenus de produits.

Vous pouvez découvrir les règles de portée lorsque vous créez des rapports personnalisés. Comme chaque dimension et métrique a une portée (niveau utilisateur, niveau session, niveau appel), vous ne pouvez pas combiner les dimensions et les métriques de différentes portées. 

Les portées constituent une structure hiérarchique : les appels remontent aux sessions alors que ces dernières remontent aux utilisateurs. Pensez à la portée dans Universal Analytics comme un moyen de comprendre le parcours, le road trip de vos données.

Dans Google Analytics 4, la portée fait référence à la façon dont les dimensions personnalisées sont définies. Elle délimite également la manière dont Google Analytics doit collecter et organiser les données.

Pour les dimensions personnalisées, il existe trois types de portées :

  • Dimensions personnalisées avec portée définie au niveau de l’événement
  • Dimensions personnalisées avec portée définie au niveau de l’utilisateur
  • Dimensions personnalisées avec portée définie au niveau du produit

GA4 n’a pas de portée d’appels et de session – l’appel a été remplacé par la portée de l’événement et il n’y a pas de portée de session. Une mesure personnalisée, elle, a toujours une portée d’événement.

En raison des différences dans les modèles de mesure et les portées, le nombre de sessions diffère entre les deux types de plateformes d’analyse.

Pourquoi les sessions restent-elles l’unité de mesure la plus fiable ?

Les données avec portée définie au niveau de la session ne sont pas une unité temporelle de mesure idéale, car les gens peuvent s’arrêter au milieu de l’achat et y revenir dans ce qui est techniquement une nouvelle session. Considérez le scénario suivant : à quel moment ce laps de temps se termine-t-il, si l’utilisateur ne peut pas trouver ce qu’il cherche et abandonne le site, puis revient pour commander un autre produit non relié au premier ? Dans ce scénario, les deux parcours d’achat seraient combinés. Manifestement, toute division arbitraire n’est jamais une solution universelle.

Travailler avec des données de portée utilisateur peut signifier le besoin d’utiliser un très long laps de temps de tout ce qu’un utilisateur a fait dès la première interaction avec votre page. Prenons l’exemple d’un site Web vendant des billets de concert. Les utilisateurs peuvent trouver votre site Web lors de la recherche de billets de concert, mais quitter sans acheter. Cependant, après de nombreux retours et compte tenu de leurs capacités financières et des prix des billets concurrents, ils achètent enfin les billets chez vous. À cette étape, l’utilisateur peut revenir sur votre site pour consulter d’autres concerts. Tous les points de données collectés sur cet utilisateur seront analysés au niveau de l’utilisateur tout au long de son activité sur votre site.

Certes, limiter ce laps de temps à « jusqu’au prochain achat » peut être utile, mais de cette façon vous combinez toujours les achats non terminés avec ceux qui le sont, ce qui fausse vos données. Et n’oubliez pas que les gens utilisent également différents dispositifs et navigateurs, ce qui peut également introduire du biais.

Enfin, il y a également le côté vie privée. En effet, la portée définie au niveau de l’utilisateur n’est pas respectueuse de la confidentialité : malgré certains changements dans les paramètres de confidentialité, Google Analytics 4 recueille toujours des données personnelles (identifiants utilisateur uniques). En revanche, avec la portée définie au niveau de la session et à l’aide d’un suivi anonyme, vous pouvez effectuer des analyses utiles sans données personnelles. Dans ce cas, la plateforme d’analyse déploie un identifiant de session en tant que cookie qui collecte des données de session sans données personnelles. Après 30 minutes, ce qui correspond à la durée d’une session, Piwik PRO supprime l’identifiant du navigateur Web.

Lukas Oldenburg

Expert en analyse numérique. Propriétaire de dim28.ch.

« Certains affirment que nous sommes passés de l’analyse axée sur les sessions à l’analyse axée sur les utilisateurs. Or, cette conception s’avère erronée. 

Les utilisateurs peuvent avoir des intentions différentes lorsqu’ils visitent votre site (par exemple, acheter des vêtements, se renseigner sur les offres, contacter le service client). Donc, dans un monde idéal, nous pourrions analyser le comportement des utilisateurs dans de tels délais d’intention, une tâche qui s’avère pourtant impossible à accomplir avec n’importe quel outil. La portée de la session reste donc notre hypothèse la plus proche du délai d’intention dans la plupart des cas. 

De plus, dans un monde de nombreux appareils, de restrictions de navigateur et de réglementations en matière de confidentialité, la session est la seule unité qui peut être mesurée de manière cohérente partout. »

Plongeons plus en détails et examinons quelques cas d’utilisation.

Cas d’utilisation de l’analyse basée sur les sessions

Le modèle basé sur les événements vous fournit une métrique centrée sur le client. Étant donné que celle-ci est basée sur les données de plusieurs points de contact, elle peut offrir une image plus complète de l’entonnoir de l’acheteur, surtout si plusieurs étapes d’un entonnoir de conversion peuvent être effectuées lors de visites distinctes. Cela dit, si vous êtes un professionnel de marketing, les sessions continueront à jouer un rôle important dans votre recherche des cas d’utilisation cruciaux. Voici quelques exemples :

Marketing omnicanal

L’analyse par session est essentielle pour le marketing omnicanal qui implique plusieurs points de contact avec différentes sources et canaux (chaque session aura un canal/une source attribué(e) par lequel/laquelle l’utilisateur est entré sur le site). Dans ce cas, il semble impossible d’échapper au concept d’une session. Après tout, une session est un agrégat, dont l’utilisation permet d’économiser beaucoup de temps et de ressources. 

Les modèles de données basés sur les sessions offrent un riche ensemble de rapports intégrés tels que des rapports d’acquisition, grâce auxquels vous pouvez obtenir des données et des informations sur la façon dont les gens trouvent votre site Web. Cela les rend simples, accessibles et pratiques pour les professionnels qui ne sont pas profondément immergés dans l’analyse.

Analyse du parcours utilisateur

Commerce électronique

Imaginons que vous avez une boutique en ligne avec divers produits de différentes catégories et des clients réguliers. Vous souhaitez rendre compte de leurs interactions avec votre assortiment. 

Un client visite votre site et achète un produit de la catégorie des produits alimentaires. Quelques jours plus tard, il retourne à la recherche d’un produit de la catégorie des articles ménagers mais ne trouve rien qui lui convient et quitte le site. Le même utilisateur a donc effectué deux visites. Cependant, il est préférable de les examiner séparément, étant donné qu’elles présentent différents parcours et intentions.
 
Vous pouvez compter chaque appel (disponible dans GA4). Vous pouvez également compter une fois par session (UA ne le propose pas pour le commerce électronique, mais cette option est toujours disponible pour les objectifs) ou une fois par utilisateur.
La portée de la session peut être plus précise dans ce cas. En effet, la portée de l’appel est trop large, car elle compte chaque rechargement et chaque va-et-vient d’utilisateurs indécis. Si vous souhaitez identifier la catégorie qui jouit du plus de trafic, il faudrait vous concentrer sur la portée de la session. 

D’autre part, la portée définie au niveau de l’utilisateur semble trop limitée, en particulier dans le contexte des rapports de conversion. Celle-là n’autorise que les conversions basées sur des événements, ce qui signifie que tous les objectifs de consultation de page doivent être envoyés en tant qu’événement à GA4 avant qu’ils puissent être suivis en tant qu’une conversion.

Pages de grande valeur ou soumission de formulaire réussie

Si suite à une soumission, votre formulaire vous redirige vers une page de remerciement ou similaire, il est fort probable que vous avez défini vos objectifs de formulaire dans Universal Analytics. Dans ce cas, il est également difficile d’échapper à la notion de session. Vous pouvez générer des rapports et analyser le taux de conversion de chaque source de trafic pour chaque objectif. Vous pouvez utiliser le point de « fin de session » pour analyser et optimiser le taux de conversion.

Par exemple, le rapport des objectifs URL identifie les URL où la plupart des objectifs sont complétés. Ce rapport affichera souvent l’URL que vous avez attribuée comme l’étape où votre objectif est atteint (par exemple, un formulaire d’inscription pour la page de remerciement). Et si vous utilisez des événements pour définir des objectifs, ce rapport devient encore plus utile, car il révèle les éléments du site Web contribuant aux conversions les plus élevées. Avec le code implémenté sur chaque page de site Web, vous pouvez collecter des données sur les clics, les liens, les profils de médias sociaux et plus.

Les conversions GA4, elles, sont bien différentes. Les objectifs en tant que conversions ne sont pas basés sur des URL. Par exemple, vous ne pouvez pas utiliser le point de « fin de session » de la même manière que dans UA, étant donné que dans l’analyse basée sur les événements il est difficile de localiser les points d’abandon sans sessions. Toutes les conversions constituent des événements. Pour définir un événement en tant qu’une conversion, il faut le marquer comme conversion dans les événements existants. Étant donné que les conversions sont basées uniquement sur des événements, vous avez besoin d’outils tels que Google Tag Manager.

Lorsque vous souhaitez suivre facilement les visites des pages les plus rentables ou les soumissions de formulaires réussies, les événements présentent un autre défi majeur. En effet, ceux-ci ne sont utiles qu’à partir de la date à laquelle vous les avez mis en œuvre pour la première fois. En revanche, si vous souhaitez faire une analyse de la façon dont quelqu’un a traversé votre entonnoir, vous n’aurez pas de données remontant au début de l’historique de votre produit. Alors que certaines plateformes commencent à mettre cette solution en place, il convient de noter son coût important, à la fois en termes de prix et d’ingénierie.

Données précises et contrôle des données

Les navigateurs traitent les cookies différemment. Safari supprime votre cookie JS habituel après 7 jours. Dans Chrome, les cookies sont gardés jusqu’à 400 jours. Or, même si les cookies “immortels” semblent être partout, n’oublions pas que nous vivons dans un monde de multiples dispositifs : le même utilisateur peut rapidement effectuer une session sur de nombreux matériels et navigateurs différents. Bien que certaines entreprises aient la capacité financière d’établir un lien entre chaque ou au moins la plupart de ces dispositifs et un utilisateur, ce sont toujours des exceptions.

Puisque la portée de la session n’est pas impactée par la courte durée de vie des cookies, vos données sont plus précises et plus fiables. 

Afin de compenser l’abandon des cookies tiers, GA4 s’appuie davantage sur les données échantillonnées et l’apprentissage automatique. Ce dernier est utilisé pour modéliser les analyses manquantes des utilisateurs qui ne consentent pas aux cookies. Cela peut entraîner des inexactitudes dans les rapports, surtout si vous avez besoin d’une segmentation détaillée. L’échantillonnage des données, lui aussi, ajoute davantage de conjecture à vos rapports, ce qui signifie que vous ne pouvez pas avoir 100 % de confiance dans l’exactitude des données.

En outre, les cadres de confidentialité tels que le RGPD examinent les identifiants adhésifs pour les utilisateurs. L’interprétation du RGPD par la CNIL française autorise certains outils d’analyse sous réserve que ceux-ci limitent le suivi aux seuls cookies de session. En raison de la prolifération des dispositifs, des restrictions de navigateur et des réglementations en matière de confidentialité, les sessions deviennent de plus en plus la seule unité de mesure fiable. Par contraste, les données reposant sur les utilisateurs sont devenues de plus en plus inexactes.

Pour toutes ces raisons, constater que l’analyse centrée sur l’utilisateur basée sur les événements constitue l’avenir de l’analyse serait un peu tiré par les cheveux. Les deux types d’analyse ont leurs cas d’utilisation.

Dernières réflexions sur les utilisateurs vs sessions

L’analyse basée sur les sessions est-elle passée à la trappe ? Nous ne sommes pas encore à cette étape-là. Contrairement à l’idée reçue, les sessions ne sont pas toujours essentielles dans de nombreuses circonstances. Cela ne changera pas dans un avenir proche.

Mesure de la performance marketing

L’analyse basée sur les sessions vous permet d’évaluer facilement les performances de vos canaux marketing. Les rapports d’acquisition de trafic sont particulièrement utiles pour comprendre les performances des sources de trafic par rapport au nombre total de sessions sur le site et pour générer des conversions. Le rapport Source/Medium vous permet de comprendre les performances des différentes sources et moyens de trafic. Vous pouvez également trouver nos recommandations dans la partie Acquisition des rapports All Traffic et All Referrals. Enfin, vous pouvez utiliser les informations sur le moment de « début de la session » (où l’utilisateur a trouvé le site Web) pour optimiser les campagnes marketing.

Facilité d’utilisation

Les plateformes d’analyse axées sur les utilisateurs comme GA4 semblent être construites davantage comme des outils pour collecter beaucoup de données, une grande partie de l’analyse ayant lieu en dehors de la plateforme. L’analyse de votre entonnoir peut s’avérer difficile si vous avez à combiner des données provenant de différentes sources. Pour avoir une vue d’ensemble, en revanche, il serait préférable de consulter les données de votre produit ou de votre entrepôt de données. Cela peut être efficace pour certains, mais de nombreuses personnes travaillant avec des données peuvent se sentir débordées devant l’ampleur de la tâche.

La courbe d’apprentissage, elle aussi, est plus abrupte. Ces plateformes sont plus difficiles à utiliser si vous n’êtes pas un analyste expérimenté. Obtenir des mesures et des dimensions avec l’analyse basée sur les événements est également plus difficile. Même si toutes les données sont disponibles, les analystes web professionnels utilisant les données brutes peuvent avoir du mal à créer des requêtes avancées pour générer des rapports basés sur les données de session qui ont été suivies comme un événement.

Conclusion ? Se centrer sur l’utilisateur présente de multiples défis, dont : la vaste gamme de plateformes et de dispositifs, le besoin de lancer des équipes spécialisées et d’acquérir des outils d’analyse spécifiques, la difficulté à centraliser la structure des données. Or, l’analyse orientée vers l’utilisateur peut être toujours utile pour les chefs de produit car les options et les capacités de visualisation des données, par exemple, dans GA4, sont bien adaptées à l’analyse des produits. Toutefois, si vous êtes un spécialiste du marketing, l’analyse orientée sur les sessions est la meilleure solution pour effectuer des analyses de site Web précises qui contribuent à améliorer les décisions marketing et, par conséquent, à obtenir un meilleur retour sur investissement.

Existe-t-il une alternative ?

Il existe des plateformes modernes qui gèrent les sessions et les événements de manière transparente, si vous avez besoin d’une alternative à GA4 centré sur l’utilisateur. Celles-ci vous permettent d’utiliser tous les événements de vos rapports avancés, tels que les entonnoirs et les flux d’utilisateurs. En même temps, elles favorisent l’agrégation au niveau de la session et des dimensions que vous connaissez grâce aux analyses classiques basées sur les sessions.

De plus, certaines plateformes comme Piwik PRO sont fondées sur le respect de la vie privée. Elles disposent d’un gestionnaire de consentement intégré qui facilite la conformité aux lois telles que le RGPD ou la loi TTDSG.

Vous pouvez également avoir un contrôle total sur les données que vous collectez. Ainsi, avec un hébergement de données flexible, vous avez la possibilité d’utiliser l’analyse dans plus de contextes sans violer la vie privée des utilisateurs. Cela devrait devenir votre priorité dans ce monde actuel, où l’efficacité de la collecte de données doit être accompagnée de la sécurité et de la protection des données.

Consultez nos comparaisons de produits pour optimiser le choix de logiciel d’analyse Web. Vous y trouverez les caractéristiques essentielles de tous les produits et découvrez en détails leur importance du point de vue juridique, technique et pratique :