Expressions régulières dans les filtres Google Analytics

Utilisation des expressions régulières dans les filtres Google Analytics

1- Expressions régulières : Introduction

Les expressions régulières REGEX (regular expression) est un système conçu pour traiter des chaînes de caractères.
Google Analytics prend en charge REGEX dans les filtres pour trouver des données précises et exécuter une action lorsqu’une correspondance est trouvée.

2- Caractères utilisés dans les expressions régulières

Les explications ci-dessous s’appuient sur les exemples d’URL suivants :
http://www.ohmyweb.fr/
http://www.ohmyweb.fr/services/
http://www.ohmyweb.fr/services/formations/
http://www.ohmyweb.fr/services/formations/analytics/
http://www.ohmyweb.fr/services/formations/prestashop

  • Barre oblique inverse ( )

permet « d’échapper » n’importe quel caractère spécial. Elle est très souvent utilisée devant un point, notamment dans les URL et adresses IP.
Par exemple :
ohmyweb.fr s’écrit ohmyweb.fr,
l’adresse IP 65.66.67.68 s’écrit 65.66.67.68.
le répertoire ohmyweb.fr/services/ s’écrit ohmyweb.fr/services/

  • Point ( . )

le point est un caractère générique qui remplace n’importe quel autre caractère.
Par exemple .eu donne comme correspondance feu, leu, peu. Si on veut que la correspondance se limite à .eu, il faut donc échapper le point et rédiger ainsi .eu

  • Astérisque ( * )

est utilisé pour établir des correspondances avec de multiples occurrences du caractère précédent, y compris, parmi ces occurrences, l’absence du caractère lui-même . Par exemple 64* correspond à 6, 64, 644, 6444 etc ….

  • Signe plus ( + )

est utilisé pour établir des correspondances avec de multiples occurrences du caractère précédent sachant que, contrairement à l’astérisque, le caractère doit toujours être le dernier caractère de l’occurrence. Par exemple 64+ correspond à 64, 644, 6444 etc ….

  • Point d’interrogation ( ? )

est utilisé pour établir des correspondances avec aucune ou une seule occurrence du caractère précédent. Par exemple 64? correspond à 6 et 64

  • Barre verticale ( | )

est utilisé pour établir des correspondances avec l’opérateur logique OU . Par exemple 6|4 correspond à 6 ou 4

  • Accent circonflexe ( ^ )
    point d’encrage d’ouverture utilisé pour limiter les correspondances obtenues par Analytics à partir de l’expression saisie.

    • Si l’on rédige l’expression ainsi : ^/formations/,
      Analytics fera la correspondance avec /formations/analytics/, /formations/prestashop/
    • Si l’on rédige sans l’accent circonflexe : /formations,
      Analytics fera la correspondance avec /formations/analytics/, /formations/prestashop/ mais également avec /services/formations/