User:AccountManager/Sécurité & Exploitation

Filtrage du bruit de trafic (Cloudflare Analytics)

Contexte

Le site wiki-shangri-la.org est un wiki éditorial basé sur MediaWiki, avec un trafic humain relativement faible mais une exposition naturelle à des requêtes automatisées (robots, scans passifs, accès génériques à l’entrée MediaWiki).

Dans ce contexte, les métriques de trafic brutes fournies par les outils CDN/WAF ne reflètent pas directement l’activité humaine intentionnelle.

---

Objectif

L’objectif de cette règle est d’approcher le trafic humain réel sans bloquer l’accès aux lecteurs légitimes, en distinguant le signal utile du bruit automatisé.

Cette règle est utilisée à des fins d’analyse et de pilotage, et non pour produire des statistiques exhaustives.

---

Règle de filtrage analytique

Afin de réduire le bruit généré par :

  • robots de découverte
  • scans passifs
  • accès automatisés à l’entrée MediaWiki

les chemins suivants sont exclus des analyses de trafic humain dans Cloudflare Analytics et Real User Monitoring (RUM) :

  • /
  • /mw19/index.php

Ces chemins concentrent une part importante de requêtes automatisées qui ne poursuivent pas la navigation vers des pages éditoriales.

---

Justification technique

MediaWiki expose index.php comme point d’entrée générique. De nombreux agents automatisés s’arrêtent à ce niveau sans demander de page spécifique.

Les accès humains intentionnels se caractérisent majoritairement par :

  • des URLs de type /mw19/index.php/Titre_de_page
  • des pages spéciales interactives (ex. Special:Browse, Special:WhatLinksHere)
  • une navigation cohérente et limitée

---

Portée et limites

Cette règle constitue une approximation volontaire du trafic humain réel.

  • certaines visites humaines peuvent s’arrêter sur la page d’accueil
  • l’exactitude absolue n’est pas recherchée
  • l’analyse repose sur la comparaison temporelle des tendances

Les métriques issues de ce filtrage sont interprétées comme des indicateurs opérationnels, non comme des chiffres de fréquentation officiels.

---

Interaction avec la sécurité Cloudflare

Cette règle analytique est cohérente avec la politique de protection réseau du site :

  • des règles Managed Challenge sont appliquées sur :
    • /
    • /mw19/index.php
  • les pages éditoriales restent accessibles sans friction supplémentaire

Il existe une séparation explicite entre :

  • le filtrage analytique du trafic
  • les règles de protection WAF/CDN

---

Statut

  • Décision validée
  • Analyse stabilisée après observation sur plusieurs périodes de 24 heures
  • Révision uniquement en cas d’évolution significative du trafic ou de l’architecture