Nouveau Statshot : des indicateurs statistiques inédits pour la Ligue Magnus

magnusDepuis plus de deux saisons à présent, la chronique « Statshot » essaye modestement de mettre en lumière les statistiques de la Ligue Magnus pour vous offrir un complément d’informations parfois technique, parfois ludique, sur les équipes de l’élite française. En comparant les données chiffrées sur plusieurs saisons, ou en recherchant dans les archives du hockey français certains records ou faits étonnants, la volonté a toujours été celle d’aller chercher « plus loin » que les données officielles.

Aussi dans le souci de poursuivre le travail engagé et de compléter encore le panel des statistiques de la Ligue Magnus, Statshot évolue…


Le constat initial part du fait que la fédération génère des données d’ordre uniquement « factuelles », et qu’à ce jour il n’existe pas réellement de tableaux statistiques qui conduisent à des analyses chiffrées des performances sur la glace. En partant de ce postulat, une réflexion a été menée sur les possibilités que nous offrent les chiffres fournis. Une réflexion qui n’a pas été menée seul, puisque la rubrique Statshot se voit cette saison renforcée par l’apport de Mathieu Salaün.

Comme il suit la NHL pour Hockey Archives depuis 2010, il a pu suivre la montée en puissance des statistiques sur les blogs nord-américains, parfois à ses propres dépens. Ainsi, pour son article de présentation des playoffs 2012, il s’est légèrement trompé sur le destin de Los Angeles, l’équipe « très en deçà des attentes » ayant finalement quasi littéralement écrasé tous ses opposants pour remporter la coupe Stanley… Certes, tout le monde peut se tromper mais, rétrospectivement, l’auteur regrette de ne pas avoir prêté plus d’attention au classement du CORSI de la ligue. Il aurait pu y lire que si Los Angeles disposait de la deuxième plus mauvaise attaque de la ligue, c’était principalement à cause d’un pourcentage de tir anémique car l’équipe était une des plus dominatrices de la ligue en termes de tirs. En effet, le CORSI comme le FENWICK sont de simples plus-minus des tirs (cadrés, non cadrés et/ou bloqués selon le mode de calcul) à 5 contre 5.

Certes, dominer aux tirs n’est pas toujours gagner, mais une équipe qui a la plus forte possession du palet a de meilleures chances de gagner un match mais surtout de meilleures chances d’avoir des bons résultats sur le moyen terme. Pour avoir une idée exacte de la possession du palet, il faudrait chronométrer le temps passé avec le palet pour chaque équipe, ce qui est évidemment très compliqué. Afin d’avoir une idée de cette donnée de possession, on suppose que plus une équipe a le palet, plus elle est va tirer vers le but, même si le tir est inoffensif, d’où le calcul de statistiques à partir des tirs. Il faut donc voir ce type de statistiques comme des indices de potentiel d’une équipe.

Il est très vite apparu comme évident que l’immense majorité des statistiques américaines ne pouvaient être transposées au championnat de France. La raison tient au fait que dès le départ, nous ne disposons pas de chiffres aussi complets, malgré les derniers efforts faits en la matière par la fédération : la mise en place des feuilles de « jeu en direct », quand elles sont correctement tenues, y contribue, mais beaucoup de données font encore défaut par rapport à l’exhaustivité du play-by-play des matchs de la NHL.

Toutefois après réflexion, nous avons constaté que nous étions en mesure de constituer deux indices dont l’utilisation est inédite dans le hockey français : le PDO, application directe d’un indice utilisé en NHL, et l’IPP (Indice de Possession du Palet), inspiré du CORSI américain mais adapté aux données françaises disponibles. Voila en quoi consiste ces deux indices, ainsi que leur modalité de calcul :

IPP : Pour parvenir à calculer un équivalent du CORSI ou du FENWICK, il aurait fallu que nous disposions des tirs lancés non cadrés et des tirs bloqués, ce qui n’est pas possible pour le moment. Nous utilisons donc ce que nous avons sous la main, c’est à dire des tirs cadrés. Plus précisément, il s’agit des tirs cadrés à 5 contre 5 car c’est dans ces situations que l’on peut juger de la capacité d’une équipe à faire le jeu. Il nous faut donc enlever à chaque match les tirs cadrés en supériorité ou en infériorité numérique (ainsi que les buts en cage vide). Afin d’avoir un résultat plus précis, il faudrait limiter les mesures au périodes où le score est serré (comme ce qui est fait pour le “FENWICK Close”) car c’est à ces moments-là que la domination est la plus significative. Le résultat apparaît sous forme de pourcentage, qui correspond à la part des tirs de l’équipe sur les tirs globaux. Cela signifie que, si une équipe est créditée d’un IPP de 55%, c’est qu’elle a tiré 55% des tirs cadrés à 5 contre 5 de ses matchs (contre 45% en moyenne pour ses adversaires).

PDO : La chance est un facteur toujours important dans le sport, même si ses effets finissent par s’estomper dans le temps. Le principe du PDO est de voir quelles sont les équipes qui sont potentiellement en “sur régime” ou en “sous régime” par rapport à leur chance. Ainsi, on estime que le pourcentage de tirs standard d’une équipe à 5 contre 5 est de 10%, tandis que le pourcentage d’arrêts est de 90% (en NHL). Si les pourcentages de tirs et/ou d’arrêts d’une équipe s’éloignent de ces standards, on peut certes penser que l’équipe est particulièrement bonne dans ce domaine mais aussi qu’il s’agit d’une période de chance aiguë qui ne durera pas. Le PDO standard est de 1000 (qui correspond à 10% de tirs + 90% d’arrêts), si le PDO d’une équipe est supérieur à 1000, cela signifie donc que l’équipe est potentiellement en sur régime et qu’il faut peut-être s’attendre à une baisse des résultats. Inversement si le PDO est très en dessous de 1000. C’est le cas si une équipe a un pourcentage de tirs de 5% et un pourcentage d’arrêts de 88% (PDO = 930).



Outre le suivi tout au long de la saison de l’évolution de ces indices, Statshot proposera également des classements inédits, des comparatifs… Bref un ensemble de données inabordées jusqu’alors. Le choix a été fait (et il est vrai, aussi un peu faute de « matière première » dans l’autre cas), de se concentrer uniquement sur les statistiques collectives dans un premier temps, au détriment des statistiques individuelles.

Afin d’anticiper d’éventuelles remarques qui reviennent assez fréquemment dans les discussions au sujet des statistiques sportives, nous précisons tout de suite (comme ce fut d’ailleurs toujours le cas dans les précédents Statshot) qu’il est effectivement important d’aborder ces indices et toutes autres données avec un nécessaire recul.

En effet, le travail s’appuie sur une base de données qui peut, le cas échéant, être légèrement défaillante selon que les feuilles de match et autres « jeu en direct » sont correctement tenus ou non. Nous avons fait le choix de la transparence, en éliminant purement et simplement les bases de données qui nous auront posé problème (manque d’informations, erreurs grossières, problèmes techniques…). Nous préciserons d’ailleurs les rencontres qui sortent du cadre de nos calculs d’indices.

Pour autant, nous continuons de penser qu’à défaut d’obtenir des résultats qui s’appuient sur 100% des rencontres de chaque équipe, les tableaux que nous avons mis en place pourront nous offrir des éléments d’analyse intéressants et pertinents. A terme, nous espérons que les chiffres donnés dans l’aspect « perspectives pour la suite de la saison » (comme autour du PDO) pourront créer des tendances qui se vérifieront dans la continuité de la compétition. Par exemple, l’an passé, il semblait difficile en regardant le classement de la saison régulière de Magnus d’imaginer un bon parcours pour Grenoble en playoffs. Mais en regardant un diagramme des tirs cadrés de l’équipe (tirs cadrés en toute situation, pas simplement à 5 contre 5) (voir ci-dessous), on aurait pu s’apercevoir que les Brûleurs de Loups figuraient avec le trio de tête (Angers, Rouen et Briançon) parmi les équipes les plus dominatrices de la ligue. Bien entendu, ce diagramme ne nous aurait pas permis de déterminer le champion (pas plus de dire qui descendrait en D1), mais on aurait pu souligner que Grenoble avait un classement bien en deçà de son potentiel réel.
graph tirs lm 12-13


Nous en sommes au « niveau zéro » de l’analyse statistique, tout est à faire en ce sens, mais nous avons l’ambition de faire profiter aux passionnés de la mise en place de ces nouveaux outils. Alors nous espérons que vous porterez un intérêt croissant à notre démarche. Bienvenue aux statistiques Magnus 2.0 !