HA
top

Petit guide des statistiques partie III : l’analyse des joueurs

525

Troisième et dernière partie de petit guide de l’utilisation des statistiques en hockey, consacrée à l’analyse individuelle des joueurs. Comment les stats peuvent-elles aider à différencier un joueur du collectif? Quels sont les indicateurs à regarder et comment les comprendre ? Comment prendre en compte les différents rôles joués au sein d’une équipe.

Retrouvez la première partie, « À quoi servent les stats » ici.

Retrouvez la deuxième partie, « Analyse les équipes » ici.

 

Partie III : Analyser la performance des joueurs

Avec l’analyse des joueurs, nous entrons dans la portion la plus ardue et la plus débattue de l’utilisation des statistiques avancées. Certains diront qu’un humain ne peut être défini par des chiffres, mais les statistiques historiques (points, mises en échec, temps de glace, etc.) ont été utilisées depuis des décennies pour différencier les champions de la masse, alors pourquoi pas pousser plus en avant ? D’autres argumentent que les statistiques ne peuvent refléter tout l’apport d’un joueur à son équipe, notamment au nom du sacrosaint « leadership » dans le vestiaire.

Loin de vouloir clore le débat, les statistiques utilisées pour les joueurs se concentrent à définir leur efficacité sur la glace, ce qui constitue tout de même la base de leur métier. Et s’il est encore commun d’affubler certains joueurs avec des impondérables invérifiables, tentons au moins de voir ce que l’on peut faire avec les données disponibles.

 

L’utilité des statistiques avancées pour les joueurs  

Pendant longtemps, les joueurs ont été jugés sur leur production offensive. Cependant, celle-ci dépend largement du temps de glace obtenu, de la présence en supériorité numérique, de la réussite momentanée du joueur et de ses coéquipiers, du rôle qui lui est attribué par l’entraineur et de la capacité du système de jeu collectif à maximiser l’attaque. Même avec l’utilisation douteuse des mises en échec et des tirs contrés (voir ci-dessous), il semblait également que la partie défensive du jeu était laissée de côté faute de métriques disponibles. Les statistiques avancées, comme la possession du palet, permettent de voir beaucoup plus loin que les buts et les passes et de définir l’apport global d’un joueur à son équipe.

Par exemple, un joueur très offensif peut récolter beaucoup de points, mais si sa capacité à défendre est nulle, son équipe risque d’encaisser plus de buts qu’il n’en provoque au final. Les meilleurs joueurs de la ligue sont ainsi capables de monopoliser la possession, limitant de facto les chances de l’adversaire tout en maximisant les opportunités pour son équipe. Pour des joueurs de 3e-4e trio dont il ne faut pas attendre qu’ils marquent 30 buts, assurer la possession du palet à leur équipe équivaut à bien remplir un rôle de soutien, une défense efficace et une capacité à terminer ses présences en zone offensive par exemple. En attendant que les gros canons finissent le travail. À l’inverse, des joueurs de fond d’alignement qui subissent le jeu et restent enfermés dans leur propre zone défensive sont autant d’éléments à risque pour leur équipe.

 

Les anciennes statistiques à mettre de côté   

Loin de vouloir faire table rase du passé, certaines statistiques utilisées depuis des décennies recèlent des incohérences de taille et les fans devraient désormais largement s’en méfier.

Plus minus +/- : Le bon vieux plus minus, encore trop utilisé comme unité de référence pour mesurer l’impact offensif/défensif d’un joueur. Si l’intention est bonne, la formule recèle bien trop de failles. Pour commencer, le +/- ne se limite pas au jeu à 5 contre 5, ce qui aurait été tout à fait recevable, mais inclut quelques situations spéciales comme les buts en infériorités numérique (+1 pour l’équipe en infériorité qui marque, -1 pour l’équipe en supériorité qui encaisse un but) et surtout les buts dans une cage vide. Or il ne faut pas sous-estimer le nombre de fois qu’une équipe ayant sorti son gardien en fin de match encaisse un but, ou deux… Autant de -1/+1 pour les joueurs sur la glace, logiquement les meilleurs de l’équipe. Exemple, Alex Ovechkin avait la saison passée un différentiel +/- de +6. Mais si on ne garde que les buts à 5 contre 5, cela montait à +16… Enfin, le +/- repose beaucoup sur le différentiel collectif de l’équipe et des joueurs « passagers » peuvent se retrouver en haut du classement de la ligue. L’an passé 7 joueurs du top 10 appartenaient soit à Minnesota soit à Washington… Voir que Brooks Orpik ou Karl Alzner faisaient partie du top20 en dit long sur la valeur de cette stat.

Mises en échec et tirs contrés : Ces deux stats sont également présentes depuis des lustres dans la ligue et utilisées pour vanter les mérites défensifs de certains joueurs. Le problème est que ces stats reflètent des situations où l’équipe du joueur n’a PAS la rondelle car elle court après. Plus on a de mises en échec ou de tirs contrés, plus on aura passé du temps à défendre, ce qui n’est pas bon signe en soi. Seules environ 20% des mises en échec en NHL mènent à une récupération du palet et les tirs contrés, s’ils sont utiles, ne traduisent rien d’autre qu’un positionnement défensif passif. Et surtout, il n’existe aucun lien direct entre ces actions et le succès des équipes. À prendre donc avec des pincettes.

Interceptions : Cette fois-ci, on tombe presque dans la supercherie grotesque. Les interceptions sont utilisées la plupart du temps pour prouver qu’un joueur est « à risque », sans y mettre aucune autre forme de contexte. Or, la chose évidente est que plus un joueur a souvent le palet, plus il a des chances d’être intercepté de temps à autre. Il suffit de regarder le classement de la saison dernière : Brent Burns a mené la NHL avec 153 interceptions, loin devant Erik Karlsson à 106. Suivent dans ce top10 Petry, Klingberg, Sekera, Carlson, Seabrook, Gaudreau, Doughty et Byfuglien. Une vraie bande de bras cassés… De plus, cette stat est notée manuellement par des personnes de la ligue sur place, ayant plus ou moins la main lourde, comme c’est notoirement le cas à Montréal par exemple. P.K Subban a fait partie du top10 pour les interceptions pendant des années avant de tomber au 66e rang avec Nashville. Shea Weber était 171e à sa dernière saison avec les Predators, avant de monter au 16e rang avec Montréal…

 

Mesurer l’apport global d’un joueur via la possession

Comme pour les équipes, la possession du palet (indicateur « Corsi ») pour un joueur est calculée en pourcentage des tirs tentés (les buts, tirs arrêtés par le gardien, tirs contrés et non-cadrés) pendant qu’il est sur la glace. Chaque fois qu’un tir est tenté par son équipe, le joueur reçoit un +1, chaque fois que l’équipe adverse tente un tir, il reçoit un -1.

Exemple : Patrice Bergeron était sur la glace pour 1199 tirs tentés par Boston en 2016-17 et 762 tirs concédés. Bergeron avait donc un Corsi à 61.1%, le plus haut total de la ligue.

Comme à l’échelle des équipes, chaque joueur peut également être évalué sous l’angle des chances de marquer, qui utilisent le même principe que le Corsi mais uniquement pour les tirs tentés de la zone dangereuse allant des poteaux au haut des cercles de mise en jeu. Et les buts anticipés, qui mélangent quantité et qualité des chances, s’appliquent aussi aux joueurs. Toujours en 2016-17, Bergeron était sur la glace pour 49 buts anticipés en faveur de Boston et 30 contre. Bergeron avait donc un taux de buts anticipés de 61.8%.

 

Les mesures relatives: isoler le joueur des performances collectives

Il est impératif de mettre en perspective taux de possession ou de buts anticipés d’un joueur avec les performances globales de son équipe. Concrètement, ces statistiques brutes dépendent parfois fortement des performances collectives. Faire partie d’un système dominant pour la possession comme Washington garantit presque assurément un bon Corsi tandis que jouer pour Colorado…

Les mesures dites « relatives » calculent la différence d’impact entre un joueur et le reste de ses équipiers, permettant ainsi d’extirper l’individu de la performance collective.

Dans l’exemple ci-dessus, Shea Weber a ainsi enregistré un Corsi très respectable de 51.5% l’an passé, contre un Corsi négatif pour Erik Karlsson, en deçà de 50%. Cependant, compte tenu des forces collectives respectives, le Corsi relatif permet de voir que Karlsson était bien meilleur que le reste de ses coéquipiers à Ottawa quant Montréal s’en sortait mieux sans Weber pour la possession.

Les mesures relatives peuvent ainsi être calculées pour toutes les statistiques avancées ou presque (chances de marquer, buts anticipés, efficacité offensive et défensive, etc.), fournissant une analyse individuelle bien plus pertinente que les données brutes.

 

Efficacité offensive et défensive

Une des dynamiques positives en place au sein de la communauté des amateurs de stats est de promouvoir la capacité à créer ses propres métriques et d’expérimenter de nouvelles analyses, du moment qu’elles tiennent la route bien entendu. Nous avons ainsi cherché sur Hockey Archives à mesurer l’efficacité offensive ou défensive des joueurs. Concrètement, à quel point un attaquant parvient-il à créer des situations dangereuses et comment un défenseur parvient-il à cantonner l’adversaire loin de son but ?

Efficacité offensive = pourcentage des tirs tentés qui sont des chances de marquer

Le principe pour les attaquants est simple : si une équipe parvient à décocher 10 tirs avec le joueur X sur la glace, et que 5 de ces 10 tirs sont des chances de marquer, l’efficacité offensive sera de 50%. Cette métrique met en valeur les joueurs ayant la capacité à placer leurs coéquipiers dans des conditions parfaites ainsi que les joueurs misant sur la contre-attaque, qui par définition permettent de s’approcher du but adverse. Pour atténuer l’impact du système collectif, il est aussi recommandé d’utiliser une mesure relative, comparativement au reste de l’équipe. L’an passé, Johnny Gaudreau était ainsi le plus efficace de la ligue relativement à son équipe, devant Jonathan Huberdeau, Connor McDavid et Ryan Getzlaf.

Efficacité défensive = pourcentage des tirs accordés qui sont des chances de marquer dangereuses

Le principe est le même pour les défenseurs mais évidemment inversé. Si une équipe accorde 10 tirs avec le joueur Y sur la glace, et que 8 de ces tirs ne sont PAS des chances de marquer « dangereuses » (à proximité immédiate du but), l’efficacité défensive sera de 80%. Cette métrique met en valeur les défenseurs et les systèmes de jeu ainsi capables de garder l’adversaire loin du but et de faciliter le travail du gardien. Nous préférons également utiliser ici les mesures relatives pour atténuer les forces ou faiblesses collectives. L’an passé, la révélation Brett Pesce devançait Justin Braun des Sharks, Shea Weber et Radko Gudas.

Notre série de mini-bilans de joueurs publiée cet été reprenait ainsi les deux variables principales : la possession relative et l’efficacité offensive/défensive relative, offrant ce que nous pensons humblement être une vision relativement claire des performances de chaque joueur.

Dans les deux exemples ci-dessus, Shea Weber est chaque année beaucoup plus efficace défensivement que le reste de son équipe, mais celle-ci obtient davantage la possession du palet sans lui. Taylor Hall est, lui, positif pour les deux aspects du jeu, possession et efficacité offensive.

 

Pour aller plus loin : regarder le contexte des performances du joueur

Voici la section objectivement la plus difficile pour les novices des statistiques, et c’est là où les journalistes se doivent d’apporter dans leurs articles le supplément d’information difficilement accessible au lecteur. Ce qui suit est donc principalement indicatif et introduit un vocabulaire que vous retrouverez dans les articles d’ici ou d’ailleurs. Pour ceux d’entre vous qui aimeraient se plonger plus en détail dans les chiffres, vous saurez quoi regarder pour creuser vos recherches.

Utiliser des mesures par 60mn. Ce point est sans doute le plus simple. Que ce soit pour les chiffres bruts de la possession (tirs tentés, concédés, buts anticipés, etc.) ou la production (buts, assists, points), le temps de jeu par match et le nombre de rencontres jouées influencent fortement les résultats. Utiliser les statistiques par 60 minutes met ainsi tout le monde sur un même pied d’égalité. Exemple : l’an passé, Sidney Crosby a inscrit 50 points à 5 contre 5, Evgeni Malkin 41. Malkin a pourtant joué 13 matchs de moins que Crosby. En lissant la production par tranches de 60mn jouées, la production de Malkin dépassait ainsi celle de Crosby (2.84 pts/60mn contre 2.7). On peut de même regarder au sein d’une équipe quel joueur accorde le moins de tirs à l’adversaire par 60mn, ou en obtient le plus pour voir comment chacun joue de chaque côté de la patinoire.

La position du joueur dans l’alignement. Cela n’est pas forcément expliqué par les stats, hormis des différences évidentes dans le temps de jeu au sein d’une équipe. Il est cependant facile de savoir qu’un joueur joue dans un top6 en attaque ou sur une 4e ligne, et qu’un défenseur est de top4 ou de 3e paire. Par exemple, Brayden McNabb des Kings avait l’an passé une solide possession relative de +5.7%, similaire à celle de Hampus Lindholm d’Anaheim. Il est pourtant difficilement concevable de comparer les deux joueurs car McNabb jouait sur une 3e paire alors que Lindholm était le 2e défenseur le plus utilisé par les Ducks. Le même principe vaut pour un attaquant de fond d’alignement versus un joueur de top6. S’il est intéressant de voir des joueurs secondaires s’en sortir aussi bien, il faut donc se montrer prudent avant de sauter au plafond.

Qualité des coéquipiers et de l’opposition. Ceci nous amène tout droit à la qualité des coéquipiers et de l’opposition (les joueurs en face). Une des critiques principales des anti-stats est « oui, mais ils n’affrontent pas les mêmes joueurs ! ». Ou bien : « oui, mais quand tu affrontes Crosby, c’est sûr que tu n’auras pas la possession ». Il est bien-sûr difficile de faire face à Crosby ou McDavid mais ce genre de face à face n’intervient pas tous les soirs, et souvent une seule ligne par équipe est assignée à la couverture des stars adverses. La grande majorité du temps, les meilleures lignes s’affrontent entre-elles et le lignes secondaires se font face. Il n’y a donc pas de raison d’être dominé par un adversaire de talent égal. La QoC (qualité de l’opposition – Competition en anglais) mesure le Corsi moyen de tous les adversaires affrontés sur la glace par un joueur. Or, pour les centaines de joueurs de la ligue, la QoC varie seulement entre 49% et 51%, ce qui montre bien qu’au cours d’une saison, la valeur des adversaires en termes de possession est quasiment la même pour tous. La QoT (qualité des coéquipiers – Teammates en anglais) est plus pertinent car la présence d’un bon/mauvais joueur sur son trio pendant 82 matchs influence logiquement bien plus la performance d’un joueur qu’une opposition dont la qualité va et vient. La QoT variait ainsi l’an passé pour l’ensemble de la ligue entre 43% et 57%. Le pauvre John Tavares jouait ainsi en moyenne avec des coéquipiers affichant un Corsi de 44% alors que Derek Forbort, bien calé dans la roue de Drew Doughty, a pu compter sur des coéquipiers à 57% de Corsi moyen, une sacrée assurance. Au final, un joueur bénéficiant d’excellents coéquipiers mais qui enregistre des stats moyennes n’aura que peu d’excuse pour se justifier, alors que de bonnes stats dans un contexte difficile sont signe d’un talent indéniable.

Zone starts – départs en zone offensive/défensive. Un coach assigne régulièrement des missions différentes à ses joueurs, compte tenu de leurs talents et de leurs faiblesses personnelles. Vladimir Tarasenko a ainsi commencé 44% de ses présences en zone offensive l’an passé, deux fois plus souvent qu’en zone défensive (22%). Toujours à St Louis, Jay Bouwmeester commençait, lui, plus souvent en zone défensive, alorsl, qu’à l’inverse, Kevin Shattenkirk était davantage envoyé en zone offensive afin de maximiser son potentiel en attaque. Cela correspond au talent des joueurs tels qu’il est vu par l’entraineur mais peut expliquer certains résultats flatteurs ou non.

La réussite – l’indicateur PDO. Nous avons déjà évoqué le PDO dans l’article à propos des équipes. Le PDO peut pareillement être utilisé pour un joueur en additionnant la réussite aux tirs de ses coéquipiers et le taux d’arrêts des gardiens lorsqu’il est sur la glace. Si les gardiens sont communs à tous les joueurs d’une équipe, la réussite aux tirs de vos compagnons de trio peut logiquement avoir un impact sur votre récolte de points. Un très bon exemple l’an dernier concernait le défenseur des Flyers Shayne Gostisbehere. Avec lui sur la glace, les Flyers n’ont marqué que sur 4.84% de leurs tirs. Cela le place au 226e rang de la ligue parmi les défenseurs, sur les 229 ayant joué 20 matchs ou plus… De quoi expliquer en partie sa baisse de production offensive.

 

Et les gardiens alors ? Taux d’arrêts et buts sauvés

L’analyse des gardiens via les stats avancées est à la fois simple et complexe. Simple car il existe que très peu d’indicateurs à disposition du public. Complexe car si les équipes peuvent se payer des analyses différenciant les différents types de tirs, s’il y a eu une passe obligeant le gardien à se déplacer, etc. ces données ne sont pas disponibles pour le grand public. Cela-dit, les données à notre disposition résument très largement la situation et se suffisent à elles-mêmes.

Tout d’abord il s’agit de l’historique taux d’arrêts (ou pourcentage d’arrêts) : le pourcentage des tirs cadrés arrêtés par un gardien. L’immense majorité de la ligue se tient dans un mouchoir de poche pour le taux d’arrêts à 5 contre 5 et seule une poignée de joueurs (Price, Lundqvist en son temps, Holtby, Bobrovsky) se démarque chaque année des autres. L’analyse du taux d’arrêts en infériorité numérique aide également à différencier les bons gardiens de la moyenne car c’est dans ces situations que le talent d’un cerbère est mis à rude épreuve.

Buts sauvés : L’autre mesure consiste à observer la différence entre le nombre de buts anticipés pour les équipes adverses (donc encaissés par le gardien) et le nombre de buts réellement encaissés. La différence est ainsi nommée « buts sauvés ». Par exemple, l’an dernier, Cam Talbot des Oilers aurait dû encaisser 151 buts à 5 contre 5 mais n’en a alloués en vrai que 120. Il a donc sauvé 31 buts. Pour certains, le nombre de buts sauvés sera négatif, car ils en auront encaissés plus que prévu. Les buts sauvés peuvent aussi être regardés par tranche de 60mn pour mettre sur un même pied d’égalité les gardiens ayant joué un nombre de matchs très différents. Mais comme les titulaires jouent tous, normalement, entre 55 et 60 matchs, cela n’est pas obligatoire.

 

En conclusion

L’analyse des performances d’un joueur via les statistiques est bien plus complexe que pour les équipes. En plus des données de base, il faut y apporter beaucoup de contexte pour obtenir une vision claire. Rassurez-vous, c’est notre travail de vous fournir tout cela.

Globalement, tenez compte de :

  • La possession. Corsi (CF% sur les sites de stats, CF pour les tirs tentés, CA pour les tirs concédés). Préférez les valeurs relatives : RelCF%. Et les données par 60mn afin de mettre tous les joueurs sur un pied d’égalité. CF/60 CA/60 sur les sites de stats.
  • Les buts anticipés (xGF% sur les sites de stats, xGF pour les buts anticipés en faveur, xGA pour les buts anticipés contre). Préférez les valeurs relatives : RelxGF%. Et les données par 60mn afin de mettre tous les joueurs sur un pied d’égalité. xGF/60, xGA/60 sur les sites de stats.
  • L’efficacité offensive pour les attaquants et défensives pour les défenseurs que vous trouverez sur Hockey Archives
  • Le taux d’arrêts (On ice Sv%) et de réussite aux tirs (On ice sh%), additionnés dans l’indice PDO.
  • La production doit être regardée par tranches de 60mn. Goal/60, assist/60, pts/60.
  • La réussite aux tirs personnelle du joueur est nommée sh% ou ish% et donne un bon indice si un joueur connait une réussite normale ou anormalement basse/élevée.

 

Où regarder ?

http://corsica.hockey/ pour toutes ces stats, le site le plus intuitif et le plus complet. Dans les pages joueurs, vous pouvez sélectionner « Counts » pour les données brutes, « Rates » pour les données par 60mn ou « Relative » pour les données relatives.

http://www.naturalstattrick.com/ pour toutes ces stats. Propose les chances de marquer (SCF pour Scoring Chances) mais n’inclut pas les buts anticipés. Dans les pages joueurs, vous pouvez sélectionner « Counts » pour les données brutes, « Rates » pour les données par 60mn ou « Relative » pour les données relatives.

http://hockeystats.ca/ pour les stats sur les matchs en direct, propose le Corsi brut par joueur mais pas les buts anticipés.

Attention, nhl.com propose des statistiques comme le Corsi (rebaptisé SA pour shot attempts), mais les données compilées sont souvent curieusement « à l’ouest ». Les sites mentionnés ci-dessous corrigent régulièrement des erreurs flagrantes dans les données des feuilles de match NHL. Mieux vaut s’abstenir.