Statistiques et notion de possession
Le basket made in USA, c’est un sport où le spectacle prime et où on mélange allègrement les considérations sportives et le business.
Mais le sport made in USA, c’est aussi les statistiques. Dans tous les sports majeurs outre-atlantique, l’analyse des données des matchs est faite de manière très poussée.
Pour faire le point, BasketUSA vous présente une série d’articles consacrés au sujet. La semaine dernière, nous avons repris les bases. Cette semaine, nous entrons dans le dur.
Nous introduisons donc la notion de statistiques « avancées », ainsi que la notion de possession, fondamentale pour l’analyse des performances.
Un joueur ne se résume pas à ses stats
Il faut le préciser en introduction, car il est évident que nous aurons des remarques : le basketball ne peut se réduire à des statistiques. On ne peut connaître la qualité d’un joueur à travers des chiffres, même triturés dans tous les sens.
L’apport d’un joueur n’est reflétée qu’imparfaitement dans les statistiques, et notamment en défense.
A noter tout de même que certaines innovations relativement récentes permettent d’améliorer cette faiblesse. L’analyse de la moyenne du nombre de points marqués par l’adversaire d’un joueur (ramené au nombre de minutes), ou même le PER moyen de l’adversaire nous donne une meilleure vision des qualités défensives.
Mais ceci ne quantifie pas des éléments tels que la pression défensive, la perte de précieuses secondes en fin de possession ou le QI basket dans la gestion des prises à deux.
Au final, nous l’affirmons : les statistiques ne représentent pas et ne pourront jamais représenter de manière exhaustive le niveau et l’apport d’un joueur.
Une importance toute particulière aux USA
L’intérêt des fans de sports US pour les statistiques est culturel.
Mais il faut aussi dire que les principaux sports US, au premier titre desquels le football américain et le baseball, se prêtent particulièrement bien à l’analyse chiffrée. Il faut d’ailleurs noter que beaucoup d’innovation statistiques appliquées au basket proviennent directement de ces deux sports.
Cet attrait se ressent dans le domaine de la recherche (comment « lire » et interpréter les statistiques), mais aussi dans la disponibilité des informations.
Tout est organisé en NBA pour produire un grand nombre de stats, et notamment de statistiques avancées. Par exemple, dans le cahier des charges des franchises, la ligue détaille par le menu la manière dont doivent être gérées les statistiques. Il existe des normes en matière de système d’information, un nombre déterminé de personnes sur le bord du terrain chargées de transformer ce qui se passe sur le terrain en données exploitables, … Tout le système est encadré de manière strict
Par ailleurs, la NBA ne se limite pas simplement aux shoots, passes décisives, rebonds, etc… Elle va beaucoup plus loin.
Un des exemples les plus frappants est par exemple les informations sur la distance des shoots. Un site comme hoopdata vous permet ainsi de savoir que la saison dernière, Kobe Bryant shootait dans la zone de 5-7 mètres à 41% de réussite, similaire aux 40% de Joe Johnson, mais inférieur aux 43% atteints par Brandon Roy. Des 3, c’est Bryant qui allumait le plus depuis cette zone, avec 6 tentatives par match.
Les données sont aussi disponibles pour les dunk/lay-up, la zone des moins de 3 mètres, 3-5 mètres et bien entendu les 3 points. On trouvera aussi, entre autres, le nombre de shoots tentés sur une passe décisive, et ce pour chacune de ces distances !
Le domaine est même suffisamment dynamique économiquement pour que de nombreux businesses se montent autour des données brutes. La gestion des statistiques officielles est confiée à la société Stats, mais ceci n’empêche pas d’autres sociétés, comme RealGM ou plus récemment Synergysports de proposer des offres complémentaires, à destination de publics différents.
RealGM fait dans le traitement de données pour les franchises NBA. Synergysports, à travers son offre MySynergySports, partenaire de la NBA, propose, en plus d’un replay action par action des matchs, des statistiques avancées joueur par joueur et équipe par équipe.
Au coeur du système, la notion de possession
Dans l’analyse statistique du basket, la possession est la notion fondamentale. Elle est d’ailleurs directement issue du baseball.
L’idée est simple : il s’agit de mesurer les performances à partir du moment où une équipe reçoit la balle et jusqu’au moment où elle la rend à l’adversaire (sur panier marqué, rebond défensif ou perte de balle).
Si l’équipe prend un rebond offensif, on considère que c’est la même possession.
La notion de possession permet de mesurer l’efficacité de manière plus précise qu’à travers un simple pourcentage au shoot, qui ne prend en compte qu’un aspect du jeu. Si une équipe rate systématiquement deux fois son tir, prend systématiquement deux rebonds offensifs et met le 3ème shoot, le résultat est là : le panier est marqué à la fin. Et c’est ce qui compte au basket…
Une caractéristique intéressante de cette notion est que les deux équipes ont chacune le même nombre de possessions par match (ou quasiment, à cause des fins de quart-temps) : à chaque fois qu’une équipe fini une possession, l’équipe adverse en commence une. Si une équipe perd la balle au bout de 4 secondes, elle a tout de même gâché une possession, même si elle n’a pas shooté.
L’analyse statistique par possession permet aussi de s’affranchir de la notion de rythme de jeu (pace en anglais). On peut donc comparer l’efficacité du Magic, tout en jeu demi-terrain, et des Warriors, qui jouent beaucoup la contre-attaque et qui marqueront donc naturellement plus de points par match.
Méthodes d’estimation du nombre de possessions
La feuille de match « standard » ne donne aucune information sur les possessions. Pour pouvoir débuter, il est donc nécessaire de la déduire. Pour cela, trois moyens :
* Récupérer les informations fournies directement par la ligue si elle inclut les possessions dans son système statistique. A ma connaissance, aux États-Unis, c’est uniquement le cas pour la WNBA.
* Récupérer ces informations indirectement en traitant les données de type « fil de match » (play-by-play). On peut en déduire les changements de possession, mais de manière indirecte. Une perte de balle, un rebond défensif ou un panier marqué donneront par exemple lieu à une nouvelle possession.
* Estimer ces informations à partir de la « box score ». Ceci est nécessaire car pour les matchs plus anciens pour lesquels on ne dispose pas du « play-by-play ». Il serait très limité de devoir se contenter des 10 ou 15 dernières années. Par ailleurs, comment pour les ligues actuelles qui ne disposent toujours pas du play-by-play ? Les statisticiens ont donc inventé une méthode, présentée dans le paragraphe suivant.
Analyse de la feuille de match
L’idée est de déduire le nombre de possessions simplement à partir de la feuille de match standard. La formule la plus classiquement utilisée (car c’est la plus simple, même si ce n’est pas la meilleure) est la suivante :
POSS = NBTIR 0,44 * NBLF – REBOFF PdBoù POSS représente le nombre de possession d’une équipe. C’est le chiffre que nous cherchons à déterminer.
NBTIR est le nombre de tir à 2 ou 3 points pris par l’équipe, NBLF le nombre de lancers-francs tirés, REBOFF le nombre de rebonds offensifs pris et PdB le nombre de pertes de balle.
L’idée de base, comme dit plus haut, est que la balle de change de main lorsqu’une équipe marque un panier, manque une panier et laisse l’adversaire prendre le rebond défensif, ou perd la balle. On compte donc le nombre de possession d’une équipe en regardant toutes les manières dont elle a rendu la balle à l’adversaire.
Regardons les lancers-francs. Tous les lancers francs ne mènent pas à un changement de possession : la plupart du temps, ils viennent par deux (ou 3) et le premier ne donne lieu à aucun rebond. Par ailleurs, il peut arriver qu’il y ait une faute technique, qui est sanctionnée par un lancer unique, puis la balle est redonnée à l’attaquant. Enfin, en cas de « And 1″, une tentative de tir sera enregistrée (dans NBTIR) et prendre en compte le lancer associé reviendra à compter deux changements de possession.
Au final, des analyses ont été réalisées, en comparant les résultats données par les 3 méthodes citées ci-dessus, et il apparaît qu’en moyenne seuls 44% des lancers peuvent donner lieu à un changement de possession (44% = 0,44). Seule cette proportion doit être prise en compte.
On voit donc que la valeur NBTIR 0,44 * NBLF représente le nombre de fois où la balle peut changer de main (nouvelle possession) suite à un tir, soit parce que le panier est marqué, soit parce qu’un rebond défensif est pris. Mais en s’arrêtant là, on compterait trop de possessions, car les rebonds offensifs ne mènent pas à une nouvelle possession. C’est la raison pour laquelle on retranche le nombre de rebonds offensifs.
Pour finir, la dernière manière de rendre la balle à l’adversaire est de la perdre (sur une interception, une sortie des limites du terrain, un dépassement des 24 secondes, un 3 secondes dans la raquette, …). Chaque perte de balle est comptabilisée (PdB) et vient augmenter le nombre de possessions affecté à l’équipe.
Rendements offensif et défensif
Une fois qu’on dispose du nombre de possessions, il est possible de débuter l’analyse. Deux valeurs quantifiant l’efficacité collective sont incontournables : les rendements offensif et défensif.
Le rendement offensif
C’est le nombre de points marqués par possession d’une équipe. A chaque fois qu’une équipe récupère la balle, combien de points en moyenne va-t-elle marquer ?
Pour rendre le chiffre plus digeste, on utilise généralement le nombre de points marqués pour 100 possessions.
Pour la saison dernière, l’ensemble des franchises NBA marquait en moyenne 104,9 points pour 100 possessions (104,9 pts / 100poss). Phoenix affichait un très bon rendement : 112,7 pts / 100poss. Tout le contraire des Nets, qui eux marquaient 98,7 pts / 100poss.
On peut en profiter pour voir que les Warriors ne sont pas particulièrement efficaces en attaque. Avec 105,4 pts / 100poss, ils sont 14ème, à peine mieux que la moyenne de la ligue. Par contre, il est vrai qu’ils sont deuxième au nombre de points marqués (108,8 pts / match). Mais c’est simplement parce qu’ils courent, pas parce qu’ils attaquent bien. En favorisant la contre-attaque et le shoot en première intention, ils imposent un fort rythme de jeu qui favorise le nombre de points marqués.
On pourrait penser que comme il faut marquer plus de points que l’adversaire, c’est une stratégie forcément payante. Mais n’oublions pas que, comme dit plus haut, chaque équipe a autant de possessions. A chaque fois que les Warriors marquent rapidement, l’adversaire à une occasion d’en faire autant, et à son rythme. Utiliser une stratégie rapide (up-tempo) a donc du sens que lorsqu’on a les joueurs qui s’y prêtent, et ce n’est certainement pas la panacée.
Le rendement défensif
Le pendant du rendement offensif est naturellement le rendement défensif.
C’est le nombre de points marqués par possession de l’équipe adverse. La défense la plus perméable la saison dernière était les Raptors, avec 110,2 pts / 100poss, juste devant… les Warriors (109,4 pts / 100poss).
Le rendement global
Au final, la différence entre le rendement offensif et défensif (le rendement global) donne une bonne estimation de la capacité d’une équipe à remporter ses matchs (rappelons que le nombre de possession par équipe est quasi-identique). Orlando, Cleveland et Phoenix constituaient le trio de tête de la saison (régulière) dernière, tandis que Detroit, New Jersey et Minnesota fermaient la marche.
Question subsidiaire : pouvez-vous deviner le rendement défensif moyen de la NBA la saison dernière uniquement à partir des informations fournies ci-dessus ?
Visualisons !
Pour clore cette première partie, je vous propose une petite représentation graphique des rendements par équipe sur la saison 2009-10. Prenons le temps d’y jeter un coup d’oeil.
Cette visualisation a simplement pour objet de présenter les rendements offensifs et défensifs de toutes les équipes de la NBA durant la saison régulière 2009-10.
En abscisse (axe horizontal) est représenté le rendement offensif. Plus la valeur est grande, meilleure est l’attaque de l’équipe. Par conséquent, les meilleures équipes dans ce domaine sont à droite du graphique.
En ordonnées (axe verticale) est représenté le rendement défensif. Plus la valeur est faible, meilleure est la défense. Par conséquent, les meilleures équpes dans ce domaine sont en bas du graphique.
On voit donc naturellement émerger quatre parties au graphique, séparées en 4 quadrants par les 2 lignes rouges (qui représentent la moyenne des rendements de la ligue) :
* En haut à gauche (groupe 1), les équipes mauvaises en attaques et en défense, gentiment surnommées « passoires amateurs de brique » (humour). On retrouve là toutes les équipes qui ont galéré durant la saison, avec une prime à Minnesota et à New Jersey, à l’extrême du quadrant.
* En haut à droite (groupe 2), les équipes qui privilégient l’attaque. Là encore, on trouve des équipes aux résultats mauvais, à l’exception de Phoenix. On y revient plus bas.
* En bas à gauche (groupe 3), les équipes se concentrant sur la défense. La composition du groupe est plus partagée, car on trouve 4 équipes qualifiées en playoffs.
* En bas à gauche (groupe 4), les meilleures équipes, efficaces à la fois bonnes en attaquant et en défense.
Quelques remarques
L’équilibre attaque/défense, un problème délicat
Etre complet, à la fois efficace en attaque et en défense est un équilibre délicat à trouver. Jouer la contre-attaque est un moyen de facile d’augmenter son rendement offensif, les points marqués en transition étant plus faciles.
Mais cela nécessite mécaniquement d’être moins présent au rebond défensif, au risque de détériorer le rendement défensif. Pour faire partie du groupe 4, il faut généralement jouer très bien sur demi-terrain, et construire une défense solide.
La défense prime sur l’attaque ?
A la lecture du graphique, on pourrait se dire que quitte à choisir, en fonction de son effectif, entre une équipe « tout attaque » et une équipe « tout défense », il faut privilégier la seconde solution. Sur les 5 équipes dans le groupe 3 (les défenseurs fous), 4 se sont qualifiées pour les playoffs. Par contre, sur les 6 équipes du groupe 2 (les attaquants fous), seul Phoenix s’est qualifié.
La franchise de l’Arizona offre d’ailleurs un profil original. Seule équipe dans le groupe des « attaquants fous » qualifiés en playoffs, c’est aussi la seule du groupe à avoir un rendement global positif. En regardant dans le détail on voit que c’est une équipe qui joue vite (4ème en terme de rythme de jeu dans la ligue), et qui attaque extrêmement bien. Son rendement défensif n’est pas extraordinaire (19ème), mais est compensée par une attaque ultra efficace (1ere de la ligue, 3 points par 100 possessions au dessus du second). C’est probablement l’exemple que les Warriors ou les Knicks auraient voulu imiter. Il leur manquait un Nash et un Stoud’…
Et le rendement global
La ligne bleue en pointillé qui traverse le graphique représente la ligne de séparation entre les équipes qui marquent plus de points par possession qu’elles n’en encaissent et les autres. C’est, comme on l’a dit avant, un bon indicateur de la performance d’une équipe. Etre plus efficace, c’est être en dessous de cette ligne. Plus précisément, plus une équipe est loin de la ligne bleue, meilleur est son rendement global.
Sur les 16 qualifiées en playoffs, 15 se trouvent du bon côté.
Seule Chicago constitue une exception. Pour moi, c’est le reflet d’une irrégularité particulièrement forte de l’équipe. La franchise a par exemple enchaîné 7 défaites consécutives début mars, puis 10 victoires en 14 rencontres. De très mauvais rendements durant les périodes de défaites et des rendements à peine positifs durant les meilleures périodes sont probablement responsable de ce phénomène.
Conclusion
Dans ce second article, nous avons présenté le grand principe d’analyse du rendement global d’une équipe. On voit quand même que l’analyse purement chiffrée rejoint plutôt bien les constations sur le terrain et dans les qualifications en playoffs.
Il apparaît aussi que les rendements globaux ne sont pas pas le moyen ultime de prévoir le futur champion, sinon on aurait pu parier en avril sur le Magic… Mais les playoffs sont un tout autre monde, le niveau de jeu et les enjeux changent énormément de choses sur le terrain.