Skip to content

Cahier des charges

Cahier des charges "Track Trends" Travail de diplôme Maxime Rohmer 2023

Contexte


Je suis le "Live Ticker" chargé de la Formule 1 pour le 20 minutes. On peut traduire cela comme commentateur de F1, avec tout de même l'importante subtilité que je ne commente pas avec la voix, mais avec le clavier. Mes commentaires sont sous la forme de commentaires écrits live qui s'ajoutent au fur et à mesure de l'évènement. Par exemple : "Tour 28/54, Hamilton a fini par s'arrêter et chausser des gommes tendres 13 tours après Verstappen. L'Anglais va voir plus de 15 secondes à rattraper, mais les gommes neuves et plus tendres que son rival devraient lui permettre s'il ne se fait pas trop ralentir par le trafic". En général avec un peu plus d'infos quand même et cela tous les 3-4 tours

Voici quelques exemples de précédents commentaires (Conseil : il y a un bouton pour montrer le feed dans l'ordre chronologique) :

"Exemple commentaires"

Pendant un Grand Prix, je dois constamment :

  • Écrire ce qu'il se passe dans le grand prix et expliquer les enjeux
  • Chercher régulièrement des médias à inclure pour diversifier mon live (Tweets, Images etc.)
  • Changer le titre et la description du live en fonction de l'évolution du Grand prix
  • Et accessoirement regarder le grand prix pour y comprendre quelque chose

Avec tout ça, il est très difficile de garder un œil sur la page DATA de la F1TV qui fournit pourtant des informations précieuses.

Je me retrouve parfois par exemple à ne pas parler de dépassements dans le peloton, car ils ne sont pas retransmis à la télé alors que c'est une information importante. Autre exemple, occasionnellement le classement ne reflète pas les vraies positions des pilotes. Les arrêts aux stands font que du coup des pilotes qui devraient être 15èmes se retrouvent 8ᵉ puisqu'ils ne sont pas encore arrêtés. Cela peut de temps en temps prêter à confusion.

Projet


Un outil de style compagnon sous forme d'application C# Windows Form qui récupère en temps réel les informations de la course et affiche les informations les plus importantes. Le but est non seulement de faciliter mon job, mais aussi faire en sorte d'améliorer la plus-value de mon travail en me permettant de fournir des commentaires qui ne sont pas disponibles pour le tout venant qui regarde simplement le flux RTS.

Exemples:

  • Les pilotes qui sont proches (moins de 1-2 secondes qui sont donc en train de se battre).
  • Les pilotes qui améliorent leur temps au tour et ceux qui perdent le plus de temps
  • Le classement pondéré tenant compte des futurs arrêts au stand

Maintenant afficher différemment les infos, c'est sympa, mais cela serait encore mieux de traiter ces data et de permettre des petites prédictions.

Exemples :

  • Prédire les arrêts aux stands en prenant en compte les baisses de performances des pneus
  • Prédire le pneu que le pilote va chausser s'il rentre aux stands dans le prochain tour
  • Prédire dans combien de tour tel pilote va rattraper tel autre pilote
  • Prédire combien de temps le pilote va perdre dans les stands en fonctions des arrêts précédents

Réalisation

Malheureusement, la Formula 1 Management ne propose aucune API publique qui puisse nous permettre de faire ce projet "simplement". La raison la plus probable étant qu'Amazon avec son service AWS propose exactement ce genre de services pour le flux télévisé et il doit y avoir un contrat d'exclusivité.

Il existe des API "Pirates" faites par la communauté, le problème est qu'elles ne sont pas forcément des plus pratiques à utiliser.

Mais comme je possède un abonnement premium ++ à la F1TV, j'ai accès pour chaque grand prix à un flux vidéo nommé : DATA F1 CHANNEL

Qui ressemble à ça :

"Data channel exemple"

Donc la seule façon que je vois de récupérer ces données est de les prendre directement sur ce feed.

Même si le but final de l'application est de faire pleins de choses super avec les datas, le gros du projet va surtout être la récupération des données et leur stockage.

Les données viennent du flux vidéo et ainsi dans un premier temps, il va falloir récupérer d'une manière ou d'une autre des images qui viennent d'un grand prix en direct ou en rediffusion.

Ensuite, dans un second temps, il faut lire les informations directement sur l'image en utilisant une librairie prévue pour (exemple Tesseract) et vérifier l'intégrité de ces dernières pour qu'on puisse ensuite les stocker.

Dans un troisième temps, il faut stocker toutes ces données dans une forme qui permette d'aller facilement faire des requêtes de récupération et déjà préparer des méthodes qui permettent de récupérer des infos importantes (ex : la moyenne des cinq derniers tours, le temps moyen d'arrêt etc.) pour faciliter la dernière étape

Quand tout cela est fait, on peut ensuite s'amuser un peu avec les Data.

La dernière étape est donc l'affichage. L'idée est de créer une Windows Form qui contienne toutes ces informations dans un format beaucoup plus lisible et avec laquelle on pourrait interagir pour permettre de plus facilement commenter les Grands Prix. (exemple plus bas avec un croquis de ce à quoi l'application pourrait ressembler)

Voici la liste des données qui pourraient être affichées (Non contractuel, simplement des idées).

  • Les pilotes qui sont proches (moins de 1-2 secondes qui sont donc en train de se battre).
  • Les pilotes qui améliorent leur temps au tour et ceux qui perdent le plus de temps
  • Le classement pondéré tenant compte des futurs arrêts au stand
  • La moyenne de temps que les pilotes perdent dans les stands
  • La performance moyenne des 5 types de pneus
  • La moyenne de temps de chaque pilote sur le pneu actuel
  • Le nombre de points que chaque pilote gagnerait selon sa position
  • Le classement de la course

Voire même si c'est possible :

  • Prédire les arrêts aux stands en prenant en compte les baisses de performances des pneus
  • Prédire le pneu que le pilote va chausser s'il rentre aux stands dans le prochain tour
  • Prédire dans combien de tour tel pilote va rattraper tel autre pilote
  • Prédire combien de temps le pilote va perdre dans les stands en fonctions des arrêts précédents
  • Prédire les temps au tour de chaque pilote selon l'usure des pneus

Voici un exemple d'interface possible pour une page :

"Proto"

Cas d'utilisation


*On va considérer que tous les user ont un abonnement F1 TV PRO

Un user veut récupérer les data :

  • Il ouvre son navigateur et lance la page DATA de la F1 TV
  • Il calibre la capture des data via le programme (pour la première utilisation).
  • Il confirme que les données initiales sont bonnes (pour la première utilisation).
  • Il regarde tranquille son Grand Prix

Le programme récupère les data :

  • Il récupère des images depuis la F1TV
  • Il utilise Tesseract (ou autre) pour en récupérer les infos.
  • Il met ces infos dans un Objet Pilote, dans un Objet course avec un attribut tour pour hiérarchiser les data

Pour ce qui est de l'affichage, l'idée est de faire une application C# comme on l'a appris à l'école, mais avec assez de style pour qu'elle puisse être agréable à utiliser.

Quand le programme affiche les data :

  • Il prend les données venant directement de la F1TV.
  • Il affiche différemment les données pour permettre une meilleure lisibilité
  • Il interprète avec des règles plutôt simples certaines data pour faire des miniprédictions ou aider à la lecture
  • Il récupère des infos d'autres courses pour les comparer et proposer des prédictions plus intéressantes

Difficultés techniques


  • Récupérer un flux vidéo plutôt propre malgré les contres mesures de la F1 TV pour en empêcher la lecture par un logiciel
  • Si on doit passer par une capture d'écran, trouver un moyen de stocker les données de manière à prévoir que parfois un tour pourrait avoir plus de données qu'un autre, que le user peut mettre pause, ou même qu’il revienne en arrière.
  • Développer des algorithmes pour récupérer les données comme les différents pneus utilisés ou l'activation du DRS ainsi que développer des moyens de nettoyer les résultats de l'OCR (Par exemple utiliser différents champs redondants pour comparer les résultats)
  • Stocker les données sur une base pour les traiter plus tard tout en prévoyant un moyen de voir les stats live
  • Développer des algorithmes de prédiction qui prennent en compte d'anciennes courses pour tenter de prédire des choses comme les arrêts aux stands par exemple.