Alors que la Coupe du monde de football bat son plein au Qatar, chacun y va de son pronostic. La France, l'Argentine, le Brésil, l'Espagne et la Belgique font figure de favoris tandis que le Danemark, les Pays-Bas et le Sénégal sont susceptibles de jouer les trouble-fêtes. Les algorithmes, quant à eux, ont déjà fait leur choix : ils prédisent la victoire finale du Brésil !
Selon l'Ecole Audencia et la société spécialisée dans le big data Alteryx, la Seleção devrait l'emporter le 18 décembre prochain et accrocher une sixième étoile sur son maillot auriverde. Pour parvenir à ce pronostic, près de 150 ans de données ont été collectées et analysées : les résultats des matchs depuis 1872, les performances individuelles des joueurs, les résultats historiques des séances de tirs au but, et le calendrier de la Coupe du Monde 2022.
Quant à la France, faute de décrocher un troisième titre, elle devrait cependant tout de même gagner son sésame pour le deuxième tour et sortir gagnant du Groupe D (avec le Danemark).
Algorithme de la "Forêt aléatoire"
Derrière ces pronostics, on trouve l’algorithme Random Forest (Forêt aléatoire ou forêt d'arbres décisionnels) qui présente un avantage selon Audencia et Alteryx : "ce modèle se distingue en permettant un réglage plus fin au fil de la compétition, en modifiant la sélection des joueurs pour chaque match, afin d’affiner ses pronostics."
Le 18 décembre, on saura si les pronostiqueurs peuvent faire confiance au big data. On saura également si les algorithmes font mieux que Paul le Poulpe. En 2010, le céphalopode le plus célèbre du monde faisait connaître ses choix en ouvrant une boîte aux couleurs de l'équipe gagnante depuis son aquarium. Sur 14 prédictions au total, 12 se sont révélées exactes !