À l’occasion de l'open data des décisions des tribunaux administratifs, Hugo Prat, data engineer, évoque l’intégration de ces nouvelles données sur Predictice.
Est-ce que tu pourrais te présenter en quelques mots s’il te plaît ?
Je m'appelle Hugo Prat, j'ai 26 ans. Je vis actuellement à Grenoble où je travaille en tant que data engineer pour Predictice depuis un peu plus de deux ans maintenant. Je travaille principalement sur les sujets d'intégration de données, d'architecture de pipeline et d'optimisation du traitement de données des algorithmes de data science.
Quelles décisions sont à présent disponibles sur Predictice ?
Actuellement, toutes les données publiques françaises de jurisprudence sont présentes sur Predictice : celles de l'ordre administratif et de l'ordre judiciaire, ainsi que la jurisprudence luxembourgeoise et les données d'autorités administratives comme l'AMF ou l'ACPR. Nous avons également des données exclusives fournies par nos clients et des données des juridictions européennes qui, elles, sont fournies par notre partenaire Wolters Kluwer.
LIRE AUSSI >> Créer des alertes sur une recherche ou une affaire
Récemment, vous avez intégré les décisions des tribunaux administratifs qui sont ouvertes depuis le 30 juin dernier. Avez-vous rencontré des difficultés particulières lors de l'intégration de ces décisions sur la plateforme Predictice ?
Oui, nous avons rencontré trois difficultés particulières. En effet, au moment de l'intégration des décisions administratives, nous avons utilisé le nouveau flux fourni par le site officiel de la justice administrative qui s'appelle opendata.justice-administrative.fr. Or, ce flux, qui fournit en continu les décisions administratives du Conseil d'État, des cours administratives d'appel et désormais, des tribunaux administratifs, y donne accès sous forme de fichiers XML, qui sont déposés chaque mois en continu et également modifiés en continu, alors que les données judiciaires fournies par Judilibre sont transmises grâce à une API (NDR : interface de programmation d'application, qui permet de connecter deux logiciels) qui permet de récupérer les décisions mises à jour sur la journée. Nous pouvions donc avoir accès à une décision déposée le mois dernier et modifiée ce mois-ci. Ainsi, la première complexité à laquelle nous avons dû faire face était de récupérer toutes ces décisions depuis la page web de la justice administrative et de leur apporter un traitement permettant de détecter les mises à jour.
La deuxième difficulté, c'est qu'au sein des décisions fournies, le travail de détection des metadata fait par la justice administrative était parfois défaillant. Ces données étaient quelquefois mal interprétées, mal détectées, de sorte que nous devions effectuer en aval un travail de normalisation et de nettoyage de ces données.
Enfin, la troisième difficulté que nous avons rencontrée était celle des duplicata de données. En effet, nous avions déjà dans la base de données Predictice des décisions de l'ordre administratif. Lorsque nous avons chargé le flux de données publiques, nous avons dû être vigilants pour ne pas créer des doublons. Nous avons donc mis en place un traitement algorithmique pour dédupliquer les données et faire en sorte que si une nouvelle donnée du flux d'open data était déjà présente sur Predictice, cette dernière remplaçait l’ancienne.
Quelles sont les prochaines décisions qui seront intégrées sur Predictice ?
Nous sommes en discussion avec deux assureurs pour l'intégration de leurs décisions exclusives. Le processus est avancé et cette intégration ne devrait plus tarder. Nous sommes également en train d'intégrer beaucoup d'articles et de commentaires doctrinaux afin d'accompagner nos usagers dans la lecture des décisions de justice. Enfin, nous suivons bien entendu le calendrier de l'open data, dont l'échéance prochaine sera la mise à disposition des décisions des conseils de Prud'hommes en juin 2023.
LIRE AUSSI >> Le service de décision à la demande de Predictice
Docteure en droit et diplômée de l'Essec, Eloïse est rédactrice en chef du Blog Predictice.