Wahou, l'Open Data de toutes les décisions de justice avance un peu.
Codifié par la loi pour une République numérique de 2016, le décret d'application cadre a été pris en 2020 et un décret-calendrier a été pris en 2021. \o/
Le Conseil d'État et la Cour de cassation ont ouvert leur service fin 2021.
Je constate des disparités. Le Conseil d'État diffuse des fichiers XML dans des archives zip. Ouverture totale. La Cour de cassation propose une API. Compte nécessaire. Vous n'auriez pas pu vous mettre d'accord et mutualiser l'effort (normalisation, processus, logiciels, etc.) ?!
Le format du Conseil d'État est faiblement documenté (format des dates, des identifiants, etc.).
Au passage, je découvre PISTE, le portail de l'État pour mutualiser / regrouper les API. A priori, le seul environnement existant à ce jour est un bac à sable.
En 2022, les décisions des Tribunaux administratifs et des Cours d'appel devraient être publiées. Prud’hommes en 2023. Pénal (et le reste) en 2024-2025.
Ce calendrier me paraît être ambitieux : le Conseil d'État, comme le Conseil constitutionnel, de par le rayonnement de ses décisions, a une culture de la publication donc du personnel, une organisation et des processus, etc. dédiés. Ce n'est pas le cas des tribunaux, à ma connaissance.
Je constate de bonnes idées :
- Se faire la main en commençant par publier ce que l'on sait faire et qui est pertinent (les décisions du Conseil d'État s'imposent aux Tribunaux et aux Cours administratives) ;
- Portail unique par ordre juridictionnel : le Conseil d'État publiera également les décisions des Tribunaux administratifs et des Cours administratives d'appel, et la Cour de cassation publiera tout le reste (pénal, prud'hommes, commerce, etc.) ;
- L'Open Data mutualise l'effort des éditeurs juridiques (Dalloz, LexisNexis, Forseti, etc.). Plus besoin de signer des partenariats éditeur par éditeur et juridiction par juridiction, parfois jugés exclusifs (donc portant atteinte à la concurrence, tout ça) et dont le cadre n'est pas clair (les décisions doivent-elles être dépubliées quand le partenariat prend fin ?). La plus-value de tels éditeurs vient des analyses et des outils qu'ils proposent. L'Open Data limite les abus comme ceux de Forseti, éditeur du site web Doctrine, qui s'est faite passer, par typosquatting, pour des avocats et des universitaires afin de se faire communiquer des décisions (« péché originel » reconnait-elle), qui a profite d'un partenariat d'anonymisation avec le Conseil d'État pour publier, à son compte et sans accord, les décisions confiées, et qui est la cible d'une enquête pour piratage, des tribunaux ayant trouvé, dans la base de Doctrine, des décisions qu'ils n'ont pas communiqué. Sources : Wikipedia et Canard enchaîné du 21 avril 2021.
Il me reste tant de questions sur l'opportunité de publier les décisions de première instance et d'appel :
- Je ne suis pas certain que la publication d'un jugement de première instance qui vérifie que, dans les faits démontrables, Monsieur X est bien l'auteur du vol Y soit pertinent. mais peut-être trouvera-t-on des raisonnements intéressants et que je suis ignorant du déroulé de ces audiences ;
- Quid de l'analyse automatisée de cette masse de données ?
- Anonymisation des victimes, accusés, coupables, juges, jurés ? Pas seulement l'identité, mais aussi le contexte qui en dit long (exemple Mariani). Problématique non triviale. Anonymat ou adaptation des mœurs ? Ce n'est pas parce que ma société commerciale était en faillite y'a X années que je ne peux pas être quelqu'un de fiable aujourd'hui ;
- Choix du juge / tribunal (ou de l'avocat, Doctrine propose déjà leur notation). Un accusé doit-il demander un report de l'audience ou un dépaysement au motif que le juge X est moins sévère que le juge Y ? Les avocats ont déjà ces infos (uniquement pour les infractions les plus corsées), mais elles relèvent du blabla, de la culture informelle, pas d'un fait vérifiable et opposable dans un argument du type "mon jugement sera plus équitable là-bas qu'ici donc je demande le transfert de mon dossier" (argument utilisé dans les procès d'extradition, par exemple) ;
- Prédiction des peines. En moyenne, dans telle zone géographique, un vol est puni par telle peine. On saurait à l'avance ce qu'on risque. Évidemment, les avocats savent déjà tout ça, mais, là encore, la masse permet d'affiner la mesure du risque. Cette dérive me semble être encore lointaine car il faudrait analyser le corps des décisions afin d'en faire ressortir le contexte précis, les circonstances aggravantes / atténuantes, etc., car la peine sera identique à contexte identique (en gros). Cela nécessite une analyse sémantique, bien plus poussée qu'une analyse statistique, que nous n'avons pas ;
- Certains évoquent la méchante IA qui rendra seule des décisions de justice. Si, comme c'est le cas aujourd'hui, IA signifie analyse statistique, on rate un pan majeur de ce qu'est un procès, donc pas de risque de remplacement (ou alors il faudra plutôt s'inquiéter de la mise au placard de la raison). Ensuite, nul besoin de l'Open Data pour vouloir « optimiser » / rentabiliser la justice et se donner les moyens et les outils pour y parvenir, donc autant que la masse de données profite aussi à d'autres usages.
Autre source : http://www.justice.gouv.fr/publications-10047/open-data-des-decisions-de-justice-13008/une-premiere-etape-pour-lopen-data-des-decisions-de-justice-34107.html .