Quand un élu ou une élue navigue dans des zones d'ombre — contrats passés avec des entreprises, participations financières, liens familiaux avec des fournisseurs — notre premier réflexe est souvent d'aller chercher les documents publics. Problème : depuis la dématérialisation massive, ces pièces existent bien, mais elles sont parfois verrouillées dans des PDF protégés, des portails exigus, des interfaces Javascript opaques ou des systèmes administratifs qui rendent l'accès laborieux. J'ai appris à traiter ces obstacles comme des défis méthodologiques, pas comme des impasses. Voici comment, concrètement, j'enquête quand les documents publics sont dématérialisés mais verrouillés.

Comprendre le cadre légal avant d'attaquer

Avant toute manipulation technique, je commence par vérifier le cadre juridique. En France, le Code des relations entre le public et l'administration (CRPA) encadre l'accès aux documents administratifs : toute personne a en principe accès aux décisions, contrats et notes, sauf exceptions (secret défense, vie privée, informations protégées). Pour les déclarations d'intérêts et de patrimoine des élus, des textes spécifiques s'appliquent (déclarations à la Haute Autorité pour la transparence de la vie publique — HATVP).

Si un document est annoncé comme public mais demeure inaccessible, on peut saisir la CADA (Commission d'accès aux documents administratifs) ou la HATVP selon la nature du document. J'informe toujours mes interlocuteurs (ou mes sources) que la voie administrative existe : une demande formelle peut débloquer légalement un fichier qui avait été "oublié" en ligne.

Avant de « craquer » un fichier, chercher l'altérité des sources

Souvent, ce qui est verrouillé sur un site officiel existe ailleurs, sous une autre forme. Mes premières vérifications :

  • Rechercher le même document via data.gouv.fr, BOAMP, Bulletin officiel des marchés publics, ou le site de la collectivité concernée (rubrique marchés, délibérations, comptes-rendus).
  • Consulter Infogreffe et Société.com pour les documents d'entreprise (statuts, comptes annuels) qui peuvent éclairer le lien entre un élu et une société.
  • Vérifier les dépôts au Journal Officiel, la HATVP, ou les registres de lobbying si l'objet concerne des contacts entre élu·e et entreprise.
  • Ces pistes permettent souvent d'éviter d'avoir à briser un verrou technique : les informations essentielles peuvent être recoupées ailleurs.

    Techniques simples pour accéder à un PDF protégé (légalement)

    Si le document est objectivement public mais proposé en PDF protégé (interdiction d'impression, copie, etc.), il existe des méthodes non illégales que j'utilise en priorité :

  • Imprimer en PDF via l'imprimante virtuelle du navigateur : certains verrous sautent, surtout si la protection empêche seulement la copie mais pas l'affichage.
  • Effectuer une capture d'écran ou un « print to image » puis passer par un logiciel d'OCR (Tesseract, Adobe Acrobat Pro) pour récupérer le texte. C'est long, mais souvent suffisant.
  • Si le PDF est servi par une URL identifiable, je tente l'ouverture directe de la ressource (souvent un fichier .pdf) hors de l'interface qui l'encapsule.
  • Je rappelle que déverrouiller ou contourner une protection dans le but de commettre une fraude ou d'outrepasser une restriction légale est interdit. Les actions décrites ci‑dessous s'appliquent lorsque le document est clairement public et que l'objectif est l'accès à l'information publique.

    Utiliser les outils du navigateur et les API : la méthode discrète

    Beaucoup de plateformes affichent des documents via des appels API en arrière-plan. Voici ma progression type :

  • Ouvrir l'outil Développeur (F12) pour observer les requêtes réseau pendant le chargement de la page. Souvent, le PDF ou un flux JSON contenant un lien ou un identifiant est récupéré directement.
  • Repérer les endpoints (URL) qui renvoient des chunks de données : parfois il suffit d'y accéder directement pour obtenir le fichier.
  • Si la page utilise un viewer JavaScript (PDF.js, ViewerJS), j'essaie d'extraire l'URL du document dans les scripts ou dans les ressources chargées.
  • Ces techniques ne demandent pas de compétences avancées en dev, juste de la patience et de la curiosité. J'inclus régulièrement ces éléments dans mes carnets méthodologiques pour les jeunes journalistes que je forme.

    Exploiter les métadonnées et les caches

    Les documents contiennent souvent des métadonnées utiles : auteur du document, date de création, logiciel utilisé, chemin d'accès. Pour y accéder :

  • Télécharger le fichier si possible, puis inspecter les métadonnées avec ExifTool ou Adobe Acrobat.
  • Consulter les caches : Google Cache, Wayback Machine (Internet Archive). Parfois la version accessible du document a été archivée avant verrouillage.
  • Vérifier les pièces jointes d'e-mails publics, comptes rendus de réunion ou annexes d'autres documents qui peuvent reproduire le contenu verrouillé.
  • Recourir aux demandes formelles et aux tiers

    Si la voie technique n'aboutit pas, j'engage la voie administrative :

  • Adressage d'une demande au responsable de la communication de la collectivité : préciser la référence du document, la nature publique et demander la transmission dans un format non verrouillé.
  • Saisine de la CADA si la collectivité refuse l'accès sans motif légal.
  • Recours aux réseaux de journalistes, ONG (Transparency International, Anticor) ou associations de lanceurs d'alerte : elles ont parfois des contacts internes qui facilitent l'obtention.
  • Documenter chaque échange est essentiel : copie des e-mails, dates de demandes, réponses obtenues. Cela peut devenir une preuve si le dossier finit devant une juridiction ou devant la CADA.

    Compléter par des sources non documentaires

    Quand les papiers font défaut, l'enquête ne s'arrête pas. J'élargis :

  • Interviews : anciens collaborateurs, partenaires, prestataires, élus d'autres équipes — parfois l'oral révèle des détails non consignés.
  • Analyse financière : rapprochement des marchés publics (BOAMP, Marchés Online) avec les comptes d'une société pour détecter des flux entre une collectivité et une entreprise liée à l'élu.
  • Vérification des votes en conseil : comparer les délibérations et les dates d'attribution des marchés pour repérer des coïncidences troublantes.
  • Éthique, confidentialité et sécurité

    J'insiste toujours auprès de mes sources et de moi-même : garder une posture éthique. Ne pas publier de documents obtenus par piratage ou via une intrusion illégale. Protéger les lanceurs d'alerte (moyens de communication sécurisés comme Signal, courriels chiffrés) et mesurer les risques juridiques.

    Quelques outils et plateformes qui m'aident

  • ExifTool, Tesseract (OCR), Adobe Acrobat Pro pour les PDF.
  • Outils développeur des navigateurs, cURL, Postman pour interroger des endpoints.
  • Data.gouv.fr, Infogreffe, BOAMP, Wayback Machine pour chercher des versions alternatives.
  • Réseaux professionnels : réseaux de journalistes locaux, Anticor, Transparency International, médias d'investigation qui acceptent les collaborations.
  • Chaque dossier est un casse-tête singulier. La clé, pour moi, c'est la combinaison : une approche juridique en amont, une exploration technique mesurée, une recherche fine de sources alternatives et un travail d'interviews pour combler les blancs. En multipliant les angles, on finit presque toujours par démêler les liens d'intérêts — même quand les documents publics paraissent scellés.