Comment les citoyens pourront-ils prouver leur innocence si les preuves synthétiques issues du deepfake satisfont aux critères d’admissibilité en justice ?
Il y a deux semaines, un ami avocat de la défense m’a montré un dossier. Il contenait une vidéo de trois minutes. On y voit un militant local de premier plan remettre une épaisse liasse de billets à un responsable du port. L’éclairage est sans équivoque celui d’une fin d’après-midi nord-européenne. Le son capte le clapotis de l’eau du canal tout proche, le ronronnement sourd d’un moteur diesel, ainsi que la voix rauque et grave de l’activiste qui dit : « Assure-toi simplement que le conteneur passe la douane d’ici mardi. »
L’activiste a un alibi en béton : il était chez le dentiste, à l’autre bout de la ville, sous sédation profonde. Mais le registre numérique du dentiste a été endommagé lors d’une migration de serveur de routine il y a trois mois. La réceptionniste n’a qu’un vague souvenir de cette journée.
Nous entrons dans l’ère du black-out épistémique.
Pendant des siècles, le droit a fonctionné selon un principe simple, bien qu’imparfait : il faut le voir pour le croire, et un enregistrement ne ment pas sans laisser de traces. Si une vidéo vous montrait en train de tenir la preuve irréfutable, la charge de la preuve vous incombait alors lourdement pour démontrer que l’univers s’était en quelque sorte déformé. Mais que se passe-t-il lorsque les outils permettant de fabriquer la réalité surpassent ceux permettant de détecter la fraude ? Que se passe-t-il lorsque des preuves synthétiques passent sans encombre les filtres de l’admissibilité juridique, laissant aux citoyens ordinaires le soin de prouver une négation dans un système conçu pour les écraser ?
Le jour où la porte s’est fissurée
Pour comprendre comment on en est arrivé là, il faut se pencher sur les coulisses peu reluisantes de la procédure judiciaire. Oubliez les effets théâtraux de Law & Order. La véritable bataille se joue lors des audiences préliminaires consacrées à l’examen des preuves, notamment en vertu de normes telles que la règle fédérale de preuve 901 aux États-Unis, ou ses équivalents dans divers codes civils européens. Historiquement, l’authentification d’une vidéo nécessitait qu’un témoin déclare : « Oui, cela représente de manière juste et précise ce que j’ai vu », ou qu’un expert en criminalistique numérique vérifie les métadonnées et recherche d’éventuelles modifications maladroites.
Puis sont apparus les pipelines de génération adversaire qui ne se contentent pas d’imiter les pixels : ils reproduisent les imperfections physiques des objectifs. Ils simulent le bruit de capteur exact d’un modèle d’iPhone spécifique. Ils génèrent une aberration chromatique cohérente.
L’année dernière, un revirement discret s’est produit dans une affaire jugée par une cour d’appel de deuxième instance concernant de l’espionnage industriel. Une vidéo montrant un lanceur d’alerte en train de voler, selon les allégations, du code source propriétaire a été contestée au motif qu’il s’agissait d’un deepfake. La défense a fait appel à un analyste en criminalistique qui a relevé des anomalies mineures dans les vecteurs d’éclairage. L’accusation a riposté en faisant appel à son propre expert, un homme qui semblait ne pas avoir dormi depuis la sortie de GPT-4, qui a fait valoir que ces anomalies n’étaient que des artefacts de compression provenant d’un ancien système de caméras de sécurité.
Confronté à un choix entre deux affirmations hautement techniques et mutuellement incompatibles, le juge a levé les bras au ciel. Selon les normes en vigueur, le seuil d’admissibilité n’est pas la certitude absolue ; il s’agit d’une présomption prima facie selon laquelle la preuve est bien ce qu’elle prétend être. La vidéo a été admise. Le jury, subjugué par la puissance brute et viscérale des images animées, a rendu son verdict de culpabilité en quarante minutes.
La porte ne s’est pas contentée de se fissurer. Elle a été arrachée de ses gonds et emportée.
La fragilité de l’alibi épistémique
Si l’État ou un adversaire fortuné diffuse une vidéo d’une qualité irréprochable vous montrant en train de commettre un crime, comment riposter ?
Votre première réaction, c’est de trouver un alibi. « Je n’étais pas là. »
Mais analysons de près la structure d’un alibi moderne. Il repose presque entièrement sur le panoptique numérique dans lequel nous vivons. Vous consultez l’historique de localisation de votre téléphone. Vous recherchez les chronologies de Google Maps, les données de localisation d’Apple ou les reçus de covoiturage.
Sauf que, si votre adversaire est suffisamment habile pour mettre en place un deepfake indétectable, il l’est aussi pour manipuler ou discréditer votre empreinte numérique. La falsification de localisation est un jeu d’enfant. Un procureur avisé peut facilement faire valoir que vous aviez laissé votre téléphone chez vous lorsque vous êtes sorti pour commettre les faits, ou que vous aviez utilisé un réseau privé virtuel et des outils de simulation GPS pour créer un écran de fumée numérique.
Tout à coup, le fait de vous fier à vos traces numériques se retourne contre vous. Les outils mêmes que vous utilisez pour prouver où vous vous trouviez sont présentés comme des preuves de préméditation et de dissimulation.
Et qu’en est-il des témoins humains ? Le cerveau humain est connu pour être une source d’erreurs. Imaginez que vous essayiez de convaincre un jury que votre voisin vous a vu tondre la pelouse à 16 h un mardi, il y a quatorze mois, alors que l’accusation dispose d’une vidéo haute définition vous montrant en train de cambrioler une supérette située à trois villes de là, à ce moment précis. Le jury regardera le voisin nerveux et en sueur, regardera la vidéo d’une netteté cristalline, et conclura que le voisin se trompe ou ment pour protéger un ami.
La réalité synthétique revêt, aux yeux de la psyché humaine, une valeur de vérité plus grande que le témoignage brut et imparfait d’une âme vivante.
La course à l’armement dans le domaine de la criminalistique est déjà terminée
Des dirigeants du secteur technologique optimistes nous assurent que le tatouage numérique et la traçabilité cryptographique seront notre salut. Ils citent des initiatives telles que la Coalition for Content Provenance and Authenticity (C2PA), qui intègre des métadonnées sécurisées dans les photos et les vidéos au moment même de leur capture.
C’est une belle vision. Un monde où chaque caméra sécurise ses enregistrements à l’aide d’une clé cryptographique, créant ainsi une chaîne de traçabilité ininterrompue, de l’objectif jusqu’à la salle d’audience.
Mais cela ne tient pas compte de la réalité chaotique et rafistolée du monde dans lequel nous vivons réellement.
Tout d’abord, la norme C2PA nécessite une adoption généralisée par les fabricants de matériel. Des millions de caméras existantes — qu’il s’agisse d’anciens smartphones ou de systèmes de vidéosurveillance bon marché installés dans les petits commerces — resteront en service pendant des décennies. Elles ne sont pas équipées de puces cryptographiques.
Deuxièmement, que se passe-t-il lorsqu’une vidéo est recadrée, compressée, enregistrée à l’écran ou convertie à l’aide d’un convertisseur de format ? La chaîne de métadonnées sécurisée est rompue. Dans la réalité des enquêtes criminelles, les preuves sont rarement fournies sur un plateau d’argent sous la forme d’un fichier brut intact. Elles sont téléchargées depuis un groupe WhatsApp, extraites d’un serveur cloud privé ou récupérées à partir d’un disque dur endommagé. Au moment où elles parviennent à un analyste médico-légal, elles ne sont plus qu’un méli-mélo de pixels réencodés.
De plus, pensons au « dividende du menteur ». Il s’agit là du problème inverse, tout aussi néfaste pour la justice. Lorsque les deepfakes deviendront omniprésents et susciteront une crainte généralisée, les véritables coupables pourront tout simplement prétendre que les preuves tangibles de leurs crimes sont de fabrication artificielle. Un homme politique corrompu pris en flagrant délit de corruption pourra regarder droit dans l’objectif et déclarer : « C’est une création de l’IA. »
Le système judiciaire se paralyse lui-même. Quand tout peut être faux, rien ne peut être prouvé. Le principe de base passe de « présomption d’innocence » à « celui qui dispose de l’expert technique le plus convaincant l’emporte ».
L’asymétrie de la défense technique
Parlons d’argent. Car la justice, dans un monde artificiel, est un bien extrêmement coûteux.
Si vous êtes un dirigeant milliardaire accusé d’un crime à la suite d’une vidéo deepfake, vous pouvez faire appel à un cabinet spécialisé en criminalistique numérique basé à Munich ou à Tel-Aviv. Ils dépenseront 300 000 dollars pour disséquer le fichier image par image. Ils analyseront les variations du flux sanguin sous votre peau (photopléthysmographie) visibles dans la vidéo afin de prouver que la fréquence cardiaque ne correspond pas à celle d’un cœur humain en situation de stress. Elle cartographiera les reflets dans la cornée de votre œil pour montrer que l’environnement reflété ne correspond pas à l’arrière-plan.
Mais que se passerait-il si vous étiez caissier dans une épicerie de banlieue ? Et si vous étiez livreur, accusé d’un délit de fuite sur la base d’une vidéo de caméra embarquée fabriquée de toutes pièces, placée là par un voisin en colère qui vous en veut et qui est abonné à une plateforme de création de contenu premium ?
Les avocats commis d’office croulent déjà sous des montagnes de dossiers, survivant à force de café et face à une négligence systémique. Ils n’ont pas les moyens de s’adjoindre les services d’experts en criminalistique de pointe spécialisés dans l’IA. Ils n’ont pas les moyens de contester les analyses de pointe menées par l’État. L’État présentera un rapport rédigé par un technicien de la police locale qui a analysé la vidéo à l’aide d’un outil de détection commercial disponible dans le commerce, des outils notoirement sujets aux faux positifs et aux faux négatifs, et le technicien dira : « Le logiciel indique qu’il y a 98 % de chances que ce soit authentique. »
Ce chiffre, « 98 % », planera au-dessus de la salle d’audience comme une guillotine.
On conseillera à l’accusé d’accepter un accord de plaidoyer. Il plaidera coupable d’un crime qu’il n’a pas commis, car l’alternative est une peine minimale obligatoire fondée sur une erreur informatique.
Le retour du monument physique
Alors, comment faire pour s’en sortir ? Comment se forger une armure pour défendre la vérité ?
Il se pourrait bien que nous devions nous retirer complètement de ce désert numérique lorsqu’il s’agit de prouver l’existence de nos vies. Nous pourrions assister au retour du monument physique — l’alibi analogique.
Je vois se dessiner un nouveau modèle économique : le Bureau de vérification analogique. Imaginez une entreprise qui gère des installations sécurisées et hors ligne dans les grandes villes. Moyennant un abonnement mensuel, vous entrez dans ces locaux, poinçonnez une carte de pointage physique, passez votre main dans un lecteur biométrique qui appose sur un document papier un tampon à l’encre qui se dégrade au fil du temps selon un motif chimique spécifique et impossible à reproduire. Le document est ensuite enfermé dans un coffre-fort ignifuge. Cela semble absurde. Cela ressemble à de la bureaucratie médiévale. Mais lorsque le monde numérique est entièrement compromis, les seules choses auxquelles nous pouvons faire confiance sont celles que nous pouvons toucher, sentir et vérifier par des moyens physiques.
Nous pourrions également assister à une réévaluation radicale des règles de preuve. Les tribunaux pourraient être amenés à adopter un « principe d’exclusion synthétique ». Si une preuve numérique ne peut être rattachée à son origine physique par le biais d’une chaîne matérielle ininterrompue et vérifiée cryptographiquement, elle doit être totalement exclue de la procédure pénale. Le risque qu’une vidéo truquée conduise à la condamnation d’une personne innocente est tout simplement trop élevé pour que l’on puisse tolérer l’approche actuelle consistant à « laisser le jury décider ».
Cela reviendrait à laisser certains coupables en liberté parce que la vidéo de leur crime n’a pas été correctement sécurisée au niveau matériel. Mais c’est là le principe fondateur même de la jurisprudence occidentale : le ratio de Blackstone. Mieux vaut que dix coupables s’en tirent plutôt qu’un innocent ne souffre. Nous l’avons oublié dans notre empressement à numériser nos salles d’audience.
La violence silencieuse du mensonge parfait
La pluie a cessé devant le Palais de Justice. La lumière grise s’estompe pour laisser place à un soir aux teintes pourpres. Je regarde un jeune couple prendre un selfie sur les marches, en riant, en inclinant leur téléphone pour capter la lueur des réverbères. Ils créent un souvenir numérique, qu’ils diffusent dans l’éther, confiants qu’il restera un témoin fidèle de leur jeunesse.
Ils ne savent pas que le sol sous leurs pieds se liquéfie. Ils ne savent pas que l’image d’eux-mêmes capturée dans ce téléphone leur échappe désormais, tel un fil égaré que l’on peut ramasser, retisser et utiliser pour nouer un nœud coulant.
Nous ne sommes pas préparés à la violence insidieuse du mensonge parfait. Nous continuons à jouer selon les règles d’un monde analogique alors que les salles d’audience sont hantées par des fantômes synthétiques. Si nous ne modifions pas rapidement les règles qui régissent les gardiens de l’information, nous nous retrouverons dans une société où l’innocence ne sera plus un état d’esprit, mais un produit de luxe que peu de gens auront les moyens de racheter aux algorithmes.

