Le hash contre Daech

Le jeu des 7 images

Soit un dossier contenant 7 images dont les noms sont : IMG_0992.JPG IMG_0999.JPG IMG_1006.JPG katiba.jpg IMG_0995.JPG IMG_1000.JPG IMG_1007.JPG.

Deux sont identiques. Comment trouver lesquelles ?

IMG_0999.JPG

Les signatures : md5sum

Sous linux, on trouve le programme md5sum qui permet de calculer une signature pour chaque image.

On tape donc la commande "md5sum *"

7c57104d62ce55897a55fcd4898960c3 IMG_0992.JPG
b16ce83ef23164a6b35039bf794cbee2 IMG_0995.JPG
137caf86902dd8717b602ff5473ca6b3 IMG_0999.JPG
6f47819fed0b0cfe91abcadc1a1d74c0 IMG_1000.JPG
d2df91e6c01c6b1f8b8bc9d6a0ea4633 IMG_1006.JPG
0e308e2112cae5dde2b3c1d55d27cbd0 IMG_1007.JPG
0e308e2112cae5dde2b3c1d55d27cbd0 katiba.jpg

On voit que les fichiers IMG_1007.JPG et katiba.jpg sont les mêmes.

katiba.jpg / IMG_1007.JPG

Un outil pour lutter contre la propagande djihadiste ?

Imaginons des bases de données contenant les signatures md5 de toutes les images et vidéos de l'Etat Islamique. Il suffirait à Facebook, Twitter, Youtube de calculer la somme md5 de n'importe quel fichier soumis pour être certain que cette image n'a pas déjà été identifiée comme outil de propagande terroriste.

IMG_0995.JPG

Ce système semble fonctionner pour lutter contre la pédophilie en identifiant les images d'enfants. Cependant les compagnies n'en veulent pas d'après cet article.

Pourquoi ? Contrairement à la pornographie des mineurs, le terrorisme n'est pas interdit aux US, et il n'est pas clairement définie non plus. Le drapeau de l'EI sur une photo ne suffit pas à qualifier cette image comme outil de propagande.

Hany Farid

Derrière cette idée, il y a le génial Hany Farid, spécialiste entre autre de l'analyse d'images. On peut tester un outil permettant de garantir qu'une photo n'a pas été modifiée. J'ai testé avec IMG_1006.JPG. Il a reconnu que ce n'était pas l'originale, ce qui est vraie, puisque je l'avais découpée et que j'avais diminué sa taille avec Gimp.

J'ai ensuite envoyé l'image téléchargée depuis l'appareil photo. Le logiciel l'a acceptée :

This image passed all of our forensic tests, so the evidence strongly suggests it is an unmodified original file from a camera.

S'il propose des outils permettant d'identifier la propagande djihadiste, il y aura sans doute des faux-positifs, mais ce ne sera pas pire que maintenant. La signature qu'il propose n'est pas que le résultat md5sum. On peut imaginer qu'il a de quoi fournir des algorithmes dignes de confiance.

Oum Oristique, ou l'allergie de Twitter à la parodie

Aujourd'hui, le compte Oum Oristique a été suspendu par Twitter. Ce n'est pas le premier, ni le dernier... Par conséquent, même si l'algorithme de Farid présente des erreurs, ce ne sera pas pire que maintenant.

Il n'est pas rare que les parodiques reprennent de véritables images de propagande et ajoutent simplement un commentaire qui montre clairement qu'il ne s'agit de pas de comptes de l'EI.

Par exemple :

Si derrière chaque barbe il y'avait 1 savant; les biquettes seraient toutes prophètes.

Le saviez vous? daesh signifie Délégation des Analphabètes Élevés Sous Héroïne.

Pour les images parodiques, il suffirait de les modifier pour qu'elles ne soient pas identifiées comme appartenant à l'EI.

IMG_1000.JPG

Si je calcule la somme md5, j'ai maintenant :

df5d942c5ac63c6da77eeaf1533061bf IMG_1000.JPG

Ce qui est différent de l'image sans le logo :

6f47819fed0b0cfe91abcadc1a1d74c0 IMG_1000.JPG

Je ne suis pas spécialiste du traitement d'image, mais je n'ai aucun doute sur le fait que le logo de la katiba puisse être automatiquement repéré par des logiciels.

Et en France ?

Comme le répète le compte @stopdjihadisme, depuis le 3 juin 2016 : 5 ans de prison / 75K € d'amende pour des contenus diffusés faisant l'apologie du terrorisme.

Twitter pourra toujours dire qu'il lui faut une définition de "l'apologie publique d'actes de terrorisme", mais ce sera de la mauvaise foi. Après Orlando, on a vu passer des horreurs en français, du contenu clairement homophobe, faisant sans aucun doute l'apologie du terrorisme.

Alors certes, il n'est pas forcément émis depuis la France, des VPN ou TOR ont pu être utilisés. Cependant, Twitter a les moyens techniques et législatifs de lutter contre la propagande djihadiste francophone. Pourquoi ne le fait-il pas ?

Est-il possible que l'image IMG_0992.JPG ci-dessous représente autre chose qu'un feu d'artifice ?

De plus, les citoyens français ont sacrifié depuis des mois leur liberté en acceptant l'état d'urgence. Auparavant, le projet de loi sur le renseignement (avec les IMSI Catcher) a été voté. Quitte à être surveillés 24h/24, pourquoi les images de propagande ne sont-elles pas filtrées directement chez les fournisseurs d'accès et opérateurs téléphoniques puisque Hany Farid prétend pouvoir le faire ?

La vie, l'univers et le reste...

Rechercher dans ce blog