NCIES - Poitiers
Equipe informatique

logo sic
Wassim Hamidouche
logo lisi
François Dorin
logo sic
Olivier Kihl

Bien sur les enquêteurs ont retrouvés plusieurs empreintes digitales sur la scène de crime. Ce dossier va présenter comment elles peuvent nous donner des informations et nous aider à indentifier les êtres humains.

I. Introduction

Une empreinte digitale est le dessin formé par les lignes de la peau des doigts (les dermatoglyphes). Une empreinte digitale est habituellement le dépôt de sébum laissé par le contact du doigt avec une surface. Elle peut toutefois également être causée par des substances présentes sur la surface, comme des pigments ou d'autres substances colorées ou malléables (par exemple l'encre). Elles existent également chez nos parents biologiques les plus proches, les pongidés (chimpanzé, orang-outan, gorille).

Les empreintes digitales se forment très tôt chez l'embryon, conservent les mêmes caractéristiques pendant toute la vie et sont uniques chez chacun d'entre nous, y compris chez les vrais jumeaux, constituant ainsi un moyen sûr d'identification des personnes.

Le caractère quasi-unique d'une empreinte digitale en fait un outil biométrique très utilisé pour l'identification des individus en médecine légale et pour la police scientifique.

II. Point de vue historique

1. dans l'antiquité

L'utilisation des empreintes digitales est très ancienne. A Babylone il y a 5 000 ans et, plus tard, dans la Chine antique l'empreinte du pouce laissée dans une tablette d'argile tenait lieu de signature lors des transactions commerciales.

2. Plus récemment

Au XVIIème siècle, en Europe, Marcello Malpighi (1628-1694) un médecin italien en étudia les dessins.

En 1823, Jan Evangelista Purkinje, physiologiste tchèque (1787-1869) publia une thèse dans laquelle il étudiait neuf types d'empreintes digitales.

Toutefois, c'est seulement à partir de 1870 que les empreintes digitales furent utilisées pour la première fois pour identifier des personnes. Le docteur Henry Faulds, chirurgien dans un hôpital de Tokyo, avait eu cette idée lorsqu'il avait remarqué des empreintes digitales sur une poterie préhistorique. Il publia en 1880 dans la revue Nature un article dans lequel il discutait l'utilité des empreintes pour l'identification et proposait une méthode pour les enregistrer avec de l'encre de l'imprimerie. Il en établit également une première classification et fut aussi le premier à identifier des empreintes laissées sur un flacon. En effet, les productions des glandes sébacées de la peau laissent des traces latentes sur différents supports. Il est possible de les révéler avec diverses poudres et d'examiner le dessin formé qui reproduit les crêtes des dermatoglyphes.

Ces travaux furent tranmis à Francis Galton (1822-1911) qui étudia les empreintes digitales pendant dix ans et publia en 1892 un ouvrage, Fingerprints (Empreintes digitales), dans lequel il établissait l'unicité et la permanence de ces figures cutanées et proposait un système de classification. Il démontra ce que ses prédécesseurs avaient pressenti, qu'il n'y a pas deux empreintes semblables et que les empreintes restent identiques chez un même individu au cours de sa vie. Il calcula qu'il y avait seulement une chance sur 64 milliards que deux individus aient les mêmes empreintes. En 1891, le premier fichier d'empreintes fut mis en place en Argentine par Juan Vucetich, un dirigeant de la police qui fut aussi le premier à identifier un criminel par ses empreintes en 1892.

En France, c'est en 1902, après une enquête policière conduisant à l'arrestation de Henri-Léon Scheffer, que les empreintes digitales sont devenues l'une des principales preuves lors des enquêtes policières. En France, le Fichier automatisé des empreintes digitales (FAED) a été institué par le décret du 8 avril 1987. Ce fichier est non nominatif et géré par le ministère de l'Intérieur. Depuis la loi d'orientation pour la sécurité intérieure de 2002, il s'étend aux empreintes palmaires.

Le fichier du FBI américain comportait en 1999 les empreintes de 33 millions de criminels, le fichier français en comportait 900 000 en 1998.

III. Caractérisation d'une empreinte digitale

image1
Figure 1 : Les différents points caractéristiques d'une empreinte

La donnée de base dans le cas des empreintes digitales est le dessin représenté par les crêtes et sillons de l'épiderme. Ce dessin est unique et différent pour chaque individu.

Cependant, dans la pratique il serait impossible de réussir à utiliser toute l'information contenue dans le dessin de manière automatique et étant donné le nombre d'empreinte contenu dans les fichiers de police une analyse humaine non assistée est impossible.

On préférera donc en extraire les caractéristiques principales comme on peut le voir sur la figure 1.

Légalement la détection et la concordance de 12 minuties (c'est comme cela qu'on appelle ces points) entre deux empreintes suffie pour identifier un individu. pourtant il est possible de détecter une quarantaine de ces points.

IV. Le traitement de l'image

1. L'acquisition de l'empreinte

figure 2a
(a)
figure 2b
(b)
figure 2c
(c)
Figure 2 : Différentes étapes de l'acquisition de l'image ; (a) image issu d'un capteur de type CCD (photographie numérique) ; (b) image binarisée ; (c) image squelettisée

Il existe différents types de capteur pour obtenir les empreintes digitales, cependant dans le cadre des enquêtes criminelles, après avoir été détectées grâce à différents révélateurs chimiques, elles sont stockées grâce à un appareil photographique numérique (APN). Nous allons donc uniquement considérer ce cas.

L'image issue d'un APN est une image en niveau de gris, c'est à dire que chaque pixel de l'image peut prendre des valeurs entre 0 et 255. Le 0 correspond à un point noir tandis que le 255 à un pixel blanc. De 0 à 255 il y a donc 256 valeurs possible du plus foncé au plus clair (voir Figure 2a).

La première étape va donc être de transformer cette image en une image composée uniquement de pixel blanc ou noir (voir Figure 2b).

La dernière étape de l'acquisition de l'image est appelée squelettisation, c'est à dire que les lignes de l'image vont toutes être de la même largeur (voir Figure 2c).

V. Recherche dans les bases de données

1. Introduction

Disposant maintenant d'une empreinte digitale, nous devons rechercher dans nos bases de données afin de vérifier si, par hasard, notre meurtrier ne serait pas déjà fiché. Mais tout d'abord, comment définir une base de données ? Une base de données est simplement un ensemble d'informations ordonnées et structurées. Un exemple : le dictionnaire. C'est un ensemble ordonné et structuré de mots d'une langue.

2. Comment rechercher dans une base de données

Pour rechercher une information dans une base de données, le plus efficace est de pouvoir les trier, de façon à ne pas avoir à explorer la base entièrement pour trouver une information. Revenons à l'analogie du dictionnaire : lorsqu'on recherche la signification du mot, on "recherche" ce mot dans le dictionnaire. Ce processus de recherche est possible car les mots sont triés par ordre alphabétique. Ils sont "ordonnés".

Imaginez maintenant que les mots ne soient plus triés par ordre alphabétique, mais soient dans un ordre quelconque. Si votre dictionnaire ne contient qu'une dizaine de mots, il est possible de trouver la définition recherchée assez rapidement. Par contre, si votre dictionnaire comporte plusieurs dizaine de milliers de mots, vous risquez de "rechercher" votre mot un certain temps.

La "structure" correspond au comment sont représentées les informations dans la base de données. Dans le cas du dictionnaire, cette structure est simple : à chaque mot est associée une définition.

3. Comment représenter les données

La question de la représentation des données dans la base de données est primordiale, puisque cette représentation déterminera les méthodes possibles pour effectuer les recherches.

Dans le cas des empreintes digitales, deux représentations sont envisageables :

  • stocker les images des empreintes ;
  • stocker les minuties.

Stocker les empreintes n'est pas une représentation viable pour de grandes bases de données. En effet, la comparaison de deux empreintes est réalisée sur la base de la comparaison des minuties. C'est-à-dire que pour chaque empreinte stockée dans la base de données, il faut "recalculer" ses minuties pour ensuite pouvoir les comparer. En plus des calculs nécessaires pour la détermination des minuties, cela sous-entend, si on reprend l'analogie du dictionnaire, à avoir un dictionnaire dont les mots ne sont pas triés par ordre alphabétique ! Si ce système peut-être utilisé pour des petites bases de données (par exemple, vérification de l'identification sur un ordinateur personnel), cette méthode n'est pas envisageable pour des bases de données contenant plus centaines de milliers d'empreintes digitales.

Il reste donc la deuxième option, c'est-à-dire stocker les minuties. Il reste donc à déterminer comment les stocker. Et il s'agit d'un problème de recherche. Comment représenter les données de manière le plus efficace possible ? S'il est facile de le faire dans le cas des mots, puisque l'ordre alphabétique est un ordre naturel pour nous, ce n'est pas le cas à chaque fois. D'autant plus que pour rendre le plus efficace possible la représentation des données dans une base de données, il faut savoir exactement quel(s) type(s) de requête(s) vont être exécuté(s), c'est-à-dire quelles sont les informations que l'on souhaite en extraire, et selon quel(s) critère(s).

4. Les requêtes

Une autre difficulté majeure dans la consultation des bases de données des empreintes digitales est que deux empreintes sont considérées comme identique si le nombre de minutie identique est supérieure ou égale à 12. C'est-à-dire que pour deux empreintes A et B ayant 12 minuties communes, il peut y avoir des minuties présentent dans A mais pas dans B et inversement.

Ainsi, la requête a exécuté sur la base de données pour recherche une empreinte n'est pas "rechercher une empreinte dont toutes les minuties correspondent", mais "rechercher une empreinte ayant au moins 12 minuties en commun". C'est comme si pour rechercher la définition d'un mot dans le dictionnaire on ne comparait pas chaque lettre, mais que l'on cherchait un mot ayant au moins x lettres communes.

5. Synthèse

L'aspect "recherche dans une base de données" à donc permis de mettre en évidence quelques points de recherche pour les bases de données, que nous pouvons récapituler ainsi :

  • algorithme d'optimisation des requêtes ;
  • représentation des données (quoi représenter) ;
  • structure des données (comment le représenter).

Il va de soi cette liste n'est pas exhaustive et donc que ces axes de recherches ne sont pas les seuls de ce domaine. Nous avons juste mis en avant les axes mis en évidence par la recherche d'une empreinte digitale...


Liens :

Accueil

Haut de page