Les algorithmes de reconnaissance faciale les plus précis ont démontré leur capacité à confirmer l’identité des passagers des compagnies aériennes en commettant très peu d’erreurs, selon des tests récents du logiciel menés au National Institute of Standards and Technology (NIST).
Les résultats, publiés aujourd’hui sous le titre Test de fournisseur de reconnaissance faciale (FRVT) Partie 7 : Identification pour les voyages et l’immigration sans papier (NISTIR 8381), se concentrent sur les performances des algorithmes de reconnaissance faciale (FR) dans un ensemble particulier de circonstances simulées : faire correspondre des images de voyageurs avec des photos de ces voyageurs précédemment obtenues et stockées dans une base de données. Cette utilisation de FR fait actuellement partie du processus d’embarquement sur les vols internationaux, à la fois pour confirmer l’identité d’un passager sur la liste de vols de la compagnie aérienne et également pour enregistrer la sortie officielle d’immigration du passager des États-Unis.
Les résultats indiquent que plusieurs des algorithmes FR testés par le NIST pourraient effectuer cette tâche en utilisant un seul scan du visage d’un passager avec une précision de 99,5 % ou mieux, surtout si la base de données contient plusieurs images du passager.
« Nous avons effectué des simulations pour caractériser un système qui accomplit deux tâches : identifier les passagers à la porte d’embarquement et enregistrer leur sortie pour l’immigration », a déclaré Patrick Grother, informaticien au NIST et l’un des auteurs du rapport. « Nous avons constaté que la précision varie selon les algorithmes, mais que les algorithmes modernes fonctionnent généralement mieux. Si les compagnies aériennes utilisent les plus précis, les passagers peuvent embarquer sur de nombreux vols sans erreur. »
Les études FRVT précédentes se sont concentrées sur l’évaluation de la manière dont les algorithmes effectuent l’une des deux tâches différentes qui comptent parmi les applications les plus courantes de FR. La première tâche, qui consiste à confirmer qu’une photo correspond à une autre photo de la même personne, est connue sous le nom de correspondance « one-to-one » et est couramment utilisée pour des travaux de vérification, comme le déverrouillage d’un smartphone. La seconde, qui consiste à déterminer si la personne sur la photo correspond à une grande base de données, est connue sous le nom de correspondance « un-à-plusieurs ».
Ce dernier test concerne une application spécifique de la correspondance un-à-plusieurs dans les contextes de transit aéroportuaire, où les visages des voyageurs sont comparés à une base de données d’individus qui sont tous censés être présents. Dans ce scénario, seules quelques centaines de passagers embarquent sur un vol donné. Cependant, le NIST a également examiné si la technologie pourrait être viable ailleurs dans l’aéroport, en particulier dans la ligne de sécurité, où l’on pourrait s’attendre à ce qu’il y ait peut-être 100 fois plus de personnes pendant une certaine fenêtre de temps. (La base de données a été construite à partir d’images utilisées dans des études FRVT précédentes, mais les sujets ne portaient pas de masques faciaux.)
Comme pour les études précédentes, l’équipe a utilisé des logiciels que les développeurs ont volontairement soumis au NIST pour évaluation. Cette fois, l’équipe n’a examiné que les logiciels conçus pour effectuer la tâche de correspondance un-à-plusieurs, évaluant un total de 29 algorithmes.
Parmi les conclusions du rapport figurent :
- Les sept algorithmes les plus performants peuvent identifier avec succès au moins 99,5 % des passagers du premier coup si la base de données contient une image d’un passager. Si la base de données contient une seule image de chaque individu, l’étude montre que pour pas moins de 428 des 567 processus d’embarquement simulés, avec chaque vol transportant 420 passagers, l’algorithme FR le plus précis peut identifier les passagers à embarquer sans aucun faux négatif (c’est-à-dire le logiciel ne parvient pas à faire correspondre deux images de la même personne). Exprimé en termes de taux d’erreur, cela correspond à au moins 99,87 % des voyageurs pouvant embarquer avec succès après s’être présentés une seule fois à la caméra. Six algorithmes supplémentaires donnent une précision supérieure à 99,5 %.
- Les performances s’améliorent considérablement si la base de données contient plusieurs images d’un passager. La galerie de bases de données peut contenir plusieurs images d’un même passager. Lorsqu’une moyenne de six images antérieures d’un passager se trouve dans la galerie, alors tous les algorithmes réalisent des gains importants : l’algorithme le plus précis vérifiera l’identité des passagers sur 545 des 567 vols sans aucune erreur, et au moins 18 algorithmes des développeurs sont efficaces. à identifier avec précision plus de 99,5% des voyageurs avec une seule présentation à la caméra.
- Les différences démographiques dans l’ensemble de données ont peu d’effet. L’équipe a exploré les différences de performance entre les sujets masculins et féminins ainsi que selon l’origine nationale, qui étaient les deux identifiants inclus dans les photos. L’origine nationale peut, mais ne reflète pas toujours, l’origine raciale. Algorithmes exécutés avec une grande précision dans toutes ces variations. Les faux négatifs, bien que légèrement plus fréquents chez les femmes, étaient rares dans tous les cas.
Grother a déclaré que l’étude n’aborde pas un facteur important : le type de caméra utilisée par un système FR. Étant donné que les environnements aéroportuaires diffèrent et que les caméras elles-mêmes fonctionnent de différentes manières, le rapport propose des conseils sur les tests qu’une compagnie aérienne ou une autorité d’immigration pourrait effectuer pour compléter les résultats des tests du NIST. De tels tests fourniraient des estimations de précision qui reflètent l’équipement et l’environnement réels dans lesquels il est utilisé.
« Nous ne nous concentrons pas sur les caméras, qui constituent une variable influente », a-t-il déclaré. « Nous recommandons aux responsables d’effectuer les autres tests que nous décrivons afin d’affiner leurs opérations. »
« Analyste de longue date. Passionné de cuisine subtilement charmant. Introverti. Accro aux médias sociaux. Lecteur. Pionnier général de la télévision. Étudiant. Future idole des adolescents. »