1. Visão Geral de Conceitos Biométricos¶
1.1. Introdução¶
Historicamente, o termo biometria está relacionado às Ciências Biológicas e refere-se à aplicação de métodos estatísticos a uma vasta gama de características mensuráveis na biologia. Atualmente, é mais comumente usado em Tecnologia da Informação, consistindo de identificação eletrônica de seres humanos baseado em suas características físicas e comportamentais.
1.2. Digitais¶
Impressões digitais são consideradas uma das características mais confiáveis para reconhecimento humano devido a sua individualidade e persistência. Uma impressão digital consiste de padrões de cristas e vales na superfície do dedo e sua formação ocorre nos primeiros meses de desenvolvimento do feto. Sua principal desvantagem é sua intrusividade, pois as pessoas precisam cooperar explicitamente para fornecer suas impressões digitais para um sistema biométrico. Além do mais, autenticação baseada em impressão digital está tradicionalmente associada a procedimentos criminais. O estado da arte dos métodos de autenticação baseasa em impressões digitais demonstra ter precisão e confiabilidade adequadas.
1.2.1. Minúcias¶
Uma impressão digital é caracterizada pelo padrão de intervalos de cristas (linhas escuras) e vales (linhas claras). Geralmente, cristas e vales correm em paralelo e algumas vezes acabam ou bifurcam. Em um nível global, as impressões digitais podem apresentar regiões com padrões de curvatura peculiar, chamados de singularidade. Em nível local, há uma outra característica importante chamada minúcia que pode ser encontrada nos padrões de impressão digital. Minúcia deriva do Latim “pequenos detalhes” (minutiae), e isso refere-se a um comportamento de descontinuidade dos cristas, como terminações, bifurcações, trifurcações ou outras características como poros (pequenos buracos dentro das cristas), lagos (duas bifurcações fechadas), pontos (pequenas cristas), etc. A maioria dos sistemas usa somente bifurcações e terminações. Para comparar (casar) propriamente impressões digitais, as características das impressões, tais como minúcias e pontos de singularidades, devem ser extraídos. Também é possível extrair outras informações globais tal como orientação e frequência das regiões de crista da impressão digital. As imagens abaixo mostram uma impressão digital capturada por um scanner de impressões digitais e as características extraídas correspondentes: cristas (linhas negras finas) e minúcias (flechas azuis para terminações e flechas vermelhas para bifurcações).
O processo de interpretação dessas características de imagens digitalizadas é chamado de extração. Isso envolve algoritmos avançados de processamento de sinal e leva consideravelmente mais tempo que comparar as características de duas impressões digitais. Portanto, sistemas biométricos tentam realizar essa extração somente uma vez e armazenam as características extraídas em um conjunto de dados chamado template de impressão digital.
1.2.2. Templates de Impressão Digital¶
As características extraídas de impressões digitais (minúcias, cristas, singularidades) são armazenadas em um arquivo de template. Esses podem ser armazenados em uma grande variedades de formatos padrões e proprietários. Formatos padronizados em geral incluem apenas um conjunto mínimo de informações, úteis para a troca de templates de impressão digital entre sistemas biométricos distintos.
Formatos proprietários de template de impressão digital incluem propriedades pré-computadas do conjunto de minúcias que são específicos para cada fabricante de sistema ABIS 1, permitindo coincidências mais rápidas e com maior precisão.
- 1
ABIS é um acrônimo para Automated Biometric Identification System (Sistema Automatizado de Identificação Biométrica)
1.2.2.1. ISO¶
O ISO (International Organization for Standardization) e IEC (International Electrotechnical Commission) publicaram em 2015 a família de padrões ISO/IEC 19794, que é comumente aplicada a formatos de dados biométricos, padronizando conteúdos comuns, significados e representações de formatos de dados biométricos e modalidades biométricas, além de especificar quais requisitos resolvem as complexidades da aplicação da biometria a uma ampla variedade de aplicações de reconhecimento de pessoas, quer essas aplicações operem em um ambiente de sistemas abertos ou consistam em um único sistema fechado.
O padrão ISO/IEC 19794-2 especifica os formatos de dados para representação de impressões digitais usando a notação de minúcias, definindo três modelos de formatos para a troca e armazenamento de dados de minúcias de impressões digitais. Ele define um formato baseado em registros, um normal e um compacto para o uso de cartões inteligentes. Também define um formato estendido que pode lidar com contagem de cristas adicionais e localização de núcleos e deltas.
1.2.2.2. ANSI¶
Imagens de impressões digitais têm sido amplamente utilizadas por agências e polícias ao redor do mundo para identificação criminal. A introdução do Sistema Automatizado de Identificação de Impressões Digitais (AFIS, do inglês Automatic Fingerprint Identification Systems) dessas agências criou uma demanda por formatos padrões para interoperabilidade e troca de informação entre subsistemas de AFIS geograficamente dispersos.
O padrão ANSI 378/2004 especifica os formatos de dados para a representação de impressões digitais usando a noção fundamental de minúcias. O formato de dado é genérico, e pode ser aplicado e usado em uma grande variedade de áreas de aplicações onde o reconhecimento automático de impressões digitais está envolvido. Nenhum requerimento específico de aplicação ou de características é endereçado nesse padrão. O padrão contém definições de termos relevantes, uma descrição de as minúcias devem ser definidas, um formato de dados para representar os dados de impressão digital e dados de conformidade.
1.2.2.3. Consolidação de Templates¶
Duas capturas de um mesmo dedo dificilmente serão idênticas, apresentando pequenas variações no posicionamento das minúcias e na qualidade. Algumas minúcias também podem aparecer ou desaparecer devido a pequenas mudanças no posicionamento do dedo sobre o sensor em cada captura.
Para aumentar a qualidade do modelo, pode-se realizar uma captura rolada, mas este tipo de captura não é suportada por todos os equipamentos de digitalização, e pode apresentar suas próprias dificuldades devido ao movimento de rolagem que o dedo necessita realizar. Nesses casos, pode-se realizar várias capturas e combiná-las para identificar minúcias das impressões digitais gerando um modelo de maior qualidade.
O processo de obtenção de múltiplas capturas e combinação dos modelos extraídos em um é chamado de consolidação de templates. Esse método proporciona várias vantagens: Ele é capaz de aumentar a qualidade geral das minúcias; Pode descartar falsas minúcias incorretamente detectadas devido a problemas na qualidade de captura; É capaz de combinar minúcias achadas por capturas seguintes, gerando modelos mais ricos.
1.2.3. Digitalização de Impressões Digitais¶
1.2.3.1. Métodos de Captura¶
Há essencialmente 4 métodos de captura diferentes pada imagens de impressão digital:
(a) Digitalização de impressões digitais em papel/tinta: geralmente exigido ao importar registros legados para um sistema biométrico digital. Impressões feitas no papel são digitalizadas com um scanner de mesa, com uma resolução variando de 500 a 1000 dpi.
See also
GBS Cardscan Web é o componente do Griaule Biometric Suite projetado para a digitalização de imagens de impressões digitais em tinta e para cadastrar elas no Griaule Biometric Database Server.
(b) Captura digital plana: o dedo do usuário é pressionado contra um digitalizador de impressões digitais, que produz uma imagem digital da área do dedo que está em contato com o equipamento. A maioria dos digitalizadores produzem imagens de 500 dpi. Alguns equipamentos de alta qualidade fornecem imagens com 1000 dpi. Enquanto capturas planas são mais rápidas, a área capturada do dedo é limitada, visto que não é possível posicionar toda a extensão do dedo sobre o sensor.
(c) Captura digital rolada: o usuário rola o dedo sobre o digitalizador de impressões digitais, o que produz uma imagem digital com a área do dedo exposta no sensor. A resolução típica é também de 500 dpi e equipamentos de alta qualidade fornecem imagens de 1000 dpi. Capturas roladas requerem movimentos suaves do indivíduo, o que leva um tempo maior e pode requerer mais de uma tentativa se o indivíduo rolar o dedo muito rápido ou de forma brusca. Impressões digitais roladas contém mais distorções espaciais que impressões digitais planas, devido à deformação da pele durante o processo de captura, mas capturam uma área maior de impressão digital, e isso permite que sistemas biométricos comparem as impressões digitais com maior acurácia.
(d) Capturas ao vivo sem contato: Esse é um digitalizador experimental de impressões digitais que tenta capturar a imagem da digital com uma câmera fotográfica modificada, sem necessitar que o sujeito toque o sensor. Enquanto menos intrusivo, esses digitalizadores não garantem uma resolução exata (varia de acordo com a distância do dedo com o sensor), introduzem artefatos de luz e podem ser suscetíveis a ataques de falsificação (spoofing), tal como apresentar uma foto de um dedo ao sensor em vez de um dedo real.
1.2.3.2. Resolução¶
A resolução é a densidade de pixels por área, geralmente medida como pontos por polegada (dpi, do inglês dots per inch). Quanto maior a resolução do sensor, mais rica em detalhes é a imagem capturada, favorecendo templates de melhor qualidade.
Para imagens de impressões digitais, a resolução comumente exigida por autoridades de segurança é de 500 dpi. Isso significa que o dispositivo com um sensor de 1x1 polegada irá produzir uma imagem de aproximadamente 250000 pixels (500x500 pixels).
Note que dimensão da imagem e resolução da imagem são medidas distintas: Um equipamento com sensor de 2x2 polegadas e uma resolução de 500 dpi irá produzir imagens de dimensão 1000x1000, mas a resolução ainda será 500 dpi. Tanto a área do sensor quanto a resolução são importantes para garantir a qualidade das características das impressões digitais extraídas.
1.2.3.3. Qualidade de Imagem¶
Se a imagem da impressão digital estiver ruidosa, borrada, ou apresentar artefatos de compressão, o extrator de templates pode não ser capaz de reconhecer corretamente as características da impressão digital. Por exemplo: duas cristas podem acabar ficando conectadas devido a um borrão na imagem, impedindo a detecção de uma minúcia de terminação.
Para mitigar as partículas de poeira depositadas no sensor, alguns leitores fornecem uma tecnologia de redução de ruído embutida. Apesar disso, para aumentar a qualidade da imagem é sempre importante manter limpa a superfície de captura do dispositivo e seguir as boas práticas de captura de impressões digitais.
Para padronizar a avaliação de qualidade de imagem de impressão digital, o NIST (National Institute of Standards and Technology), publicou o NFIQ em 2015. O NFIQ é uma medida padronizada de qualidade de imagem de impressão digital, projetada para predizer a performance de sistemas de batimento de impressões digitais baseado em minúcias. O NFIQ classifica a qualidade de impressões digitais em 5 classes: NFIQ 1 (maior qualidade possível) até a NFIQ 5 (menor qualidade possível).
1.2.3.4. Codificação de Imagem¶
Em muitos sistemas biométricos é desejável armazenar as imagens para fins de longo prazo, como re-extrair templates com extratores mais modernos, ou para propósitos forenses e de deduplicação.
Devido à grande quantidade de imagens que um ABIS geralmente armazena, e a qualidade exigida pelos extratores de template para realizar uma extração de maneira eficiente, os algoritmos de compressão com perda tradicionais não são adequados para a codificação de imagens de impressões digitais, já que a compressão produz artefatos que podem atrapalhar a extração de templates. No lado oposto, algoritmos de compressão de imagem sem perdas geram arquivos muito grandes, aumentando os requisitos de armazenamento.
Para compressão sem perdas o formato mais comum para para impressões digitais é o PNG (Portable Network Graphics).
Para as necessidades específicas de um ABIS foi desenvolvido o formato Wavelet Scalar Quantization, descrito a seguir.
1.2.3.4.1. Wavelet Scalar Quantization (WSQ)¶
O formato Wavelet Scalar Quantization foi desenvolvido pelo FBI especificamente para comprimir imagens de impressões digitais, reduzindo o tamanho do arquivo comprimido sem perda de detalhes, especialmente quando comparado com algorítimos já estabelecidos tal como JPEG/JFIF.
O formato WSQ é baseado na teoria de wavelet, e foi projetada para comprimir imagens de impressão digital em escala de cinza a 500 DPI. Imagens com resoluções maiores são melhor comprimidas com o formato JPEG2000.
1.2.4. Batimento de Digitais¶
O objetivo da extração dos templates é realizar a comparação (ou batimento) de impressões digitais. Casamento ou batimento (Matching) é o processo de comparação de dois templates que produz uma medida quantitativa de semelhança entre eles. Em um sistema biométrico funcional, pares genuínos (templates extraídos de capturas do mesmo dedo) produzirão altos scores de similaridade, enquanto pares de impostores (templates extraídos de capturas de dedos diferentes) produzirão baixos scores de similaridade.
Uma vez que dois templates dificilmente são idênticos, mesmo se obtidos a partir de capturas sequenciais do mesmo dedo, as impressões digitais correspondentes devem levar em conta as mudanças no posicionamento de minúcias e minúcias que não existem nos dois modelos.
1.2.4.1. Pontuação e Limiar¶
Um algoritmo de batimento possui dois passos. No primeiro, um Algoritmo de Avaliação atribui uma pontuação de similaridade para a comparação. O segundo passo decide se o par é genuíno ou impostor usando o limiar de decisão. Se a pontuação for maior que o limiar, o algoritmo decide que é uma comparação genuína; de outra forma, é classificado como um par impostor. O limiar de decisão é um parâmetro configurável de qualquer sistema de biometria.
Aumentar o limiar aumentará a ocorrência de erros de falso negativo (pares genuínos identificados como impostores) e diminuir os erros de falso positivo (pares impostores identificados como genuínos); diminuir o limiar reduzirá os erros de falso negativo e aumentará os erros de falso positivo.
Ao escolher o limiar de decisão para uma aplicação o usuário deve levar em consideração a aceitabilidade de erros de falso negativo e falso positivo, e o tamanho da base de templates.
1.3. Reconhecimento Facial¶
O reconhecimento facial é um dos métodos mais amigáveis e menos intrusivos entre as modalidades biométricas. A captura de dados é simples e os dispositivos de captura são câmeras digitais comuns e baratas.
Para um sistema biométrico, o reconhecimento facial envolve três tarefas:
Detectar e delimitar as faces presentes em uma imagem.
Extrair um vetor de características de uma face, e codificá-lo para armazenar como um template.
Batimento: Comparar dois template de face e calcular um score de similaridade.
Algoritmos modernos de reconhecimento facial são baseados em redes neurais profundas, uma técnica de inteligência artificial onde o algoritmo escolhe as melhores características discriminantes entre as faces baseado em um grande conjunto de dados de treinamento. Dado que as características podem mudar conforme os conjuntos de dados de treinamento são continuamente atualizados, não há um formato padrão para templates faciais. Sistemas biométricos geralmente mantêm a imagem original armazenada, para que templates melhorados possam ser extraídos à medida em que o conjunto de dados melhora com o passar do tempo.
1.4. Reconhecimento de Íris¶
Os padrões de íris são formados durante o desenvolvimento fetal e continuam se desenvolvendo pelos primeiros dois anos de vida. Biometria de íris se beneficia do fato que os padrões de íris são únicos para cada indivíduo, e não mudam depois do desenvolvimento inicial. Diferente de impressões digitais dos dedos, que são suscetíveis a alterações por queimaduras, cortes, abrasões e reações químicas, os padrões de íris são muito improváveis de serem modificados, intencionalmente ou não. A captura de íris requer cooperação do indivíduo, que precisa manter os olhos abertos e imóveis enquanto a captura é realizada. A captura de íris é realizada com scanners especializados com luz próxima ao infravermelho (NIR, Near InfraRed em inglês) e sensores sensíveis à luz próxima ao infravermelho. A imagem abaixo é um exemplo típico de íris capturada por sensor biométrico.
Ainda que sensores de captura de íris estejam se tornando baratos à medida em que são integrados em dispositivos eletrônicos pessoais como smartphones, eles ainda são mais caros que as câmeras normais usadas para reconhecimento facial.
Para um sistema biométrico, o reconhecimento de íris envolve 3 tarefas:
Detectar e delimitar a pupila, a íris e detectar a oclusão de pálpebras ou cílios.
Extrair características espectrais das regiões da íris e codificá-las para armazenar em um template.
Batimento: Comparar dois templates de íris e calcular a pontuação de similaridade.
1.5. Taxas de Erro¶
Um aspecto importante de um sistema biométrico é sua precisão. Do ponto de vista do usuário, um erro de precisão ocorre quando o sistema não consegue reconhecer a identidade de uma pessoa registrada ou quando o sistema reconhece erroneamente a identidade de um intruso.
Existem basicamente três fontes que aumentam a taxa de erro em um sistema:
(a) Fator Humano: Captura de informações biométricas sempre requerem participação humana em diferentes níveis. Para captura de impressões digitais, os dedos devem estar em contato com a superfície do sensor; em captura de imagens de íris, os olhos devem estar olhando para um ponto fixo da câmera digital. Mesmo para capturas faciais, sendo provavelmente a captura biométrica menos invasiva, uma boa captura exige algumas restrições no posicionamento da face. Como consequência, o comportamento humano no momento da captura biométrica é um fator crítico para etapas de processamento e a acurácia do reconhecimento. Uma captura inadequada provoca uma extração deficiente de características biométricas ou até impede a extração. Um ponto crítico para avaliação de sistemas biométricos é treinar pessoas em boas práticas de captura de registros biométricos.
(b) Sensores Biométricos: Condições ambientais e propriedades tecnológicas do equipamento afetam a qualidade dos registros biométricos capturados. Além disso, cada tecnologia captura biométrica tem vantagens e desvantagens.
(c) Imprecisão na comparação biométrica: Mesmo quando os dados biométricos são capturados corretamente e com boa qualidade, os algoritmos de batimento não são perfeitos e podem gerar scores de similaridade baixos para pares genuínos e scores de similaridade altos para pares impostores.
1.5.1. Tipos de Erro¶
Erros de Falso Positivo ocorrem quando um sistema biométrico classifica um par impostor como genuíno.
Erros de Falso Negativo ocorrem quando um sistema biométrico classifica um par genuíno como impostor.