Use identificadores de datos en vez de expresiones regulares para mejorar la exactitud

Los identificadores de datos se diseñan para proteger la información de identificación personal (PII) con mucha exactitud (<10% de índice de falsos positivos). Si un identificador de datos está disponible para el tipo de contenido que desea proteger, es necesario usar el identificador de datos en vez de una expresión regular porque los identificadores de datos son más eficientes que las expresiones regulares. Los patrones de identificadores de datos iniciales están ajustados para brindar exactitud, incluyendo detalles de la región, la industria y del país. Además, los identificadores de datos incluyen los análisis de validación para verificar los datos coincidentes con el patrón. Esta capa adicional de inteligencia defiende los datos de prueba y otras activaciones de incidentes de falsos positivos. Las expresiones regulares, por otra parte, pueden ser informáticamente costosas y pueden llevar a falsos positivos crecientes.
Por ejemplo, si desea detectar los números de la seguridad social (SSN), use el identificador de datos SSN de los EE. UU. calculado de forma aleatoria en vez de un patrón de expresión regular. El identificador de datos SSN de los EE. UU. calculado de forma aleatoria es más exacto que cualquier expresión regular que se pueda escribir y mucho más fácil y más rápido de implementar.
El lenguaje de patrones del identificador de datos es un subconjunto limitado del lenguaje de expresión regular. No todas las construcciones o caracteres de expresiones regulares se admiten para los patrones de identificador de datos. Usar el lenguaje del patrón del identificador de datos