Uso de la coincidencia de varios tokens con EMDI
La validación de EMDI ocurre después de que un patrón en un archivo o un mensaje coincide con un identificador de datos. El validador EMDI, a continuación, busca dentro de la ventana de proximidad definida (de forma predeterminada, más o menos 50 tokens) para los tokens individuales y las cadenas de varios tokens. A continuación, valida si cualquiera de esos tokens junto con el patrón del identificador de datos coincidente corresponden a una fila en el índice de EMDI. Si la columna
Obligatoria
coincide y hay suficientes coincidencias con la columna Opcional
dentro de la ventana de proximidad, se genera una coincidencia de EMDI. Una celda de varios tokens es una celda en el índice que contiene varias palabras separadas por espacios, puntuación inicial o final o caracteres latinos y chinos, japoneses o coreanos alternativos. Las partes que constituyen los subtokens de una celda de varios tokens obedecen las mismas reglas que las celdas de un solo token: se normalizan según su patrón donde la normalización puede aplicarse. Los mensajes y archivos que son inspeccionados deben coincidir con una celda de varios tokens exactamente, incluidos espacios en blanco y puntuación (se asume la configuración predeterminada).
Por ejemplo, una celda indizada que contiene la cadena "Bank of America" es una celda de varios tokens que consta de tres partes de subtoken. Durante la detección, "bank of america" (normalizado) coincide con la celda de varios tokens, pero "bank america" no.