Filtrado de documentos por nombre del archivo

Cuando se configura un perfil de documento indizado, tiene la opción de usar los filtros para incluir o excluir documentos en su origen de datos de la indización. Hay dos tipos de filtros de nombre de archivo: Filtros de inclusión de nombres de archivos y Filtros de exclusión de nombres de archivos. Symantec recomienda que, si se elige usar los filtros de nombre de archivos, seleccione los filtros de inclusión o los filtros de exclusión, pero no ambos.
En la tabla Filtros de nombres de archivos distinguidos, se describen las diferencias entre los filtros de inclusión y exclusión para los nombres de archivo.
Filtros de nombres de archivos distinguidos
Filtro
Descripción
Filtros de inclusión de nombres de archivos
Si el campo Filtros de inclusión de nombres de archivos está vacío, la coincidencia se realiza en todos los documentos en el perfil de documento. Si especifica cualquier cosa en el campo Filtros de inclusión de nombres de archivos, se trata como filtro de inclusión. En este caso, el documento se indiza solamente si coincide con el filtro que se especifica.
Por ejemplo, si especifica
*.docx
en el campo
Filtros de inclusión de nombres de archivos
, el sistema indizará solamente los archivos
*.docx
en el origen de documento.
Filtros de exclusión de nombres de archivos
El campo Filtros de exclusión le permite especificar los documentos para excluir en el proceso de búsqueda de coincidencias.
Si deja vacío el campo Filtros de inclusión, el sistema realiza la búsqueda de coincidencias en todos los documentos en el archivo ZIP o el archivo compartido. Si especifica cualquier valor en el campo, el sistema analiza solamente esos documentos que no coinciden con el filtro.
El sistema trata las barras diagonales (/) y las barras invertidas (\) como equivalentes. El sistema omite los espacios al principio o al final del patrón. El filtro de nombres de archivos no admite caracteres de escape; por lo tanto, no es posible hacer coincidir signos de interrogación, comas o asteriscos literales.
En la tabla Sintaxis del filtro de nombre de archivo, se describe la sintaxis aceptada por la función
Filtros de nombre de archivo
. La sintaxis para los filtros de inclusión y exclusión es la misma.
Sintaxis del filtro de nombre de archivo
Operador
Descripción
Asterisco (*)
Representa cualquier cantidad de caracteres.
Signo de interrogación (?)
Representa un único carácter.
Coma (,) y nueva línea
Representa un “O” lógico.
En la tabla Ejemplos del filtro de nombres de archivo, se proporcionan filtros de muestra y descripciones de su comportamiento cuando se introducen en el campo
Filtros de inclusión de nombres de archivos
:
Ejemplos del filtro de nombres de archivo
Cadena del filtro
Descripción
*.txt,*.docx
El sistema indiza solamente los archivos .txt y .doc en el archivo ZIP o el archivo compartido, y omite todo lo demás.
?????.docx
El sistema indiza los archivos con la extensión .docx y los archivos con nombres de cinco caracteres, tales como
hello.docx
y
stats.docx
, pero no
good.docx
o
marketing.docx
.
*/documentation/*,*/specs/*
El sistema indiza solamente los archivos en dos subdirectorios debajo del directorio raíz: uno, llamado “documentation”; y el otro, “specs.”.
Ejemplo con comodines y subdirectorios:
*\scan_dir\l*.txt
La indización de IDM falla u omite la configuración del filtro si la cadena del filtro El nombre de archivo incluye/excluye comienza con un carácter alfanumérico e incluye un comodín, por ejemplo:
l*.txt
. La solución alternativa es configurar el filtro de inclusión/exclusión con la cadena de filtro como se indica en este ejemplo, es decir,
*\scan_dir\l*.txt
.
Por ejemplo, el filtro
1*.txt
no funciona para una ruta de acceso
\\dlp.symantec.com\scan_dir\lincoln-LyceumAddress.txt
. Sin embargo, si el filtro se configura como
*\scan_dir\l*.txt
, el indizador reconocerá el filtro e indizará el archivo.