Creación del conjunto de datos
La utilidad Analizador de tipo de archivo ofrece varios parámetros para configurar el conjunto de datos con el objetivo de analizar datos de byte de tipo de archivo.
Parámetro | Uso |
|---|---|
Agregar directorio | Esta opción permite elegir qué directorios incluir en el análisis del archivo. Es posible agregar varios directorios a un único conjunto de datos. Cada directorio que selecciona debe contener las muestras de tipo de archivo que desea analizar y finalmente detectar. Para tener un conjunto de datos útil, incluya varias muestras de tipo de archivo, incluidas diversas versiones del producto con diferentes funciones habilitadas y deshabilitadas. Para lograr mejores resultados, el tamaño de muestra mínimo recomendado es 15 archivos del mismo tipo de archivo. |
Eliminar directorio | Esta opción permite eliminar un directorio que ha agregado al conjunto de datos. Es posible seleccionar varios directorios para eliminar. Cuando se elimina un directorio, se deja de analizar como parte del conjunto de datos. |
Filtro de nombre de archivo | Este campo contiene un patrón de expresión regular que indica a la utilidad qué archivos de cada directorio incluir en el conjunto de datos. Se usa una expresión regular porque proporciona flexibilidad para filtrar los archivos que desea incluir en el conjunto de datos. La expresión regular siguiente lee todos los nombres de archivos ASCII de un directorio (o directorios) a un conjunto de datos: [\w\s]+.[\w]+ La expresión regular siguiente permite filtrar los nombres de archivo que usan caracteres que no son ASCII: [^0x00]+.[\w]+ Para obtener ayuda sobre el uso de expresiones regulares para filtrar nombres de archivos, consulte el tema “Acerca de la escritura de expresiones regulares” en la Guía de administración de Symantec Data Loss Prevention o en la ayuda en pantalla. |
Número de bytes | Este campo especifica el número de bytes por archivo para mostrar por análisis. El valor máximo predeterminado para este campo es 1024 bytes. |
Tamaño del pedazo | Este campo representa el tamaño del grupo de bytes que se mostrarán en una columna. Por ejemplo, si especifica 2 en este campo, la utilidad muestra 2 bytes de datos en cada columna (desplazamiento). |
Tipo de analizador | Esta opción define cómo se muestran los datos para el análisis del conjunto de datos analizado.
|
Análisis recurrente | Si marca esta casilla, la utilidad analiza cada directorio y cualquier subdirectorio que se incluya en el conjunto de datos. Si un directorio contiene subdirectorios donde se encuentran los archivos que desea analizar, elija esta opción. El análisis recurrente requiere mucha memoria. Si desea analizar un conjunto de datos grande o recurrente, considere aumentar el tamaño del montón de Java para mejorar el rendimiento. |
Analizar conjunto de datos | Haga clic en esta opción cuando haya completado la configuración del conjunto de datos. La utilidad Analizador de tipo de archivo valida la entrada e inicia el proceso de análisis del archivo. La utilidad lee todos los datos necesarios y muestra los resultados en la pantalla “Analizar conjunto de datos”. |