Creación del conjunto de datos

La utilidad Analizador de tipo de archivo ofrece varios parámetros para configurar el conjunto de datos con el objetivo de analizar datos de byte de tipo de archivo.
Parámetros para configurar el conjunto de datos
Parámetro
Uso
Agregar directorio
Esta opción permite elegir qué directorios incluir en el análisis del archivo. Es posible agregar varios directorios a un único conjunto de datos.
Cada directorio que selecciona debe contener las muestras de tipo de archivo que desea analizar y finalmente detectar. Para tener un conjunto de datos útil, incluya varias muestras de tipo de archivo, incluidas diversas versiones del producto con diferentes funciones habilitadas y deshabilitadas.
Para lograr mejores resultados, el tamaño de muestra mínimo recomendado es 15 archivos del mismo tipo de archivo.
Eliminar directorio
Esta opción permite eliminar un directorio que ha agregado al conjunto de datos. Es posible seleccionar varios directorios para eliminar. Cuando se elimina un directorio, se deja de analizar como parte del conjunto de datos.
Filtro de nombre de archivo
Este campo contiene un patrón de expresión regular que indica a la utilidad qué archivos de cada directorio incluir en el conjunto de datos. Se usa una expresión regular porque proporciona flexibilidad para filtrar los archivos que desea incluir en el conjunto de datos.
La expresión regular siguiente lee todos los nombres de archivos ASCII de un directorio (o directorios) a un conjunto de datos:
[\w\s]+.[\w]+
La expresión regular siguiente permite filtrar los nombres de archivo que usan caracteres que no son ASCII:
[^0x00]+.[\w]+
Para obtener ayuda sobre el uso de expresiones regulares para filtrar nombres de archivos, consulte el tema “Acerca de la escritura de expresiones regulares” en la
Guía de administración de Symantec Data Loss Prevention
o en la ayuda en pantalla.
Número de bytes
Este campo especifica el número de bytes por archivo para mostrar por análisis.
El valor máximo predeterminado para este campo es
1024
bytes.
Tamaño del pedazo
Este campo representa el tamaño del grupo de bytes que se mostrarán en una columna. Por ejemplo, si especifica
2
en este campo, la utilidad muestra 2 bytes de datos en cada columna (desplazamiento).
Tipo de analizador
Esta opción define cómo se muestran los datos para el análisis del conjunto de datos analizado.
  • La opción
    BYTE
    muestra los resultados del análisis en formato hexadecimal que representa el valor de byte correspondiente.
  • La opción
    ASCII
    muestra los resultados del análisis como caracteres ASCII.
  • La opción
    NÚMERO
    muestra los resultados del análisis en formato de número entero.
Análisis recurrente
Si marca esta casilla, la utilidad analiza cada directorio y cualquier subdirectorio que se incluya en el conjunto de datos. Si un directorio contiene subdirectorios donde se encuentran los archivos que desea analizar, elija esta opción.
El análisis recurrente requiere mucha memoria. Si desea analizar un conjunto de datos grande o recurrente, considere aumentar el tamaño del montón de Java para mejorar el rendimiento.
Analizar conjunto de datos
Haga clic en esta opción cuando haya completado la configuración del conjunto de datos. La utilidad Analizador de tipo de archivo valida la entrada e inicia el proceso de análisis del archivo. La utilidad lee todos los datos necesarios y muestra los resultados en la pantalla “Analizar conjunto de datos”.