Création de l'ensemble de données

L'utilitaire d'analyseur de type de fichier offre plusieurs paramètres pour configurer l'ensemble de données en vue d'analyser les données d'octet de type de fichier.
Paramètres pour configurer l'ensemble de ensemble de données
Paramètre
Utilisation
Ajouter un répertoire
Cette option vous permet de choisir quels répertoires inclure dans l'analyse de fichier. Vous pouvez ajouter plusieurs répertoires à un ensemble de données unique.
Chaque répertoire que vous sélectionnez devrait contenir des exemples du type de fichier que vous voulez analyser et détecter. Pour avoir un ensemble de données utile, incluez plusieurs échantillons du type de fichier, y compris différentes versions du produit avec différentes fonctions activées et désactivées.
Pour obtenir de meilleurs résultats, la taille de l'échantillon minimum recommandée est de 15 fichiers du même type.
Supprimer un répertoire
Cette option vous permet de supprimer un répertoire que vous avez ajouté à l'ensemble de données. Vous pouvez sélectionner plusieurs répertoires à supprimer. Quand un répertoire est supprimé, il n'est plus analysé en tant qu'élément de l'ensemble de données.
Filtre de nom de fichier
Ce champ contient un modèle d'expression régulière qui indique à l'utilitaire quels fichiers de chaque répertoire inclure dans l'ensemble de données. Une expression régulière est utilisée car elle permet de filtrer les fichiers que vous voulez inclure dans votre ensemble de données.
L'expression régulière suivante lit dans tous les noms de fichier ASCII d'un répertoire (ou de répertoires) à un ensemble de données :
[\w\s]+.[\w]+
L'expression régulière suivante vous permet de filtrer les noms de fichier qui utilisent les caractères non ASCII :
[^0x00]+.[\w]+
Pour obtenir de l'aide relative à l'utilisation des expressions régulières pour le filtrage de nom de fichier, consultez la rubrique "À propos de l'écriture d'expressions régulières" dans le Centre d'aide de Symantec Data Loss Prevention.
Nombre d'octets
Ce champ spécifie le nombre d'octets par fichier à afficher pour l'analyse.
La valeur maximale par défaut pour ce champ est de
1024
octets.
Taille d'unité
Ce champ représente la taille du groupe d'octets à afficher dans une colonne. Par exemple, si vous entrez
2
dans ce champ, l'utilitaire affiche deux octets de données dans chaque colonne (offset).
Type d'analyseur
Cette option définit comment les données sont affichées pour l'analyse de l'ensemble de données analysé.
  • L'option
    BYTE
    affiche les résultats de l'analyse au format hexadécimal représentant la valeur d'octet correspondante.
  • L'option
    ASCII
    affiche les résultats de l'analyse comme des caractères ASCII.
  • L'option
    NUMBER
    affiche les résultats de l'analyse au format d'entier.
Analyse récursive
Si cette case est cochée, l'utilitaire analyse tous les répertoires et sous-répertoires qui sont inclus dans l'ensemble de données. Si un répertoire contient des sous-répertoires dans lesquels se trouvent les fichiers que vous voulez analyser, cochez cette option.
L'analyse récursive est gourmande en mémoire. Si vous voulez analyser un ensemble de données volumineux ou récursif, envisagez d'augmenter la taille de segment de mémoire Java pour améliorer les performances.
Analyser l'ensemble de données
Cliquez sur cette option quand vous vous êtes terminé configurant l'ensemble de données. L'utilitaire d'analyseur de type de fichier valide l'entrée et lance le processus d'analyse de fichier. L'utilitaire lit toutes les données nécessaires et affiche les résultats sur l'écran "Analyser l'ensemble de données".