Analyse des résultats de l'ensemble de données
L'écran d'ensemble de données d'analyse affiche les résultats de l'ensemble de données sur base des critères que vous avez spécifiés.
Une fois que l'utilitaire filtre les fichiers de votre ensemble de données, il trie et affiche les données par onglet selon l'extension de fichier. Vous pouvez trier davantage les données en cliquant sur les noms de colonne. Vous pouvez également supprimer des colonnes ou des lignes de données inutiles en sélectionnant la ligne ou la colonne et en effectuant un clic droit.
L'utilitaire d'analyseur de type de fichier utilise l'extension de fichier pour organiser par onglet les fichiers de votre ensemble de données. Cependant, l'extension de fichier n'est pas un moyen fiable pour détecter un type de fichier car l'extension de fichier peut facilement être modifiée.
Symantec Data Loss Prevention
détecte le type de fichier sur base des octets spécifiques d'identification unique.Quand vous analysez des résultats d'ensemble de données, votre but est de localiser les octets uniques qui sont cohérents pour chaque instance du type de fichier. Ces octets uniques sont "les octets magiques" pour le type de fichier analysé. Vous devez déterminer ce que sont les octets magiques pour créer un script qui détecte le type de fichier personnalisé. Par exemple, les deux premiers octets d'un fichier Microsoft Word (*.doc) sont DO CF (au format hexadécimal).
Pour vous aider à évaluer les résultats et à trouver les octets magiques pour le type de fichier personnalisé, cliquez sur l'option
Analyser les données de tables
. L'option par défaut COLUMN_MATCH étant sélectionnée, l'utilitaire d'analyseur de type de fichier met en évidence les colonnes qui sont les mêmes parmi tous les fichiers de l'onglet sélectionné. L'option ROW_OFFSET_MATCH recherche des correspondances d'octet au sein d'un même fichier (ligne). Les offsets (colonnes) correspondants dans la même ligne sont mis en valeur ; ceux qui correspondent à un offset dans une autre ligne ne le sont pas. Cette option est utile pour quelques types de fichier qui utilisent des octets uniques dans le même fichier pour indiquer le type de fichier. Par exemple, le type de fichier CADAM (*.cdd) utilise les mêmes valeurs pour les octets 0 - 3 et les octets 8 - 11 dans chaque fichier, mais ces valeurs sont différentes entre les fichiers.
Après avoir analysé les résultats et identifié les octets magiques, l'étape suivante est d'enregistrer un script pour détecter le type de fichier.
Voir les didacticiels pour recevoir des instructions sur la création de l'ensemble de données, l'analyse des résultats et la création d'un script pour détecter un type de fichier personnalisé. Ces didacticiels expliquent comment fonctionne l'utilitaire d'analyseur de type de fichier et devraient vous permettre de commencer les solutions de script pour détecter les types de fichier personnalisés.