Para analisar os resultados do conjunto de dados
A tela de análise do conjunto de dados mostra os resultados do conjunto de dados com base nos critérios que você especificou.
Quando o utilitário filtrar os arquivos de seu conjunto de dados, ele classificará e exibirá os dados por guias de acordo com a extensão do arquivo. Você pode classificar ainda mais os dados clicando nos nomes de coluna. Você também pode excluir colunas ou linhas de dados irrelevantes selecionando a linha ou coluna e clicando com o botão direito do mouse.
O utilitário analisador de tipo de arquivo usa a extensão de arquivo para organizar os arquivos por guia no conjunto de dados. Contudo, a extensão do arquivo não é um meio seguro de detectar um tipo de arquivo, pois pode facilmente ser alterada. O
Symantec Data Loss Prevention
detecta o tipo de arquivo com base em bytes específicos de identificação exclusiva.Quando você analisar os resultados do conjunto de dados, seu objetivo será o de localizar os bytes exclusivos consistentes com cada instância do tipo de arquivo. Esses bytes exclusivos são “os bytes mágicos” para o tipo de arquivo analisado. Você deve determinar quais são os bytes mágicos para gravar um script que detecte o tipo de arquivo personalizado. Por exemplo, os primeiros dois bytes de um arquivo do Microsoft Word (*.doc) são DO CF (no formato hexadecimal).
Para ajudá-lo a avaliar os resultados e encontrar os bytes mágicos do tipo de arquivo personalizado, clique na opção
Analisar tabela de dados
. Com a opção padrão COLUMN_MATCH selecionada, o utilitário analisador de tipo de arquivo destaca as colunas que são as mesmas em todos os arquivos da guia selecionada. A opção ROW_OFFSET_MATCH procura correspondências de bytes no mesmo arquivo (linha). Os offsets (colunas) que têm correspondência na mesma linha são destacados; isso não acontece com os que têm correspondência com o mesmo offset em outra linha. Essa opção é útil para alguns tipos de arquivo que usam bytes exclusivos dentro do mesmo arquivo para indicar o tipo de arquivo. Por exemplo, o tipo de arquivo CADAM (*.cdd) usa os mesmos valores para bytes 0 a 3 e bytes 8 a 11 em cada arquivo, mas esses valores são diferentes entre os arquivos.
Depois de analisar os resultados e determinar os bytes mágicos, a próxima etapa será gravar um script para detectar o tipo de arquivo.
Consulte os tutoriais para obter instruções sobre como criar o conjunto de dados, analisar os resultados e gravar um script para detectar um tipo de arquivo personalizado. Esses tutoriais demonstram como funciona o utilitário analisador de tipo de arquivo e devem ajudá-lo a começar a gravar scripts de soluções para detectar tipos de arquivo personalizados.