Para criar o conjunto de dados

O utilitário analisador de tipo de arquivo oferece vários parâmetros para configurar o conjunto de dados na preparação da análise dos dados de bytes do tipo de arquivo.
Parâmetros para configurar o conjunto de dados
Parâmetro
Uso
Adicionar diretório
Esta opção permite escolher quais diretórios serão incluídos na análise do arquivo. Você pode adicionar vários diretórios a um único conjunto de dados.
Cada diretório selecionado deverá conter amostras do tipo de arquivo que você deseja analisar e detectar. Para ter um conjunto de dados útil, insira diversas amostras do tipo de arquivo, incluindo diferentes versões do produto com diversos recursos ativados e desativados.
Para obter os melhores resultados, o tamanho mínimo da amostra recomendado é de 15 arquivos do mesmo tipo de arquivo.
Remover diretório
Esta opção permite remover um diretório que você adicionou ao conjunto de dados. Você pode selecionar vários diretórios para serem removidos. Quando um diretório for removido, ele não será mais verificado como parte do conjunto de dados.
Filtro de nome do arquivo
Este campo contém um padrão de expressão regular que avisa o utilitário sobre os arquivos de cada diretório que serão incluídos no conjunto de dados. É usada uma expressão regular, pois essa fornece flexibilidade para filtrar os arquivos que você deseja incluir no conjunto de dados.
A seguinte expressão regular extrai nomes de todos os arquivos ASCII de um diretório (ou diretórios) para um conjunto de dados:
[\w\s]+.[\w]+
A expressão regular a seguir permite filtrar os nomes de arquivo que usam caracteres não ASCII:
[^0x00]+.[\w]+
Para obter ajuda com o uso de expressões regulares para filtragem de nome de arquivo, consulte o tópico "Sobre a gravação de expressões regulares" no
Guia de Administração do Symantec Data Loss Prevention
ou na ajuda online.
Número de bytes
Este campo especifica o número de bytes por arquivo que serão exibidos para a análise.
O valor padrão máximo em bytes desse campo é de
1024
.
Tamanho do bloco
Este campo representa o tamanho do grupo de bytes a ser exibido em uma coluna. Por exemplo, se você digitar
2
neste campo, o utilitário exibirá dois bytes de dados em cada coluna (offset).
Tipo de analisador
Esta opção define como os dados são exibidos para análise no conjunto de dados verificado.
  • A opção
    BYTE
    exibe os resultados da análise em formato hexadecimal, representando o valor correspondente em bytes.
  • A opção
    ASCII
    exibe os resultados da análise como caracteres ASCII.
  • A opção
    NUMBER
    exibe os resultados da análise em formato inteiro.
Verificação recorrente
Se esta caixa for marcada, o utilitário verificará cada diretório e todos os subdiretórios que forem incluídos no conjunto de dados. Se um diretório contiver subdiretórios onde estão localizados os arquivos que você deseja verificar, selecione esta opção.
A verificação Recorrente ocupa muita memória. Se você quiser analisar um conjunto de dados grande ou recorrente, convém aumentar o tamanho da pilha de Java para melhorar o desempenho.
Analisar conjunto de dados
Clique nessa opção quando concluir a configuração do conjunto de dados. O utilitário analisador de tipo de arquivo valida a entrada e inicia o processo de análise do arquivo. O utilitário extrai informações de todos os dados necessários e exibe os resultados na tela “Analisar conjunto de dados”.