Distinga entre metadados de conteúdo de arquivos e dados de aplicativos

Não confunda a extração de metadados com a extração de conteúdo ou dados de aplicativos. Algum texto que pode parecer metadados é extraído como conteúdo ou dados de aplicativos. Dados não extraídos como metadados descreve alguns tipos de dados que não são extraídos como metadados do formato de arquivo para ajudá-lo a determinar se e quando você precisará ativar a detecção de metadados.
Essa lista não é completa e é fornecida somente para referência rápida. Pode haver outros tipos de dados que não são extraídos como metadados. A prática recomendada é usar o utilitário de
filtragem
para verificar o suporte ao metadados de formato de arquivo. Usar sempre o utilitário de filtro para verificar a compatibilidade com metadados de formato de arquivo
Dados não extraídos como metadados
Tipo de conteúdo
Método de extração
Dados de aplicativos
Os dados de aplicativos que incluem informações de transporte de mensagem são extraídos separadamente da extração do formato de arquivo. Para todas as mensagens recebidas, o sistema extrai o envelope da mensagem (cabeçalho) e as informações de assunto como texto na camada do aplicativo. O tipo de dados de aplicativos extraído depende dos canais compatíveis com o servidor de detecção ou pelo endpoint.
Cabeçalhos e rodapés
O cabeçalho do documento e o texto de rodapé são extraídos como conteúdo, não metadados. Para evitar falsos positivos, recomenda-se remover ou colocar em whitelist os cabeçalhos e rodapés dos documentos.
Veja o capítulo sobre Correspondência de documentos indexados (IDM, Indexed Document Matching), no
Guia de Administração do
Symantec Data Loss Prevention
, para obter detalhes.
Texto de marcação
O texto de marcação é extraído como conteúdo, não metadados. A extração do texto de marcação é compatível com HTML, XML, SGML, entre outros. A extração de texto de marcação está desativada por padrão.
Veja o tópico "Configurações avançadas do servidor" no
Guia de Administração do
Symantec Data Loss Prevention
para ativá-la.
Texto oculto
O texto oculto é extraído como conteúdo, não metadados. A extração de texto oculto sob a forma de mudanças controladas é compatível com alguns formatos de arquivos do Microsoft Office. A extração de texto oculto está desativada por padrão.
Veja o tópico "Configurações avançadas do servidor" no
Guia de Administração do
Symantec Data Loss Prevention
para ativá-la.
Marcas d'água
Marcas d'água com base em texto são extraídas como conteúdo, não metadados. A detecção de marcas d'água com base em texto é compatível com documentos Microsoft Word (versões 2003 e 2007). Não é compatível com outros formatos de arquivo.