Distinga entre metadados de conteúdo de arquivos e dados de aplicativos
Não confunda a extração de metadados com a extração de conteúdo ou dados de aplicativos. Algum texto que pode parecer metadados é extraído como conteúdo ou dados de aplicativos. Dados não extraídos como metadados descreve alguns tipos de dados que não são extraídos como metadados do formato de arquivo para ajudá-lo a determinar se e quando você precisará ativar a detecção de metadados.
Essa lista não é completa e é fornecida somente para referência rápida. Pode haver outros tipos de dados que não são extraídos como metadados. A prática recomendada é usar o utilitário de
filtragem
para verificar o suporte ao metadados de formato de arquivo. Usar sempre o utilitário de filtro para verificar a compatibilidade com metadados de formato de arquivoTipo de conteúdo | Método de extração |
|---|---|
Dados de aplicativos | Os dados de aplicativos que incluem informações de transporte de mensagem são extraídos separadamente da extração do formato de arquivo. Para todas as mensagens recebidas, o sistema extrai o envelope da mensagem (cabeçalho) e as informações de assunto como texto na camada do aplicativo. O tipo de dados de aplicativos extraído depende dos canais compatíveis com o servidor de detecção ou pelo endpoint. |
Cabeçalhos e rodapés | O cabeçalho do documento e o texto de rodapé são extraídos como conteúdo, não metadados. Para evitar falsos positivos, recomenda-se remover ou colocar em whitelist os cabeçalhos e rodapés dos documentos. Veja o capítulo sobre Correspondência de documentos indexados (IDM, Indexed Document Matching), no Guia de Administração do , para obter detalhes.Symantec Data Loss Prevention |
Texto de marcação | O texto de marcação é extraído como conteúdo, não metadados. A extração do texto de marcação é compatível com HTML, XML, SGML, entre outros. A extração de texto de marcação está desativada por padrão. Veja o tópico "Configurações avançadas do servidor" no Guia de Administração do para ativá-la.Symantec Data Loss Prevention |
Texto oculto | O texto oculto é extraído como conteúdo, não metadados. A extração de texto oculto sob a forma de mudanças controladas é compatível com alguns formatos de arquivos do Microsoft Office. A extração de texto oculto está desativada por padrão. Veja o tópico "Configurações avançadas do servidor" no Guia de Administração do para ativá-la.Symantec Data Loss Prevention |
Marcas d'água | Marcas d'água com base em texto são extraídas como conteúdo, não metadados. A detecção de marcas d'água com base em texto é compatível com documentos Microsoft Word (versões 2003 e 2007). Não é compatível com outros formatos de arquivo. |