Distinguir los metadatos del contenido de archivo y de los datos de aplicación
No confunda la extracción de metadatos con la extracción de contenido o de datos de aplicación. Cierto texto que puede parecer ser metadatos se extrae como contenido o datos de aplicación. En la tabla Datos no extraídos como metadatos, se describen algunos tipos de datos que no se extraen como metadatos de formatos de archivo para ayudar a determinar si es necesario habilitar la detección de metadatos y cuándo.
Esta lista no es exhaustiva y se proporciona para referencia rápida solamente. Puede haber otros tipos de datos que no se extraen como metadatos. La práctica recomendada es usar siempre la utilidad de
filtro
para verificar la compatibilidad de los metadatos de formato de archivo. Utilice siempre la utilidad de filtro para verificar la compatibilidad de los metadatos de formato de archivoTipo de contenido | Método de extracción |
|---|---|
Datos de aplicación | Los datos de aplicación que incluyen la información del transporte de mensajes se extraen por separado de la extracción de formatos de archivo. Para todos los mensajes entrantes, el sistema extrae el sobre de mensaje (encabezado) y la información del asunto como texto en la capa de aplicación. El tipo de datos de aplicación que se extraen depende de los canales compatibles con el servidor de detección o el endpoint. |
Encabezados y pies de página | El texto del encabezado y del pie de página del documento se extrae como contenido, no metadatos. Para evitar los falsos positivos, se recomienda quitar o incluir en lista blanca los encabezados y los pies de página de los documentos. Vea el capítulo Coincidencia de documentos indizados (IDM) en la Guía de administración de para obtener información.Symantec Data Loss Prevention |
Texto de marcado | El texto de marcado se extrae como contenido, no metadatos. La extracción del texto de marcado se admite para HTML, XML, SGML y más. La extracción del texto de marcado está deshabilitada de forma predeterminada. Consulte el tema "Configuración avanzada del servidor" en la Guía de administración de para habilitarla.Symantec Data Loss Prevention |
Texto oculto | El texto oculto se extrae como contenido, no metadatos. La extracción del texto oculto en la forma de control de cambios se admite para algunos formatos de archivo de Microsoft Office. La extracción del texto oculto está deshabilitada de forma predeterminada. Consulte el tema "Configuración avanzada del servidor" en la Guía de administración de para habilitarla.Symantec Data Loss Prevention |
Marcas de agua | Las marcas de agua basadas en texto se extraen como contenido, no metadatos. La detección de marcas de agua basadas en texto se admite para los documentos de Microsoft Word (versiones 2003 y 2007). No se admite para otros formatos de archivo. |