メタデータをファイルの内容やアプリケーションデータと区別
メタデータの抽出を内容の抽出やアプリケーションデータと混同しないでください。内容やアプリケーションデータとして抽出されたテキストがメタデータのように見える場合があります。メタデータの検出を有効にする必要があるときの判断の助けとして、メタデータとして抽出されないデータにファイル形式として抽出されたものでないデータ形式を掲載します。
このリストはすべてを列挙するものではなく、クイックリファレンス用としてのみ提供されています。メタデータとして抽出されたものでないデータ形式が他にもある可能性があります。
フィルタ
ユーティリティを使ってファイル形式のメタデータがサポートされていることを検証するようお薦めします。常にフィルタユーティリティを使ってファイル形式のメタデータに対するサポートを検証コンテンツの種類 | 抽出方法 |
|---|---|
アプリケーションデータ | メッセージ転送情報などのアプリケーションデータはファイル形式とは別に抽出されます。すべての受信メッセージに対して、システムはメッセージのエンベロープ (ヘッダー) と表題情報をアプリケーション層でテキストとして抽出します。抽出されるアプリケーションデータの種類は、検出サーバーまたはエンドポイントがサポートするチャネルによって異なります。 |
ヘッダーおよびフッター | 文書のヘッダーテキストとフッターテキストはメタデータではなく内容として抽出されます。誤認を回避するため、文書からヘッダーおよびフッターを削除するか、またはホワイトリストに登録することをお薦めします。 詳しくは 『 の「インデックス文書一致 (IDM)」の章を参照してください。Symantec Data Loss Prevention 管理者ガイド』 |
マークアップテキスト | マークアップテキストはメタデータではなく内容として抽出されます。マークアップテキストの抽出は HTML、XML、SGML などの場合にサポートされています。マークアップテキストの抽出はデフォルトでは無効になります。 有効にするには 『 の「サーバーの拡張設定」の項を参照してください。Symantec Data Loss Prevention 管理者ガイド』 |
非表示のテキスト | 非表示のテキストはメタデータではなく内容として抽出されます。非表示テキストの抽出が変更履歴形式でいくつかの Microsoft Office ファイル形式に対してサポートされています。非表示テキストの抽出はデフォルトでは無効になります。 有効にするには 『 の「サーバーの拡張設定」の項を参照してください。Symantec Data Loss Prevention 管理者ガイド』 |
ウォーターマーク | テキストベースのウォーターマークはメタデータではなく内容として抽出されます。テキストベースのウォーターマークの検出は Microsoft Word 文書 (バージョン 2003 と 2007) に対してサポートされています。他のファイル形式にはサポートされていません。 |