データセットの結果の分析

[Analyze Dataset]画面には、指定した基準に基づくデータセットの結果が表示されます。
ユーティリティは、データセットのファイルをフィルタ処理すると、拡張子に従ってデータをソートし、タブに表示します。列名をクリックすることによってさらにデータをソートできます。また、行または列を選択して右クリックを実行することによって、無関係なデータの列または行を削除できます。
File Type Analyzer ユーティリティは、データセット内のファイルをタブに編成するために拡張子を使います。ただし、拡張子は簡単に変更できるので、ファイル拡張子はファイルの種類を検出する方法としては信頼できません。
Symantec Data Loss Prevention
一意に識別する特定のバイトに基づいてファイルの種類を検出します。
データセットの結果を分析する際の目的は、あるファイルの種類の各インスタンスで一貫している一意のバイトを見つけることです。これらの一意なバイトが、分析されたファイルの種類の「マジックバイト」です。カスタムファイルの種類を検出するスクリプトを記述するには、マジックバイトが何であるかを判断する必要があります。たとえば、Microsoft Word ファイル (*.doc) の最初の 2 バイトは DO CF (16 進形式) です。
カスタムファイルの種類の結果を評価し、マジックバイトを見つけるには、
[Analyze Table Data]
オプションをクリックします。デフォルトオプション[COLUMN_MATCH]を選択すると、File Type Analyzer ユーティリティは、選択したタブのすべてのファイルにわたって同じである列をハイライトします。
ROW_OFFSET_MATCH オプションは、同じファイル (行) 内でバイトの一致を検出します。同じ行の一致するオフセット (列) はハイライトされます。別の行の同じオフセットと一致する場合はハイライトされません。このオプションは、同じファイル内の一意なバイトを使う少数のファイルの種類についてファイルの種類を示す場合に有用です。たとえば、CADAM というファイルの種類 (*.cdd) は、各ファイルのバイト 0 から 3 と 8 から 11 で同じ値を使っていますが、これらの値はファイルごとに異なります。
結果を分析し、マジックバイトを判断したら、次のステップはファイルの種類を検出するスクリプトを記述することです。
データセットを作成し、結果を分析し、カスタムファイルの種類を検出するためのスクリプトを記述する手順については、チュートリアルを参照してください。これらのチュートリアルでは File Type Analyzer ユーティリティがどのように動作するかが示されており、カスタムファイルの種類を検出するソリューションのスクリプトを記述するのに役立ちます。