データセットの作成
File Type Analyzer ユーティリティは、ファイルの種類のバイトデータ分析に備えてデータセットを設定するための複数のパラメータを提供します。
パラメータ | 使用 |
|---|---|
Add Directory | このオプションでは、ファイル分析に含めるディレクトリを選択できます。単一のデータセットに複数のディレクトリを追加できます。 選択する各ディレクトリには、分析し、最終的に検出したいファイルの種類のサンプルを含める必要があります。有用なデータセットにするには、ファイルの種類の複数のサンプルを含めます。製品のさまざまなバージョンで、各種の機能を有効にしたものと無効にしたものを含めます。 最もよい結果を達成するため、推奨する最小のサンプルサイズは、同じファイルの種類に対して 15 ファイルです。 |
Remove Directory | このオプションでは、データセットに追加したディレクトリを削除できます。削除する複数のディレクトリを選択できます。削除されると、ディレクトリはデータセットの一部としてスキャンされなくなります。 |
File Name Filter | このフィールドは、各ディレクトリからどのファイルをデータセットに含めるかをユーティリティに指示する正規表現パターンを含んでいます。データセットに含めたいファイルを柔軟にフィルタリングできるため、正規表現が使用されます。 次の正規表現はディレクトリからすべての ASCII ファイル名をデータセットに読み込みます。 [\w\s]+.[\w]+ 次の正規表現は非 ASCII 文字を使うファイル名をフィルタ処理できます。 [^0x00]+.[\w]+ ファイル名をフィルタ処理する正規表現の使用については 『Symantec Data Loss Prevention 管理者ガイド』 またはヘルプの正規表現の記述に関するトピックを参照してください。 |
Number of Bytes | |
Chunk Size | このフィールドは、列に表示するバイトのグループのサイズを表します。たとえば、このフィールドに 2 と入力すると、ユーティリティは各列に 2 バイトのデータを表示します (オフセット)。 |
Parser Type | このオプションは、スキャンされたデータセットのデータが分析用にどのように表示されるかを定義します。
|
Recursive Scan | このボックスにチェックマークを付けると、ユーティリティはデータセットにある各ディレクトリとすべてのサブディレクトリをスキャンします。ディレクトリに、スキャンしたいファイルが含まれるサブディレクトリがある場合、このオプションを選択します。 再帰的なスキャンはメモリを集中的に使用します。大きいデータセットまたは再帰的なデータセットを分析する場合は、パフォーマンスを向上させるために Java のヒープサイズを増やすことを検討してください。 |
Analyze Dataset | データセットの設定が完了したら、このオプションをクリックします。File Type Analyzer ユーティリティは入力を検証し、ファイル分析処理を開始します。ユーティリティは必要なデータをすべて読み取り、結果を[Analyze Dataset]画面に表示します。 |