ファイル名による文書のフィルタ処理
インデックス文書プロファイルを設定するときに、データソースの文書をインデックス付けに含めるか、除外するフィルタを使うことができます。ファイル名フィルタには、[含めるファイル名フィルタ]と[除外するファイル名フィルタ]の 2 種類があります。ファイル名フィルタを使う場合は、包含フィルタまたは除外フィルタの両方ではなく、それらのいずれかを選択することをお勧めします。
「ファイル名フィルタの区別」では、含めるファイル名フィルタと除外するファイル名フィルタの違いを説明します。
フィルタ | 説明 |
|---|---|
含めるファイル名フィルタ | [含めるファイル名フィルタ]フィールドが空の場合、文書プロファイルのすべての文書で照合が実行されます。[含めるファイル名フィルタ]フィールドに何か入力すると、包含フィルタとして扱われます。この場合、文書は指定するフィルタと一致するときにのみインデックス付けされます。 たとえば、 [含めるファイル名フィルタ] フィールドに *.docx と入力すると、システムは文書ソースの *.docx ファイルのみをインデックス付けします。 |
除外するファイル名フィルタ | [除外するフィルタ]フィールドでは、照合処理で除外する文書を指定できます。 [除外するフィルタ]フィールドを空のままにすると、システムは ZIP ファイルまたはファイル共有のすべての文書に対して照合を実行します。このフィールドに任意の値を入力すると、システムはフィルタに一致しない文書のみをスキャンします。 |
システムは、スラッシュ (/) とバックスラッシュ (\) を同じものとして扱います。システムは、パターンの始まりか終わりにある空白を無視します。ファイル名フィルタではエスケープ文字がサポートされません。したがって文字としての疑問符、カンマまたはアスタリスクに対して一致させることはできません。
「ファイル名フィルタの構文」では、
ファイル名フィルタ
機能で受け入れられる構文について説明します。包含フィルタと除外フィルタの構文は同じです。演算子 | 説明 |
|---|---|
アスタリスク (*) | 任意の数の文字を表します。 |
疑問符 (?) | 1 文字を表します。 |
カンマ (,) と改行 | 論理演算子 OR を表します。 |
「ファイル名フィルタの例」では、
[含めるファイル名フィルタ]
フィールドにフィルタを入力した場合のフィルタの例と動作の説明を示します。フィルタ文字列 | 説明 |
|---|---|
*.txt,*.docx | システムは、ZIP ファイルまたはファイル共有に含まれる .txt ファイルおよび .docx ファイルのみをインデックス付けし、他のすべてを無視します。 |
?????.docx | システムは、.docx 拡張子を持つファイル、 hello.docx や stats.docx といった 5 文字の名前を持つファイルをインデック付けします。good.docx または marketing.docx などの名前のファイルはインデックス付けされません。 |
*/documentation/*,*/specs/* | システムは、ルートディレクトリの下の 2 つのサブディレクトリにあるファイルのみインデックス付けします。1 つは「documentation」という名前、もう 1 つは「specs」という名前のサブディレクトリです。 |
ワイルドカードとサブディレクトリの例 *\scan_dir\l*.txt | ファイル名に含める/除外するフィルタ文字列がアルファベット文字で始まりワイルドカードを含む場合 (たとえば l*.txt )、IDM インデックス付けが失敗するか、そのフィルタを無視します。これに対する回避策は、含める/除外するフィルタをこの例で示すフィルタ文字列、すなわち *\scan_dir\l*.txt を使って設定することです。たとえば、フィルタ 1*.txt は \\dlp.symantec.com\scan_dir\lincoln-LyceumAddress.txt に対応しません。ただし、フィルタを *\scan_dir\l*.txt と設定するとインデクサはフィルタを認識してファイルをインデックス付けします。 |