データ識別子のパターンについて
データ識別子はデータと照合するパターンを実装します。バージョン 16.0 以降では、標準の PCRE (Perl Compatible Regular Expressions ライブラリ)の正規表現を使用してデータ識別子パターンを作成できます。DLP 15.8 上のエンドポイントでは、正規表現言語のサブセットでもあるレガシー データ識別子パターン言語を使用する必要があります。
DLP 16.0 にアップグレードすると、システム定義データ識別子とカスタムデータ識別子の既存のレガシーパターンが自動的に正規表現に変換されます。ただし、レガシーパターンはデータベースから削除されず、データ識別子の
[レガシー]
フィールドに個別にリスト表示されます。[変換]
ボタンをクリックして、作成したレガシーパターンから正規表現を生成することもできます。データ識別子では、最大 500 個の正規表現と最大 63 個のレガシーパターンをサポートしています。正規表現のサポートには、いくつかの制限事項があります。詳細については、「データ識別子での PCRE 正規表現サポートの制限事項」を参照してください。
レガシーパターン構文は、正規表現の言語に類似していますが、より限定されています。たとえば、レガシー データ識別子のパターン構文は、グループ化、前方参照と後方参照の表現、多くの特殊文字(特にドット文字「.」)など、正規表現の一部の機能をサポートしません。さらに、システムはデータ識別子のパターンに対して ASCII 文字の使用のみを許可します。
詳細については、「データ識別子のパターン言語の仕様」を参照してください。
システムデータ識別子を編集するとき、システムは、表示と編集のためにパターンを開示します。システム定義のデータ識別子のパターンは厳密なコンテンツ一致のために調整され、最適化されています。
「データ識別子の適用範囲の選択」を参照してください。
さらに、カスタムデータ識別子を作成できます。この場合は、少なくとも 1 つのパターンを実装する必要があります。パターンを書き込む方法を理解する最もよい方法はシステム定義のデータ識別子のパターンを調べることです。
「データを照合するためのデータ識別子パターンの作成」を参照してください。