Especificación del idioma del patrón del identificador de datos

Es posible usar tres tipos de token al definir un patrón del identificador de datos. Los tokens son secuencias de caracteres que no son espacios en blanco al principio del archivo, o precedidos por uno o más caracteres de espacios en blanco, seguidos por caracteres de espacios en blanco o el final del archivo. Los tres tipos de token que se usan en los patrones del identificador de datos son:
  • literales de caracteres
  • expresiones con corchetes
  • caracteres especiales
Es posible colocar un cuantificador opcional después de cada token.
Los patrones del identificador de datos coinciden solamente con un token completo o un conjunto de tokens.
Caracteres literales, metacaracteres y caracteres especiales
La mayoría de los caracteres son coincidencias literales en el idioma del patrón del identificador de datos. Por ejemplo, el carácter
a
en el patrón del identificador de datos coincide con el carácter
a
en su contenido. El idioma del patrón del identificador de datos incluye cuatro metacaracteres. Para hacer coincidir estos metacaracteres como literales de caracteres, use la barra invertida para escapar los caracteres en el patrón del identificador de datos. Para obtener una descripción de cada uno de metacaracteres, consulte la tabla Metacaracteres.
Metacaracteres
Carácter
Descripción
[
Este carácter se usa para comenzar una expresión con corchete.
{
Este carácter se usa para cuantificar el token precedente.
?
Este carácter se usa para cuantificar el token precedente.
\
Este carácter se usa para escapar el carácter siguiente.
El idioma del patrón del identificador de datos incluye cinco caracteres especiales predefinidos. Para obtener una descripción de cada uno de metacaracteres, consulte la tabla Caracteres especiales.
caracteres especiales
Carácter
Descripción
\l
Este carácter especial coincide con cualquier letra ASCII.
\L
Este carácter especial coincide con cualquier carácter de letra que no es ASCII, incluso los caracteres Unicode.
\d
Este carácter especial coincide con cualquier dígito ASCII.
\D
Este carácter especial coincide con cualquier dígito que no es ASCII, incluso los caracteres Unicode.
\w
Este carácter especial coincide con cualquier carácter sin coincidencia con
\l
o
\d
, incluso los caracteres Unicode.
Expresiones con corchetes
Las expresiones con corchetes comienzan con
[
y terminan con
]
y contienen por lo menos un carácter en el cuerpo de la expresión. Por ejemplo, la expresión con corchetes
[abcd]
coincide con cualquiera de las letras "a," "b," "c," o "d".
Es posible incluir un rango de caracteres dentro de una expresión con corchetes separando dos caracteres con un guion:
-
. Por ejemplo, la expresión con corchetes
[a-z]
coincide con las letras minúsculas de "a" a "z". Cualesquiera dos caracteres separados por
-
se interpretan como un rango. El orden relativo del rango no importa:
[a-z]
y
[z-a]
coinciden con los mismos caracteres.
Es posible incluir los caracteres "]" y "-" en la expresión con corchetes si se siguen estas reglas:
  • El carácter “]” debe aparecer como el primer carácter en su expresión con corchetes. Por ejemplo:
    []a-z]
    coincide con el carácter "]” o cualquier letra minúscula entre "a" y "z".
  • El carácter “-” debe aparecer como el primer o el último carácter en la expresión con corchetes. Si la expresión con corchetes contiene los caracteres "]" y “-”, "]" debe ser el primer carácter y "-" debe ser el último carácter. Por ejemplo:
    []-]
    coincide con "]" o "-".
Orden de interpretación
Los patrones del identificador de datos se interpretan de izquierda a derecha. Por ejemplo, la expresión con corchetes
[a-d-z]
se interpreta como el rango
a-d
y, a continuación, como los literales
-
y
z
.
Cuantificadores
Es posible colocar un cuantificador después de cualquier token en el patrón del identificador de datos. El cuantificador especifica cuántas incidencias del patrón deben coincidir. Para obtener una descripción de los cuantificadores disponibles en el idioma del patrón del identificador de datos, consulte la tabla Cuantificadores.
Cuantificadores
Cuantificador
Descripción
?
Este cuantificador especifica que la expresión debe coincidir con cero o una incidencia del token precedente.
{
n
}
Este cuantificador especifica que la expresión debe coincidir exactamente con las incidencias de
n
del token precedente.
{
n
,
m
}
Este cuantificador especifica que la expresión debe coincidir entre las incidencias de
n
y
m
del token precedente (inclusivo).