Regeln für reguläre Ausdrücke

Für reguläre Ausdrücke existiert eine Menge von Regeln. Folgende Basis-Quantifizierer für eine Zeichenkette Y existieren:
Quantifizierer: Bedeutung
Y? Y kommt einmal oder keinmal vor
Y* Y kommt keinmal oder beliebig oft vor.
Y+ Y kommt einmal oder beliebig oft vor.

Bestandteile eines regulären Ausdrucks lassen sich zu Zeichenklassen zusammenfassen:
Beispiel Zeichenklasse: Bedeutung:
[abxwv] Zeichen a, b, x, w oder v.
[^abxwv] Nicht die Zeichen a, b, x, w, v.
[0-9a-dA-D] Die Zeichen 0,1, .... 9, oder die Groß- und Kleinbuchstaben a bis d bzw. A bis D.

Es existieren die folgenden (wichtigen) vordefinierte Zeichenklassen:
Vordefinierte Zeichenklasse: Bedeutung:
. Jedes beliebige Zeichen
\d Ziffern von 0 - 9
\D Keine Ziffern, gleichbedeutend mit [^0-9] bzw. [^\d]
\s Weißraum: [\t\b\x0B\f\r]
\S Kein Weißraum: [^\s]
\w Wortzeichen:[A-Za-z0-9]
\W Keine Wortzeichen: [^\w]
\p{Blank} Tabulator oder Leerzeichen: [\t]
\p{Lower}, \p{Upper} Klein- oder Großbuchstabem: [A-Z] bzw. [a-z]
\p{Punct} Punkt-Zeichen: -./:;<=>?@[\]^_`{|}~!"#$%&'()*+,
\p{Graph} Sichtbare Zeichen: [\p{Punct}[\p{Alnum}]
\p{Print} Druckbare Zeichen: [\p{Graph}]

Weitere Informationen zu den regulären Ausdrücken finden sich in der Java-Api-Dokumentation zur Klasse java.util.regex.Pattern.