lpic/101/021_regularex.md
2024-12-22 20:11:03 +01:00

1.1 KiB

Le espressioni regolari o regex sono costituite da sequenze di caratteri che costituiscono un modello generico utilizzato per individuare una sequenza corrispondente in una stringa di dimensioni maggiori.

Un atomo, l'elemento base di una regex, e' un carattere, che puo' avere o meno un significato speciale. Alcuni caratteri con un significato speciale:

  • .: il carattere corrisponde a qualsiasi carattere
  • ^: inizio linea. E' un carattere letterale e non ambiguo, tranne quando e' posizionato all'inizio della riga
  • $: fine linea. E' un carattere letterale e non ambiguo, tranne quando e' posizionato alla fine della riga

Parentesi quadre

Un altro atomo sono le [], denominato bracket expression (espressione tra []). Un'espressione tra parentesi quadre e' solo un elenco di caratteri letterali racchiusi da [], facendo corrispondere l'atomo a ogni singolo carattere dell'elenco.

Per specificare i caratteri a cui l'atomo non deve corrispondere, l'elenco deve iniziare con ^, come in [^1b].

E' possibile anche specificare degli intervalli. Per esempio, [0-9] corrisponde alle cifre da 0 a 9 e [a-z] a qualsiasi lettera minuscola.