Questo articolo descrive le espressioni regolari utilizzate per cercare e sostituire i contenuti nei siti Web ripristinati utilizzando il sistema Archivarix. Non sono univoci per questo sistema. Se conosci le espressioni regolari di PHP, Perl, Java o altri linguaggi di programmazione, allora sai già come utilizzare la nostra ricerca e sostituire.
Le espressioni regolari sono un linguaggio formale per trovare e manipolare sottostringhe nel testo, basate sull'uso di metacaratteri. Per la ricerca, viene utilizzato un modello composto da caratteri e metacaratteri e che definisce una regola di ricerca. Per la manipolazione del testo, viene inoltre specificata una stringa di sostituzione aggiuntiva, che può contenere anche caratteri speciali.
Ecco il costruttore online di espressioni regolari, che ti consente di creare e testare espressioni regolari usando una semplice interfaccia - https://regexr.com/
L'elenco delle espressioni regolari utilizzate:
[abc] Un singolo carattere: a, b, c
[^ abc] Qualsiasi singolo carattere tranne a, b, c
[az] Qualsiasi singolo carattere nell'intervallo az
[a-zA-Z] Qualsiasi singolo carattere nell'intervallo az o AZ
^ Inizio della riga
$ Fine della linea
\ A Inizio della stringa
\ z Fine della stringa
. Qualsiasi singolo personaggio
\ s Qualsiasi carattere di spazio bianco
\ S Qualsiasi carattere non bianco
\ d Qualsiasi cifra
\ D Qualsiasi non cifra
\ w Qualsiasi carattere di parola (lettera, numero, trattino basso)
\ W Qualsiasi carattere non di parole
\ b Qualsiasi carattere al contorno di parole
(...) Cattura tutto racchiuso
(a | b) a o b
a? Zero o uno di a
a * Zero o più di a
a + Uno o più di a
a {3} Esattamente 3 di a
a {3,} 3 o più di a
a {3,6} Tra 3 e 6 di a
L'uso del materiale dell'articolo è consentito solo se la fonte è pubblicata: https://archivarix.com/it/blog/regex/
Il sistema Archivarix è progettato per scaricare e ripristinare siti non più accessibili da Web Archive e quelli attualmente online. Questa è la differenza principale rispetto al resto dei "downloader…
Utilizzando l'opzione "Estrai contenuto strutturato" puoi facilmente creare un blog Wordpress sia dal sito trovato nell'Archivio Web che da qualsiasi altro sito. Per fare ciò, trova prima il sito di o…
Per semplificare la modifica dei siti Web ripristinati nel nostro sistema, abbiamo sviluppato un semplice file CMS Flat File costituito da un solo piccolo file php. Nonostante le sue dimensioni, quest…
Questo articolo descrive le espressioni regolari utilizzate per cercare e sostituire i contenuti nei siti Web ripristinati utilizzando il sistema Archivarix. Non sono univoci per questo sistema. Se co…