Este artigo descreve expressões regulares usadas para procurar e substituir conteúdo em sites restaurados usando o Sistema Archivarix. Eles não são exclusivos para este sistema. Se você conhece as expressões regulares de PHP, Perl, Java ou outras linguagens de programação, já sabe como usar nossa pesquisa e substituição.
Expressões regulares são uma linguagem formal para encontrar e manipular substrings no texto, com base no uso de metacaracteres. Para a pesquisa, é usado um modelo que consiste em caracteres e metacaracteres e na definição de uma regra de pesquisa. Para manipulação de texto, também é especificada uma sequência de substituição adicional, que também pode conter caracteres especiais.
Aqui está o construtor de expressões regulares on-line, que permite criar e testar expressões regulares usando uma interface simples - https://regexr.com/
A lista de expressões regulares usadas:
[abc] Um único caractere: a, b ou c
[^ abc] Qualquer caractere único, exceto a, b ou c
[az] Qualquer caractere único no intervalo az
[a-zA-Z] Qualquer caractere único no intervalo az ou AZ
^ Início da linha
$ Fim de linha
\ Um início de string
\ z Fim da sequência
. Qualquer caractere único
\ s Qualquer caractere de espaço em branco
\ S Qualquer caractere que não seja um espaço em branco
\ d Qualquer dígito
\ D Qualquer não dígito
\ w Qualquer caractere de palavra (letra, número, sublinhado)
\ W Qualquer caractere que não seja palavra
\ b Qualquer caractere de limite de palavra
(...) Capture tudo o que está incluído
(a | b) a ou b
a? Zero ou um de
a * Zero ou mais de um
a + Um ou mais de
a {3} Exatamente 3 de um
a {3,} 3 ou mais de
a {3,6} Entre 3 e 6 de uma
O uso de materiais de artigo é permitido apenas se o link para a fonte for publicado: https://archivarix.com/pt/blog/regex/
O sistema Archivarix foi projetado para baixar e restaurar sites que não são mais acessíveis no Web Archive e aqueles que estão atualmente online. Essa é a principal diferença do restante dos "downloa…
Ao usar a opção “Extrair conteúdo estruturado”, você pode criar facilmente um blog Wordpress no site encontrado no Arquivo da Web e em qualquer outro site. Para fazer isso, primeiro encontre o site de…
Para facilitar a edição dos sites restaurados em nosso sistema, desenvolvemos um CMS de arquivo simples, que consiste em apenas um pequeno arquivo php. Apesar de seu tamanho, este CMS é uma ferramenta…
Este artigo descreve expressões regulares usadas para procurar e substituir conteúdo em sites restaurados usando o Sistema Archivarix. Eles não são exclusivos para este sistema. Se você conhece as exp…