W tym artykule opisano wyrażenia regularne używane do wyszukiwania i zastępowania treści na stronach internetowych przywróconych za pomocą systemu Archivarix. Nie są one unikalne dla tego systemu. Jeśli znasz wyrażenia regularne PHP, Perl, Java lub innych języków programowania, to wiesz już, jak korzystać z naszego wyszukiwania i zamieniać.
Wyrażenia regularne to formalny język do wyszukiwania i manipulowania podciągami w tekście, oparty na użyciu metaznaków. Do wyszukiwania używany jest szablon składający się ze znaków i metaznaków oraz definiujący regułę wyszukiwania. W przypadku manipulacji tekstem określono również dodatkowy ciąg zastępujący, który może również zawierać znaki specjalne.
Oto internetowy konstruktor wyrażeń regularnych, który umożliwia tworzenie i testowanie wyrażeń regularnych za pomocą prostego interfejsu - https://regexr.com/
Lista użytych wyrażeń regularnych:
[abc] Pojedynczy znak: a, b, c
[^ abc] Dowolny pojedynczy znak oprócz a, b, c
[az] Dowolny pojedynczy znak z zakresu az
[a-zA-Z] Dowolny pojedynczy znak z zakresu az lub AZ
^ Początek linii
$ Koniec linii
\ A Początek ciągu
\ z Koniec łańcucha
. Dowolny pojedynczy znak
Dowolny biały znak
\ S Dowolny znak spacji
\ d Dowolna cyfra
\ D Dowolna cyfra
\ w Dowolny znak słowa (litera, cyfra, podkreślenie)
\ W Dowolny znak inny niż słowo
\ b Dowolny znak granicy słowa
(...) Uchwyć wszystko w załączeniu
(a | b) a lub b
a? Zero lub jeden z
a * zero lub więcej
a + Jeden lub więcej z
{3} Dokładnie 3 z
{3,} 3 lub więcej z
{3,6} Między 3 a 6 z
Wykorzystanie materiałów artykułu jest dozwolone tylko wtedy, gdy opublikowany jest link do źródła: https://archivarix.com/pl/blog/regex/
System Archivarix został zaprojektowany do pobierania i przywracania witryn, które nie są już dostępne z Archive.org oraz tych, które są obecnie online. Jest to główna różnica w stosunku do reszty „do…
Korzystając z opcji „Wyciąg z ustrukturyzowanej treści”, możesz łatwo utworzyć blog Wordpress zarówno ze strony znalezionej w archiwum internetowym, jak iz dowolnej innej witryny. Aby to zrobić, najpi…
Aby ułatwić edytowanie stron internetowych przywróconych w naszym systemie, opracowaliśmy prosty system plików Flat File CMS składający się tylko z jednego małego pliku php. Pomimo swoich rozmiarów, t…
W tym artykule opisano wyrażenia regularne używane do wyszukiwania i zastępowania treści na stronach internetowych przywróconych za pomocą systemu Archivarix. Nie są one unikalne dla tego systemu. Jeś…