本文介绍了用于搜索和替换使用Archivarix System还原的网站中的内容的正则表达式。 它们不是该系统独有的。 如果您知道PHP,Perl,Java或其他编程语言的正则表达式,那么您已经知道如何使用我们的搜索和替换。
正则表达式是一种基于元字符的使用,用于查找和处理文本中的子字符串的形式语言。 为了进行搜索,使用了一个由字符和元字符组成并定义搜索规则的模板。 对于文本操作,还指定了一个附加的替换字符串,其中也可能包含特殊字符。
这是在线正则表达式构造函数,使您可以使用简单的界面-https://regexr.com/创建和测试正则表达式
使用的正则表达式列表:
[abc] A single character: a, b or c
[^ abc] Any single character but a, b, or c
[a-z] Any single character in the range a-z
[a-zA-Z] Any single character in the range a-z or A-Z
^ Start of line
$ End of line
\ A Start of string
\ z End of string
. Any single character
\ s Any whitespace character
\ S Any non-whitespace character
\ d Any digit
\ D Any non-digit
\ w Any word character (letter, number, underscore)
\ W Any non-word character
\ b Any word boundary character
(...) Capture everything enclosed
(a | b) a or b
a? Zero or one of a
a * Zero or more of a
a + One or more of a
a {3} Exactly 3 of a
a {3,} 3 or more of a
a {3,6} Between 3 and 6 of a
仅在发布到来源的链接时,才允许使用文章材料: https://archivarix.com/zh/blog/regex/
Archivarix系统旨在下载和还原不再可从Web存档访问的站点以及当前在线的站点。这是与其余“下载器”和“站点解析器”的主要区别。 Archivarix的目标不仅是下载,而且还以一种可在您的服务器上访问的形式恢复网站。
让我们从从Web Archive下载网站的模块开始。这些是位于加利福尼亚的虚拟服务器。选择它们的位置是为了获得与Web存档本身最大的连接速度,因为它的服务器位于旧金山。在…
通过使用“提取结构化内容”选项,您可以轻松地从Web存档上的站点和任何其他站点创建Wordpress博客。为此,首先找到源站点,然后在“还原网站”或“下载网站”工具中选中“提取结构化内容”选项。输入您的选项(电子邮件,时间戳等),然后开始下载。…
为了方便您编辑在我们系统中还原的网站,我们开发了一个仅包含一个小php文件的简单平面文件CMS。 尽管尺寸庞大,但此CMS是用于处理您的网站的功能强大且用途广泛的工具。 它提供了任何CMS的所有基本功能,以及网站管理员根据从Web存档还原的内容创建PBN的特殊功能。…
本文介绍了用于搜索和替换使用Archivarix System还原的网站中的内容的正则表达式。 它们不是该系统独有的。 如果您知道PHP,Perl,Java或其他编程语言的正则表达式,那么您已经知道如何使用我们的搜索和替换。 如果没有,我们希望本文对您有所帮助。…