Примеры использование регулярных выражений в Archivarix CMS

Опубликовано: 2020-05-29

Как генерировать метатег description на всех страницах сайта? Как сделать, так чтобы сайт работал не из корня, а из директории?

Иногда бывает, что на некоторых страницах восстановленного сайта нет тега description. Его можно добавить вручную, но если он отсутствует на сотнях или тысячах страниц, то сделать это будет сложно. Чтобы долго не думать над составлением описаний страниц, можно просто ставить в этот тег первую фразу, встречающуюся в тексте на этой странице. Как правило она будет релевантной.

На помощь тут может придти возможность применять регулярные выражения для поиска и замены в Archivarix CMS. Просто скопируйте указанные ниже выражения в соответствующие поля инструмента Поиск и замена и запустите процесс.

(</title>)(.*?<p>([^"<]{50,200}\.))

 

$1
<meta name="description" content="$3">
$2

 

meta name="description" 

 

Это выражение создает тег <meta name="description" content= сразу после закрывающего тега </title> и добавляет туда текст со страницы, начинающийся с тега абзаца <p> и имеющий минимально 20 символов, а максимально 200 символов и закрывает тег точкой . . Поле фильтра делает замены только на тех страницах, где нет meta name="description" , если он есть замена не производится.

 

Еще один пример: Восстановленный сайт можно переделать так, что он сможет работать из директории, а ни из корня. Это может понадобиться, если вам надо разместить несколько восстановленных сайтов на одном домене. 

Для начала поменяем все пути в структуре сайта. Это делается в инструменте Поиск и замена URL

Ко всем URL с начала ^ мы добавляем новый путь /newsite1

Далее заменяем все адреса внутри страниц используя регулярные выражения, обязательно галочкой включите в запрос все файлы (js, css, txt, json, xml):

\b((?:href|src)=['"]?)(/[^/])

$1/newsite1$2

Для исправления ссылок на картинки в файлах CSS можно воспользоваться таким регулярным выражением:

(url\(['"\s])(/[^/])

Теперь в файле .htaccess надо заменить строку RewriteRule . /index.php [L] на такую строку - RewriteRule . /newsite1/index.php [L]

Теперь ваш сайт будет работат по адресу domain.com/newsite1

Использование материалов статьи разрешается только при условии размещения ссылки на источник: https://archivarix.com/ru/blog/regex-add-description-website-on-subfolder/

7 лет Archivarix

Сегодня у нас особенный день — Archivarix празднует своё 7-летие! И мы хотим поблагодарить именно тебя за твоё доверие, идеи и обратную связь, которые помогли нам стать лучшими в деле восстановления с…

4 месяца назад
Всем кто ждал скидок на пополнение баланса!

Дорогие пользователи Archivarix, Поздравляем вас с наступающими праздниками и благодарим за то, что вы выбрали наш сервис для архивации и восстановления веб-сайтов!…

1 год назад
6 лет Archivarix

Наступил момент, когда мы гордимся не только своими достижениями, но и вашим участием в этом пути. В этом году Archivarix празднует своё 6-летие, и в первую очередь мы хотели бы выразить огромную благ…

1 год назад
Изменение цен

С 1 февраля 2023 года изменятся цены на восстановления и скачивания. Активируйте промо-код и получите бонус.…

2 года назад
Black Friday

Очередные скидки от Archivarix на Black Friday и Cyber Monday.…

3 года назад
День рождения Archivarix

Наступило 4 года с тех пор, как 29 сентября 2017 мы сделали сервис Archivarix публичным. Ежедневно пользователи делают тысячи восстановлений. Количество серверов, которые распределяют между собой скач…

3 года назад
Что можно восстановить из веб архива?

Иногда наши пользователи спрашивают, почему сайт восстановился не полностью? Почему он не работает так, как хотелось бы? Известные проблемы при восстановлении сайтов из archive.org.…

4 года назад
BLACKFRIDAY

С пятницы 27.11.2020 до понедельника 30.11.2020 действуют два жирных купона. Каждый из них даёт бонус на баланс в виде 20% или 50% от суммы вашего последнего или нового платежа.…

4 года назад
День рождения Archivarix

З года назад, 29 сентября 2017 года заработал наш сервис по восстановлению сайтов из archive.org. Все эти 3 года мы непрерывно развивались, мы создали свою CMS, систему скачивания живых сайтов, значит…

4 года назад
Archivarix.net - Архив веб-сайтов и система поиска.

Аналог Wayback Machine (web.archive.org). Сервис по поиску архивных копий сайтов. Данные за 1996 год. Полнотекстовый поиск.
В ближайшее время наша команда планирует запустить уникальный сервис, сочет…

4 года назад