Что можно восстановить из веб архива?

Опубликовано: 2020-12-29

Иногда наши пользователи спрашивают, почему сайт восстановился не полностью? Почему он не работает так, как хотелось бы? На это есть несколько ответов и самый первый из них, это то что сайт восстанавливается из Веб Архива, а следовательно можно восстановить только то что там есть и не более.

Веб Архив сохраняет только внешнюю часть сайта, и он не может сохранить внутреннюю структуру, админ панель, базу данных и так далее. Если сайт был раньше динамический, то после восстановления из архива он будет статический. Контактные формы, поля написания комментариев, покупка товаров в онлайн магазинах работать не будут. За некоторым исключением -  если все это реализовано на ява скриптах, которые были сохранены Веб Архивом. С ними надо быть осторожнее, ведь часто бывает так, что они передают или берут какие-либо данные со сторонних доменов, и если раньше там был к примеру скрипт счётчика посещений, то теперь, после того как домен был перекуплен там может быть все что угодно, в том числе и вирусы.

Мы рекомендуем после восстановления сайта проверить с помощью нашей CMS все внешние ссылки в коде ява скриптов по шаблону http:// и https:// и разобраться что они делают.

Другой пример, почему сайт работает не так, как надо - не скачанные стили CSS. На некоторых сайтах стили могут находиться на другом домене. При скачивании сайта с помощью нашей системы скрипт обрабатывает только ссылки с одного домена и не идёт далее по внешним ссылкам. Это можно легко проверить посмотрев в коде сайта адрес, где находятся стили сайта. И если они имеет подобный вид -   https://another_domain.com/styles/main.css  , то в этом случае лучше их скачать из Веб Архива и вручную поставить на сайт с помощью нашей CMS.

И наконец третий, и самый распространённый случай некорректной работы восстановленного сайта - неправильно заданный временные промежутки для восстановления. Дата архива сайта, которую вы видите в archive.org не означает что весь сайт, от начала до конца был архивирован именно тогда. На самом деле все файлы, стили, скрипты, картинки его были сохранены в разное время. Слишком узкий промежуток времени, заданный в нашей системе как правило приводи к тому что существенная часть cайта не восстанавливается.  Выбрать правильный таймстемп порой весма не просто, но в помощь вам у нас есть целая статья о том, как это делается - https://archivarix.com/ru/blog/3-how-does-it-works-archiveorg/

Использование материалов статьи разрешается только при условии размещения ссылки на источник: https://archivarix.com/ru/blog/what-can-be-recovered/

Archivarix Broken Links Recovery: бесплатный плагин WordPress для поиска и восстановления битых ссылок

Со временем внешние ссылки в записях Wordpress неизбежно ломаются, страницы удаляются, домены истекают, видео становятся недоступными. Проверять сотни или тысячи ссылок вручную непрактично. Archivarix…

1 неделя назад
Как Internet Archive решает, что архивировать: приоритеты, частота, источники данных

Триллион сохранённых страниц. Более 99 петабайт данных. Сотни краулов, работающих каждый день одновременно. За этими цифрами стоит вопрос, который задаёт себе каждый, кто профессионально работает с ве…

1 неделя назад
Как найти и купить истёкший домен с хорошей историей

Покупка истёкшего домена с историей это один из самых эффективных способов запустить новый проект с уже существующим ссылочным профилем, трастом и даже трафиком. Вместо того чтобы продвигать голый дом…

2 недели назад
Common Crawl как альтернативный источник данных для восстановления сайтов

Когда речь заходит о восстановлении сайтов из архивов, почти все думают только о Wayback Machine. Это понятно: archive.org на слуху, у него удобный интерфейс, триллион сохранённых страниц. Но Wayback …

3 недели назад
Расширение Archivarix Cache Viewer для Chrome, Edge и Firefox

Мы выпустили браузерное расширение Archivarix Cache Viewer. Оно доступно сразу для трёх браузеров: Chrome, Edge и Firefox. Расширение бесплатное и без какой-либо рекламы.
Суть простая: быстрый доступ…

1 месяц назад
AI-контент на восстановленных сайтах: как обнаружить и что с ним делать

Когда вы восстанавливаете сайт из Web Archive, вы ожидаете получить оригинальный контент, который когда-то был написан живыми людьми. Но если архивы сайта были сделаны после 2023 года, есть реальный ш…

1 месяц назад
Веб Архив в 2026 году: что изменилось и как это влияет на восстановление сайтов

В октябре 2025 года Wayback Machine достиг отметки в один триллион сохранённых веб-страниц. Более 100 000 терабайт данных. Это огромное достижение для некоммерческой организации, которая работает с 19…

1 месяц назад
Archivarix External Images Importer 2.0 - новая версия плагина для WordPress

Мы рады представить версию 2.0 нашего WordPress плагина для импорта внешних изображений. Это не просто обновление, плагин полностью переписан с нуля с учётом современных требований и отзывов пользоват…

1 месяц назад
Купоны Black Friday & Cyber Monday

Дорогие друзья!
Black Friday и Cyber Monday - лучшее время для экономии на будущих восстановлении сайтов.
Если вы планируете восстанавливать сайты, пополнить баланс заранее или просто хотите получит…

3 месяца назад
Archivarix 8 лет!

Дорогие друзья!
Сегодня мы празднуем 8-летие сервиса Archivarix, и это повод сказать вам огромное спасибо!
Мы искренне рады, что вы выбрали наш сервис для восстановления сайтов из веб-архива. Многие…

5 месяцев назад