Как скачать сайт целиком из кэша Google?

Опубликовано: 2019-12-28

Если нужный вам сайт был недавно удален, но Archive.org не сохранил последнюю версию, что можно сделать, чтобы получить его контент? Google Cache поможет это сделать. Все, что вам нужно, это установить вот такой плагин - https://www.downthemall.net/

1 - Установите плагин DownThemall в свой браузер.

2 - Откройте Google.com в браузере и установите «100 Результатов на странице» в меню «Настройки» -  «Настройки поиска». Это даст вам больше загружаемых страниц кэша за один клик. К сожалению, 100 результатов являются максимальными в поиске Google:

3 - Найдите в Google все кэшированные страницы нужного вам сайта. Просто введите в поле поиска вот такую строку: site: yourwebsite.com. Пример с spacex.com:

4 - В плагине DownThemall введите cache в поле "Fast Filtering". Это регулярное выражение выберет все кэшированные страницы. Нажмите кнопку Download и подождите немного, до тех пор пока загрузка страниц не отановится из за ошибки. 

5 - После 100 или более загруженных файлов Google прервет процесс и попросит вас ввести капчу. Плагин DownThemall не может сам вводит капчу, или как-то корректно обрабатывать ее появление, он просто останавливает загрузку. Таким образом, вам нужно вернуться к поиску в Google, открыть любой результат, ввести капчу вручную и возобновить процесс загрузки. Это даст вам следующую партию файлов для загрузки.
Как видите, процесс не полностью автоматизирован, но он довольно быстрый и совершенно бесплатный. Если вы хотите скачать тысячи и миллионы кэшированных страниц, лучше купить какой-нибудь SEO-инструмент с опцией «google cache scraper».

Использование материалов статьи разрешается только при условии размещения ссылки на источник: https://archivarix.com/ru/blog/download-website-google-cache/

Archivarix Broken Links Recovery: бесплатный плагин WordPress для поиска и восстановления битых ссылок

Со временем внешние ссылки в записях Wordpress неизбежно ломаются, страницы удаляются, домены истекают, видео становятся недоступными. Проверять сотни или тысячи ссылок вручную непрактично. Archivarix…

3 дня назад
Как Internet Archive решает, что архивировать: приоритеты, частота, источники данных

Триллион сохранённых страниц. Более 99 петабайт данных. Сотни краулов, работающих каждый день одновременно. За этими цифрами стоит вопрос, который задаёт себе каждый, кто профессионально работает с ве…

1 неделя назад
Как найти и купить истёкший домен с хорошей историей

Покупка истёкшего домена с историей это один из самых эффективных способов запустить новый проект с уже существующим ссылочным профилем, трастом и даже трафиком. Вместо того чтобы продвигать голый дом…

2 недели назад
Common Crawl как альтернативный источник данных для восстановления сайтов

Когда речь заходит о восстановлении сайтов из архивов, почти все думают только о Wayback Machine. Это понятно: archive.org на слуху, у него удобный интерфейс, триллион сохранённых страниц. Но Wayback …

3 недели назад
Расширение Archivarix Cache Viewer для Chrome, Edge и Firefox

Мы выпустили браузерное расширение Archivarix Cache Viewer. Оно доступно сразу для трёх браузеров: Chrome, Edge и Firefox. Расширение бесплатное и без какой-либо рекламы.
Суть простая: быстрый доступ…

3 недели назад
AI-контент на восстановленных сайтах: как обнаружить и что с ним делать

Когда вы восстанавливаете сайт из Web Archive, вы ожидаете получить оригинальный контент, который когда-то был написан живыми людьми. Но если архивы сайта были сделаны после 2023 года, есть реальный ш…

4 недели назад
Веб Архив в 2026 году: что изменилось и как это влияет на восстановление сайтов

В октябре 2025 года Wayback Machine достиг отметки в один триллион сохранённых веб-страниц. Более 100 000 терабайт данных. Это огромное достижение для некоммерческой организации, которая работает с 19…

1 месяц назад
Archivarix External Images Importer 2.0 - новая версия плагина для WordPress

Мы рады представить версию 2.0 нашего WordPress плагина для импорта внешних изображений. Это не просто обновление, плагин полностью переписан с нуля с учётом современных требований и отзывов пользоват…

1 месяц назад
Купоны Black Friday & Cyber Monday

Дорогие друзья!
Black Friday и Cyber Monday - лучшее время для экономии на будущих восстановлении сайтов.
Если вы планируете восстанавливать сайты, пополнить баланс заранее или просто хотите получит…

3 месяца назад
Archivarix 8 лет!

Дорогие друзья!
Сегодня мы празднуем 8-летие сервиса Archivarix, и это повод сказать вам огромное спасибо!
Мы искренне рады, что вы выбрали наш сервис для восстановления сайтов из веб-архива. Многие…

5 месяцев назад