Как скачать сайт целиком из кэша Google?

Опубликовано: 2019-12-28

Если нужный вам сайт был недавно удален, но Archive.org не сохранил последнюю версию, что можно сделать, чтобы получить его контент? Google Cache поможет это сделать. Все, что вам нужно, это установить вот такой плагин - https://www.downthemall.net/

1 - Установите плагин DownThemall в свой браузер.

2 - Откройте Google.com в браузере и установите «100 Результатов на странице» в меню «Настройки» -  «Настройки поиска». Это даст вам больше загружаемых страниц кэша за один клик. К сожалению, 100 результатов являются максимальными в поиске Google:

3 - Найдите в Google все кэшированные страницы нужного вам сайта. Просто введите в поле поиска вот такую строку: site: yourwebsite.com. Пример с spacex.com:

4 - В плагине DownThemall введите cache в поле "Fast Filtering". Это регулярное выражение выберет все кэшированные страницы. Нажмите кнопку Download и подождите немного, до тех пор пока загрузка страниц не отановится из за ошибки. 

5 - После 100 или более загруженных файлов Google прервет процесс и попросит вас ввести капчу. Плагин DownThemall не может сам вводит капчу, или как-то корректно обрабатывать ее появление, он просто останавливает загрузку. Таким образом, вам нужно вернуться к поиску в Google, открыть любой результат, ввести капчу вручную и возобновить процесс загрузки. Это даст вам следующую партию файлов для загрузки.
Как видите, процесс не полностью автоматизирован, но он довольно быстрый и совершенно бесплатный. Если вы хотите скачать тысячи и миллионы кэшированных страниц, лучше купить какой-нибудь SEO-инструмент с опцией «google cache scraper».

Использование материалов статьи разрешается только при условии размещения ссылки на источник: https://archivarix.com/ru/blog/download-website-google-cache/

7 лет Archivarix

Сегодня у нас особенный день — Archivarix празднует своё 7-летие! И мы хотим поблагодарить именно тебя за твоё доверие, идеи и обратную связь, которые помогли нам стать лучшими в деле восстановления с…

6 месяцев назад
Всем кто ждал скидок на пополнение баланса!

Дорогие пользователи Archivarix, Поздравляем вас с наступающими праздниками и благодарим за то, что вы выбрали наш сервис для архивации и восстановления веб-сайтов!…

1 год назад
6 лет Archivarix

Наступил момент, когда мы гордимся не только своими достижениями, но и вашим участием в этом пути. В этом году Archivarix празднует своё 6-летие, и в первую очередь мы хотели бы выразить огромную благ…

1 год назад
Изменение цен

С 1 февраля 2023 года изменятся цены на восстановления и скачивания. Активируйте промо-код и получите бонус.…

2 года назад
Black Friday

Очередные скидки от Archivarix на Black Friday и Cyber Monday.…

3 года назад
День рождения Archivarix

Наступило 4 года с тех пор, как 29 сентября 2017 мы сделали сервис Archivarix публичным. Ежедневно пользователи делают тысячи восстановлений. Количество серверов, которые распределяют между собой скач…

3 года назад
Что можно восстановить из веб архива?

Иногда наши пользователи спрашивают, почему сайт восстановился не полностью? Почему он не работает так, как хотелось бы? Известные проблемы при восстановлении сайтов из archive.org.…

4 года назад
BLACKFRIDAY

С пятницы 27.11.2020 до понедельника 30.11.2020 действуют два жирных купона. Каждый из них даёт бонус на баланс в виде 20% или 50% от суммы вашего последнего или нового платежа.…

4 года назад
День рождения Archivarix

З года назад, 29 сентября 2017 года заработал наш сервис по восстановлению сайтов из archive.org. Все эти 3 года мы непрерывно развивались, мы создали свою CMS, систему скачивания живых сайтов, значит…

4 года назад
Archivarix.net - Архив веб-сайтов и система поиска.

Аналог Wayback Machine (web.archive.org). Сервис по поиску архивных копий сайтов. Данные за 1996 год. Полнотекстовый поиск.
В ближайшее время наша команда планирует запустить уникальный сервис, сочет…

4 года назад