Как перенести контент из web.archive.org на Wordpress?

Опубликовано: 2019-11-29

С помошью параметра "Извлечение структурированного контента" можно очень просто сделать Wordpress блог как из сайта, найденного в Веб Архиве, так и из любого другого сайта. Для этого находим сайт-источник, далее в инструменте Восстановить Сайт или Скачать сайт отмечаем опцию "Извлечь структурированный контент" и запускаем парсинг сайта. 

После завершения восстановления сайта система разворачивает его на нашем сервере и начинает извлекать контент. При формировании архива статей наш парсер учитывает только значащий контент исключая дубли статей, управляющие элементы и служебные страницы, оставляя только готовые к импорту на ваш сайт статьи с сохранённым форматированием. После окончания процесса извлечения статей вам придет письмо с подтверждением, открываем его и скачиваем контент - кнопка "Статьи (.zip)". 

В zip архиве находится извлеченный контент в различных форматах, из них выбираем файл с расширением .wxr. На вашем Wordpress сайте запускаем импорт контента - (В админ панели Wordpress - Инструменты - Импорт - Wordpress - Запустить импорт).

Если извлеченных контент был с изображениями, то ссылки на них будут содержаться в файле статей. Чтобы импортировать их на ваш Wordpress сайт нужно воспользоваться нашим плагином Archivarix External Images Importer. Во вкладке плагина "Download settings" можно поставить параметр "Start downloading" на "Immediately", тогда при импорте файла со статьями плагин будет сразу скачивать имеющиеся там изображения. Если у вас изображений много, то можно воспользоваться бекграунд импортом - в той же вкладке ставим "Put on queue" и затем нажимаем появившуюся кнопу "Run background processing". Через некоторое время все доступные медиафайлы будут импортированы на ваш сайт.

Если изображения, которые вы хотите загрузить на Wordpress блог, находятся на том же домене, поставьте параметр "Missing local images" - "Download".

Использование материалов статьи разрешается только при условии размещения ссылки на источник: https://archivarix.com/ru/blog/convert-archiveorg-to-wordpress/

1 Как работает Архиварикс?

Система Архиварикс предназначена для скачивания и восстановления сайтов - как уже не работающих из Веб Архива, так и живых, находящихся в данный момент онлайн. В этом заключается ее основное отличие о…

5 лет назад
2 Как перенести контент из web.archive.org на Wordpress?

С помошью параметра "Извлечение структурированного контента" можно очень просто сделать Wordpress блог как из сайта, найденного в Веб Архиве, так и из любого другого сайта. Для этого находим сайт-исто…

5 лет назад
3 Простая и легкая Archivarix CMS. Редактор копированных сайтов.

Для того, чтобы вам было удобно редактировать восстановленные в нашей системе сайты, мы разработали простую Flat File CMS состоящую всего из одного небольшого файла. Не смотря на свой размер, эта CMS …

5 лет назад
4 Регулярные выражения, используемые в Archivarix CMS

В данной статье содержаться регулярные выражения, применяемые для поиска и замены в контенте сайтов, восстановленных с помощью системы Archivarix. Они не являются чем-то свойственным только этой систе…

5 лет назад
5 Система скачивания сайта. Как правильно выбрать количество файлов?

Наша система скачивания сайтов и конвертации их на нашу Archivarix CMS позволяет бесплатно скачивать до 200 файлов с сайта. Если на сайте файлов больше и все они нужны, то за эту услугу вы можете запл…

5 лет назад