Jak przenieść zawartość z Wayback Machine (archive.org) do Wordpress?

Wysłane przez: 2019-12-04

Korzystając z opcji „Wyciąg z ustrukturyzowanej treści”, możesz łatwo utworzyć blog Wordpress zarówno ze strony znalezionej w archiwum internetowym, jak iz dowolnej innej witryny. Aby to zrobić, najpierw znajdź witrynę źródłową, a następnie w narzędziu "Wznowienie stronę" lub "Pobierz stronę" zaznacz opcję „Wyciąg z ustrukturyzowanej treści”. Wprowadź swoje opcje (e-mail, znaczniki czasu itp.) I rozpocznij pobieranie.


Po zakończeniu procesu pobierania strony system wdraża ją na naszym serwerze i zaczyna wyodrębniać zawartość. Podczas tworzenia archiwum artykułów nasz analizator bierze pod uwagę tylko znaczącą treść, z wyjątkiem zduplikowanych artykułów, elementów sterujących i stron serwisowych, pozostawiając tylko artykuły z zapisanym formatowaniem gotowe do zaimportowania do witryny. Po zakończeniu procesu wyodrębniania artykułów otrzymasz list potwierdzający, otwórz go i pobierz zawartość - przycisk „Artykuły (.zip)”.


Archiwum zip zawiera wyodrębnioną zawartość w różnych formatach, z nich wybierz plik z rozszerzeniem .wxr. Na swojej stronie Wordpress rozpocznij import zawartości - (W panelu administracyjnym Wordpress - Narzędzia - Import - Wordpress - Rozpocznij import).


Jeśli wyodrębniona treść zawiera obrazy, łącza do nich będą zawarte w pliku artykułu. Aby zaimportować je do witryny Wordpress, musisz użyć naszej wtyczki Archivarix External Images Importer. W zakładce wtyczki „Ustawienia pobierania” możesz ustawić parametr „Rozpocznij pobieranie” na „Natychmiast”. Oznacza to, że podczas importowania pliku z artykułami wtyczka natychmiast pobierze wszystkie obrazy zewnętrzne do galerii multimediów Wordpress. Jeśli masz dużo obrazów, możesz użyć importu w tle - na tej samej karcie wybierz „Umieść w kolejce”, a następnie kliknij przycisk „Uruchom przetwarzanie w tle”. Po chwili wszystkie dostępne pliki multimedialne zostaną zaimportowane do Twojej witryny.

Wykorzystanie materiałów artykułu jest dozwolone tylko wtedy, gdy opublikowany jest link do źródła: https://archivarix.com/pl/blog/convert-archiveorg-to-wordpress/

Najnowsze wiadomości:
2020.05.21
Aktualizacja, którą docenią studia internetowe i osoby korzystające z outsourcingu.
- Oddzielne hasło dla trybu awaryjnego.
- Rozszerzony tryb bezpieczny. Teraz możesz tworzyć niestandardowe reguły i pliki, ale bez kodu wykonywalnego.
- Ponowna instalacja strony z CMS bez konieczności ręcznego usuwania czegokolwiek z serwera.
- Możliwość sortowania niestandardowych reguł.
- Ulepszone wyszukiwanie i zamiana dla bardzo dużych witryn.
- Dodatkowe ustawienia dla narzędzia „Metatag Viewport”.
- Wsparcie dla domen IDN na hostingu ze starą wersją ICU.
- W początkowej instalacji z hasłem dodano możliwość wylogowania.
- Jeśli .htaccess zostanie wykryty podczas integracji z WP, wówczas reguły Archivarix zostaną dodane na jego początku.
- Podczas pobierania stron według numeru seryjnego CDN służy do zwiększenia prędkości.
- Inne drobne ulepszenia i poprawki.
2020.05.12
Nasz Archivarix CMS rozwija się błyskawicznie. Nowa aktualizacja, w której pojawiły się:
- Nowy pulpit do przeglądania statystyk, ustawień serwera i aktualizacji systemu.
- Możliwość tworzenia szablonów i wygodnego dodawania nowych stron do witryny.
- Integracja z Wordpress i Joomla za pomocą jednego kliknięcia.
- Teraz w Search-Substitution wykonuje się dodatkowe filtrowanie w postaci konstruktora, w którym można dodać dowolną liczbę reguł.
- Teraz możesz filtrować wyniki według domeny / poddomen, daty i godziny, rozmiaru pliku.
- Nowe narzędzie do resetowania pamięci podręcznej w Cloudlfare lub włączania / wyłączania trybu deweloperskiego.
- Nowe narzędzie do usuwania wersji w adresach URL, na przykład „?ver=1.2.3” w css lub js. Umożliwia naprawę nawet tych stron, które wyglądały krzywo w Archiwum Web ze względu na brak stylów w różnych wersjach.
- Narzędzie robots.txt ma możliwość natychmiastowego włączenia i dodania mapy mapy witryny.
- Automatyczne i ręczne tworzenie punktów wycofywania zmian.
- Import może importować szablony.
- Zapisywanie / importowanie ustawień modułu ładującego zawiera utworzone pliki niestandardowe.
- Dla wszystkich działań, które mogą trwać dłużej niż limit czasu, wyświetlany jest pasek postępu.
- Narzędzie do dodawania metatagu rzutni do wszystkich stron witryny.
- Narzędzia do usuwania uszkodzonych linków i obrazów mają możliwość rozliczania plików na serwerze.
- Nowe narzędzie do naprawy nieprawidłowych linków do kodu urlencode w kodzie HTML. Rzadko, ale może się przydać.
- Poprawione narzędzie brakujących adresów URL. Wraz z nowym modułem ładującym liczy teraz połączenia z nieistniejącymi adresami URL.
- Porady Regex w wyszukiwaniu i zamianie.
- Poprawione sprawdzanie brakujących rozszerzeń php.
- Zaktualizowano wszystkie używane narzędzia js do najnowszych wersji.

To i wiele innych kosmetycznych ulepszeń i optymalizacji prędkości.
2020.02.14
Nowy piątek, nowe aktualizacje!
W Archivarix CMS wykonano wiele nowych i przydatnych:
- W Search and Replace możesz teraz filtrować według daty url.
- Teraz zewnętrzne linki ze wszystkich stron witryny można usunąć jednym kliknięciem. Kotwice są zachowane.
- Nowy parametr ACMS_SAFE_MODE, który zabrania zmiany ustawień modułu ładującego / CMS i ładowania plików niestandardowych, zabronione jest również importowanie ustawień importowania i plików niestandardowych.
- Ustawienia modułu ładującego i CMS Pliki JSON można teraz pobrać na komputer i pobrać do CMS z pliku na komputerze. W ten sposób przenoszenie ustawień do innych witryn stało się jeszcze łatwiejsze.
- Tworzenie niestandardowych reguł stało się wygodniejsze, często używa się wzorów, które można wybrać.
- Nowe pliki niestandardowe można tworzyć w menedżerze plików bez konieczności pobierania pliku.
- Drzewo adresów URL domeny głównej zawsze jest najważniejsze.
- Jeśli ukryjesz drzewo adresu URL domeny / subdomeny, to ustawienie zostanie zapisane podczas pracy z CMS.
- Zamiast dwóch przycisków otwórz / zwiń drzewo url, teraz jeden, który może zrobić oba.
- Tworzenie nowego adresu URL zostało uproszczone, a podczas tworzenia można natychmiast określić plik z komputera.
- W układzie mobilnym główna część robocza jest najważniejsza.
- Po każdej manipulacji plikiem jego rozmiar jest aktualizowany w bazie danych.
- Naprawiono przyciski do selektywnego wycofywania historii.
- Naprawiono tworzenie nowych adresów URL dla poddomen, które zawierają liczby w nazwie domeny.
2020.02.07
Nowa porcja aktualizacji!
Teraz nie trzeba już nic zmieniać w kodzie źródłowym plików.
- Teraz możesz przesyłać strony na serwer, przesyłając na serwer tylko jeden skrypt z naszego Archivarix CMS.
- Aby zmienić coś w ustawieniach CMS, nie trzeba już otwierać jego kodu źródłowego. Możesz ustawić hasło lub dolne limity bezpośrednio w sekcji Ustawienia.
- Aby połączyć swoje liczniki, moduły śledzące, skrypty niestandardowe, w folderze .content.xxxxxx jest teraz używany osobny folder „obejmuje”. Możesz również przesyłać pliki niestandardowe bezpośrednio przez nowego menedżera plików w CMS. Dodanie liczników i danych analitycznych do wszystkich stron witryny stało się również wygodne i zrozumiałe.
- Importowanie obsługuje nową strukturę plików z ustawieniami i folder „zawiera”.
- Dodano skróty klawiaturowe do pracy w edytorze kodu.

Te i wiele innych ulepszeń w nowej wersji. Moduł ładujący został również zaktualizowany i działa z ustawieniami tworzonymi przez CMS.
2020.01.23
Kolejna mega aktualizacja Archivarix CMS!

Dodano bardzo przydatne narzędzia, które umożliwiają kliknięcie przycisku:
- wyczyść wszystkie zepsute linki wewnętrzne,
- usuń brakujące obrazy,
- ustaw rel = "nofollow" dla wszystkich linków zewnętrznych.

Teraz dodatkowe odzyskiwanie można zaimportować bezpośrednio z samego CMS. Możesz połączyć różne odzyskiwanie w jedną działającą witrynę.

Dla tych, którzy pracują z dużymi witrynami lub używają złego hostingu - wszystkie działania, które wcześniej mogły zostać zatrzymane po przekroczeniu limitu czasu twojego hostingu, zostaną teraz podzielone na części i będą automatycznie kontynuowane aż do ich zakończenia. Chcesz dokonać wymiany w kodzie 500 tysięcy plików? Zaimportować kilka gigabajtów odzyskiwania? Wszystko to jest teraz możliwe na każdym, nawet bardzo tanim hostingu. Limit czasu (domyślnie 30 sekund) można zmienić w parametrze ACMS_TIMEOUT.

Nasz moduł ładujący (index.php) działa teraz zarówno na protokołach http, jak i https, niezależnie od parametrów kompilacji. Możesz wymusić protokół, zmieniając wartość parametru ARCHIVARIX_PROTOCOL.