Como transferir conteúdo do Wayback Machine (archive.org) para o Wordpress?

Postado por: 2019-12-04

Ao usar a opção “Extrair conteúdo estruturado”, você pode criar facilmente um blog Wordpress no site encontrado no Arquivo da Web e em qualquer outro site. Para fazer isso, primeiro encontre o site de origem e, em seguida, na ferramenta "Recuperar o site" ou "Baixar um site", marque a opção "Extrair conteúdo estruturado". Digite suas opções (email, timestamps, etc.) e comece o download.


Quando um processo de download do site é concluído, o sistema o implanta em nosso servidor e começa a extrair conteúdo. Durante a criação de um arquivo de artigos, nosso analisador leva em consideração apenas o conteúdo significativo, excluindo artigos duplicados, controles e páginas de serviço, deixando apenas os artigos com formatação salva prontos para importação no seu site. Após a conclusão do processo de extração de artigos, você receberá uma carta de confirmação, abra-a e faça o download do conteúdo - o botão "Artigos (.zip)".


O arquivo zip contém o conteúdo extraído em vários formatos, a partir deles, selecione um arquivo com a extensão .wxr. No site do Wordpress, inicie a importação de conteúdo - (no painel de administração do Wordpress - Ferramentas - Importar - Wordpress - Iniciar importação).


Se o conteúdo extraído tiver algumas imagens, os links para eles estarão contidos no arquivo do artigo. Para importá-los para o seu site Wordpress, você precisa usar o plugin Importador de Imagens Externas Archivarix. Na guia do plug-in "Configurações de download", você pode definir o parâmetro "Iniciar o download" para "Imediatamente". Isso significa que, ao importar um arquivo com artigos, o plug-in baixará imediatamente todas as imagens externas para a galeria de mídia do Wordpress. Se você tiver muitas imagens, poderá usar a importação em segundo plano - na mesma guia, escolha "Colocar na fila" e clique no botão "Executar processamento em segundo plano". Depois de um tempo, todos os arquivos de mídia disponíveis serão importados para o seu site.

O uso de materiais de artigo é permitido apenas se o link para a fonte for publicado: https://archivarix.com/pt/blog/convert-archiveorg-to-wordpress/

Últimas notícias:
2020.05.21
Uma atualização que os estúdios da web e aqueles que usam terceirização apreciarão.
- Senha separada para o modo de segurança.
- Modo de segurança estendido. Agora você pode criar regras e arquivos personalizados, mas sem código executável.
- Reinstalar o site do CMS sem precisar excluir manualmente nada do servidor.
- Capacidade de classificar regras personalizadas.
- Pesquisa e substituição aprimoradas para sites muito grandes.
- Configurações adicionais para a ferramenta "Meta tag Viewport"
- Suporte para domínios IDN na hospedagem com a versão antiga da UTI.
- Na instalação inicial com uma senha, a capacidade de sair é adicionada.
- Se .htaccess for detectado durante a integração com o WP, as regras do Archivarix serão adicionadas ao seu início.
- Ao baixar sites por número de série, o CDN é usado para aumentar a velocidade.
- Outras pequenas melhorias e correções.
2020.05.12
Nosso Archivarix CMS está se desenvolvendo aos trancos e barrancos. Nova atualização em que apareceu:
- Novo painel para visualização de estatísticas, configurações do servidor e atualizações do sistema.
- Capacidade de criar modelos e adicionar convenientemente novas páginas ao site.
- Integração com Wordpress e Joomla em um clique.
- Agora, na Pesquisa-Substituição, a filtragem adicional é feita como um construtor, onde você pode adicionar qualquer número de regras.
- Agora você pode filtrar os resultados por domínio / subdomínios, data e hora, tamanho do arquivo.
- Uma nova ferramenta para redefinir o cache no Cloudlfare ou ativar / desativar o Modo de Desenvolvimento.
- Uma nova ferramenta para remover controle de versão em URLs, por exemplo, "?ver=1.2.3" em css ou js. Permite reparar até mesmo as páginas que pareciam tortas no WebArchive devido à falta de estilos com versões diferentes.
- A ferramenta robots.txt tem a capacidade de ativar e adicionar imediatamente um mapa do Sitemap.
- Criação automática e manual de pontos de reversão para alterações.
- Importar pode importar modelos.
- Salvar / Importar as configurações do carregador contém os arquivos personalizados criados.
- Para todas as ações que podem durar mais que um tempo limite, uma barra de progresso é exibida.
- Uma ferramenta para adicionar uma meta tag de viewport a todas as páginas de um site.
- As ferramentas para remover links e imagens quebrados têm a capacidade de contabilizar arquivos no servidor.
- Uma nova ferramenta para corrigir links de códigos de URL incorretos no código html. Raramente, mas pode ser útil.
- Melhoria na ferramenta de URLs ausentes. Juntamente com o novo carregador, agora conta chamadas para URLs inexistentes.
- Dicas Regex em pesquisa e substituição.
- Melhoria na verificação de extensões php ausentes.
- Atualizadas todas as ferramentas js usadas para as versões mais recentes.

Esta e muitas outras melhorias cosméticas e otimizações de velocidade.
2020.02.14
Nova sexta-feira, novas atualizações!
Muito novo e útil foi feito no Archivarix CMS:
- Em Pesquisar e substituir, agora você pode filtrar por data do URL.
- Agora, os links externos de todas as páginas do site podem ser removidos com o clique de um botão. As âncoras são preservadas.
- Um novo parâmetro ACMS_SAFE_MODE, que proíbe alterar as configurações do Loader / CMS e carregar arquivos personalizados, também é proibido para importações importar configurações e arquivos personalizados.
- Configurações do carregador e CMS Os arquivos JSON agora podem ser baixados no seu computador e baixados no CMS a partir de um arquivo no seu computador. Assim, a transferência de configurações para outros sites se tornou ainda mais fácil.
- A criação de regras personalizadas tornou-se mais conveniente; existem padrões frequentemente usados que você pode escolher.
- Novos arquivos personalizados podem ser criados no gerenciador de arquivos sem precisar fazer o download do arquivo.
- A árvore de URL do domínio principal sempre vem em primeiro lugar.
- Se você ocultar a árvore de URL do domínio / subdomínio, essa configuração será salva ao trabalhar com o CMS.
- Em vez de dois botões, abra / reduza a árvore de URL, agora uma que pode fazer as duas coisas.
- A criação de um novo URL foi simplificada e, ao criar, você pode especificar imediatamente o arquivo no computador.
- No layout móvel, a parte principal de trabalho vem em primeiro lugar.
- Após cada manipulação do arquivo, seu tamanho é atualizado no banco de dados.
- Botões fixos para reversões seletivas do histórico.
- Corrigida a criação de novos URLs para subdomínios que contêm números no nome do domínio.
2020.02.07
Nova parte de atualizações!
Não há necessidade de alterar nada no código fonte dos arquivos agora.
- Agora você pode fazer upload de sites para o servidor, enviando para o servidor apenas um script do nosso Archivarix CMS.
- Para alterar algo nas configurações do CMS, você não precisa mais abrir seu código-fonte. Você pode definir uma senha ou limites inferiores diretamente na seção Configurações.
- Para conectar seus contadores, rastreadores, scripts personalizados, uma pasta "inclui" separada agora é usada dentro da pasta .content.xxxxxx. Você também pode fazer upload de arquivos personalizados diretamente através do novo gerenciador de arquivos no CMS. A adição de contadores e análises a todas as páginas do site também se tornou conveniente e compreensível.
- As importações suportam uma nova estrutura de arquivos com configurações e a pasta "inclui".
- Adicionado atalhos de teclado para trabalhar no editor de código.

Essas e muitas outras melhorias na nova versão. O carregador também foi atualizado e funciona com as configurações criadas pelo CMS.
2020.01.23
Mais uma mega atualização do Archivarix CMS!

Adicionadas ferramentas muito úteis que permitem o clique de um botão:
- limpe todos os links internos quebrados,
- excluir imagens ausentes,
- defina rel = "nofollow" para todos os links externos.

Agora, recuperação adicional pode ser importada diretamente do próprio CMS. Você pode combinar recuperação diferente em um site de trabalho.

Para aqueles que trabalham com sites grandes ou usam uma hospedagem ruim - todas as ações que anteriormente poderiam parar no tempo limite da sua hospedagem agora serão divididas em partes e continuarão automaticamente até serem concluídas. Deseja fazer uma substituição no código de 500 mil arquivos? Importar recuperação de vários gigabytes? Tudo isso agora é possível em qualquer hospedagem, mesmo que muito barata. O tempo limite (por padrão, 30 segundos) pode ser alterado no parâmetro ACMS_TIMEOUT.

Nosso carregador (index.php) agora funciona nos protocolos http e https, independentemente dos parâmetros de construção. Você pode forçar o protocolo alterando o valor do parâmetro ARCHIVARIX_PROTOCOL.