Como transferir conteúdo do Wayback Machine (archive.org) para o Wordpress?

Postado por: 2019-12-04

Ao usar a opção “Extrair conteúdo estruturado”, você pode criar facilmente um blog Wordpress no site encontrado no Arquivo da Web e em qualquer outro site. Para fazer isso, primeiro encontre o site de origem e, em seguida, na ferramenta "Recuperar o site" ou "Baixar um site", marque a opção "Extrair conteúdo estruturado". Digite suas opções (email, timestamps, etc.) e comece o download.


Quando um processo de download do site é concluído, o sistema o implanta em nosso servidor e começa a extrair conteúdo. Durante a criação de um arquivo de artigos, nosso analisador leva em consideração apenas o conteúdo significativo, excluindo artigos duplicados, controles e páginas de serviço, deixando apenas os artigos com formatação salva prontos para importação no seu site. Após a conclusão do processo de extração de artigos, você receberá uma carta de confirmação, abra-a e faça o download do conteúdo - o botão "Artigos (.zip)".


O arquivo zip contém o conteúdo extraído em vários formatos, a partir deles, selecione um arquivo com a extensão .wxr. No site do Wordpress, inicie a importação de conteúdo - (no painel de administração do Wordpress - Ferramentas - Importar - Wordpress - Iniciar importação).


Se o conteúdo extraído tiver algumas imagens, os links para eles estarão contidos no arquivo do artigo. Para importá-los para o seu site Wordpress, você precisa usar o plugin Importador de Imagens Externas Archivarix. Na guia do plug-in "Configurações de download", você pode definir o parâmetro "Iniciar o download" para "Imediatamente". Isso significa que, ao importar um arquivo com artigos, o plug-in baixará imediatamente todas as imagens externas para a galeria de mídia do Wordpress. Se você tiver muitas imagens, poderá usar a importação em segundo plano - na mesma guia, escolha "Colocar na fila" e clique no botão "Executar processamento em segundo plano". Depois de um tempo, todos os arquivos de mídia disponíveis serão importados para o seu site.

O uso de materiais de artigo é permitido apenas se o link para a fonte for publicado: https://archivarix.com/pt/blog/convert-archiveorg-to-wordpress/

Últimas notícias:
2020.11.03
A nova versão do CMS tornou-se mais conveniente e compreensível para webmasters de todo o mundo.

- Localização completa do Archivarix CMS em 13 idiomas (inglês, espanhol, italiano, alemão, francês, português, polonês, turco, japonês, chinês, russo, ucraniano, bielorrusso).
- Exportar todos os dados atuais do site para um arquivo zip para salvar um backup ou transferir para outro site.
- Mostra e remove arquivos zip quebrados nas ferramentas de importação.
- Verificação da versão do PHP durante a instalação.
- Informações para instalar o CMS em um servidor com NGINX PHP-FPM.
- Na busca, quando o modo especialista está ligado, são exibidos a data / hora da página e um link para sua cópia no WebArchive.
- Melhorias na interface do usuário.
- Otimização de código.

Se você é um falante nativo de um idioma para o qual nosso CMS ainda não foi traduzido, nós o convidamos a tornar nosso produto ainda melhor. Através do serviço Crowdin, você pode se inscrever e se tornar nosso tradutor oficial para novos idiomas.
2020.10.06
Nova versão do Archivarix CMS.
- Suporte à interface de linha de comando para implantação de sites diretamente da linha de comando, importações, configurações, estatísticas, histórico de limpeza e atualizações do sistema.
- Suporte para senhas criptografadas password_hash (), que podem ser usadas no CLI.
- Modo especialista para incluir informações de depuração adicionais, ferramentas experimentais e links diretos para instantâneos salvos do WebArchive.
- As ferramentas para imagens e links internos corrompidos agora podem retornar uma lista de todos os URLs ausentes em vez de removê-los.
- A ferramenta de importação mostra arquivos zip corrompidos / incompletos que podem ser removidos.
- Suporte aprimorado de cookies para atender aos requisitos dos navegadores modernos.
- Definir a escolha do editor padrão para páginas HTML (editor visual ou código).
- Aba "Mudanças" mostrando diferenças de texto, desabilitada por padrão, pode ser habilitada nas configurações.
- Você pode reverter para uma alteração específica na guia "Alterações".
- Corrigido url de mapa de site XML para sites construídos com subdomínio www.
- Corrigida a exclusão de arquivos temporários que foram criados durante a instalação / importação.
- Limpeza mais rápida da história.
- Removidas frases de localização não utilizadas.
- Mudar o idioma na tela de login.
- Pacotes externos atualizados para as versões mais recentes.
- Uso de memória otimizado para calcular diferenças de texto na guia Alterações.
- Suporte aprimorado para versões antigas de extensão php-dom.
- Uma ferramenta experimental para corrigir os tamanhos dos arquivos no banco de dados se você editou os arquivos diretamente no servidor.
- Uma ferramenta de exportação de design plano experimental e muito crua.
- Suporte experimental de chave pública para funções API futuras.
2020.06.08
A primeira atualização de junho do Archivarix CMS com recursos novos e convenientes.
- Corrigido: a seção Histórico não funcionava se o php da extensão zip não estava ativado.
- Guia Histórico com detalhes das alterações ao editar arquivos de texto.
- Ferramenta de edição de .htaccess.
- Capacidade de limpar backups até o ponto de reversão desejado.
- O bloco "URLs ausentes" foi removido das Ferramentas, pois é acessível no painel principal
- Adicionado verificação e exibição de espaço livre em disco no painel principal.
- Verificação aprimorada das extensões PHP necessárias na inicialização e instalação inicial.
- Pequenas mudanças cosméticas.
- Todas as ferramentas externas atualizadas para as versões mais recentes.
2020.05.21
Uma atualização que os estúdios da web e aqueles que usam terceirização apreciarão.
- Senha separada para o modo de segurança.
- Modo de segurança estendido. Agora você pode criar regras e arquivos personalizados, mas sem código executável.
- Reinstalar o site do CMS sem precisar excluir manualmente nada do servidor.
- Capacidade de classificar regras personalizadas.
- Pesquisa e substituição aprimoradas para sites muito grandes.
- Configurações adicionais para a ferramenta "Meta tag Viewport"
- Suporte para domínios IDN na hospedagem com a versão antiga da UTI.
- Na instalação inicial com uma senha, a capacidade de sair é adicionada.
- Se .htaccess for detectado durante a integração com o WP, as regras do Archivarix serão adicionadas ao seu início.
- Ao baixar sites por número de série, o CDN é usado para aumentar a velocidade.
- Outras pequenas melhorias e correções.
2020.05.12
Nosso Archivarix CMS está se desenvolvendo aos trancos e barrancos. Nova atualização em que apareceu:
- Novo painel para visualização de estatísticas, configurações do servidor e atualizações do sistema.
- Capacidade de criar modelos e adicionar convenientemente novas páginas ao site.
- Integração com Wordpress e Joomla em um clique.
- Agora, na Pesquisa-Substituição, a filtragem adicional é feita como um construtor, onde você pode adicionar qualquer número de regras.
- Agora você pode filtrar os resultados por domínio / subdomínios, data e hora, tamanho do arquivo.
- Uma nova ferramenta para redefinir o cache no Cloudlfare ou ativar / desativar o Modo de Desenvolvimento.
- Uma nova ferramenta para remover controle de versão em URLs, por exemplo, "?ver=1.2.3" em css ou js. Permite reparar até mesmo as páginas que pareciam tortas no WebArchive devido à falta de estilos com versões diferentes.
- A ferramenta robots.txt tem a capacidade de ativar e adicionar imediatamente um mapa do Sitemap.
- Criação automática e manual de pontos de reversão para alterações.
- Importar pode importar modelos.
- Salvar / Importar as configurações do carregador contém os arquivos personalizados criados.
- Para todas as ações que podem durar mais que um tempo limite, uma barra de progresso é exibida.
- Uma ferramenta para adicionar uma meta tag de viewport a todas as páginas de um site.
- As ferramentas para remover links e imagens quebrados têm a capacidade de contabilizar arquivos no servidor.
- Uma nova ferramenta para corrigir links de códigos de URL incorretos no código html. Raramente, mas pode ser útil.
- Melhoria na ferramenta de URLs ausentes. Juntamente com o novo carregador, agora conta chamadas para URLs inexistentes.
- Dicas Regex em pesquisa e substituição.
- Melhoria na verificação de extensões php ausentes.
- Atualizadas todas as ferramentas js usadas para as versões mais recentes.

Esta e muitas outras melhorias cosméticas e otimizações de velocidade.