Como transferir conteúdo do Wayback Machine (archive.org) para o Wordpress?

Postado por: 2019-12-04

Ao usar a opção “Extrair conteúdo estruturado”, você pode criar facilmente um blog Wordpress no site encontrado no Arquivo da Web e em qualquer outro site. Para fazer isso, primeiro encontre o site de origem e, em seguida, na ferramenta "Recuperar o site" ou "Baixar um site", marque a opção "Extrair conteúdo estruturado". Digite suas opções (email, timestamps, etc.) e comece o download.


Quando um processo de download do site é concluído, o sistema o implanta em nosso servidor e começa a extrair conteúdo. Durante a criação de um arquivo de artigos, nosso analisador leva em consideração apenas o conteúdo significativo, excluindo artigos duplicados, controles e páginas de serviço, deixando apenas os artigos com formatação salva prontos para importação no seu site. Após a conclusão do processo de extração de artigos, você receberá uma carta de confirmação, abra-a e faça o download do conteúdo - o botão "Artigos (.zip)".


O arquivo zip contém o conteúdo extraído em vários formatos, a partir deles, selecione um arquivo com a extensão .wxr. No site do Wordpress, inicie a importação de conteúdo - (no painel de administração do Wordpress - Ferramentas - Importar - Wordpress - Iniciar importação).


Se o conteúdo extraído tiver algumas imagens, os links para eles estarão contidos no arquivo do artigo. Para importá-los para o seu site Wordpress, você precisa usar o plugin Importador de Imagens Externas Archivarix. Na guia do plug-in "Configurações de download", você pode definir o parâmetro "Iniciar o download" para "Imediatamente". Isso significa que, ao importar um arquivo com artigos, o plug-in baixará imediatamente todas as imagens externas para a galeria de mídia do Wordpress. Se você tiver muitas imagens, poderá usar a importação em segundo plano - na mesma guia, escolha "Colocar na fila" e clique no botão "Executar processamento em segundo plano". Depois de um tempo, todos os arquivos de mídia disponíveis serão importados para o seu site.

O uso de materiais de artigo é permitido apenas se o link para a fonte for publicado: https://pt.archivarix.com/blog/convert-archiveorg-to-wordpress/

Últimas notícias:
2019.01.23
Mais uma mega atualização do Archivarix CMS!

Adicionadas ferramentas muito úteis que permitem o clique de um botão:
- limpe todos os links internos quebrados,
- excluir imagens ausentes,
- defina rel = "nofollow" para todos os links externos.

Agora, recuperação adicional pode ser importada diretamente do próprio CMS. Você pode combinar recuperação diferente em um site de trabalho.

Para aqueles que trabalham com sites grandes ou usam uma hospedagem ruim - todas as ações que anteriormente poderiam parar no tempo limite da sua hospedagem agora serão divididas em partes e continuarão automaticamente até serem concluídas. Deseja fazer uma substituição no código de 500 mil arquivos? Importar recuperação de vários gigabytes? Tudo isso agora é possível em qualquer hospedagem, mesmo que muito barata. O tempo limite (por padrão, 30 segundos) pode ser alterado no parâmetro ACMS_TIMEOUT.

Nosso carregador (index.php) agora funciona nos protocolos http e https, independentemente dos parâmetros de construção. Você pode forçar o protocolo alterando o valor do parâmetro ARCHIVARIX_PROTOCOL.
2019.01.07
A próxima atualização do Archivarix CMS com a adição de novas funcionalidades. Agora, qualquer site antigo pode ser convertido corretamente em UTF-8 com o clique de um botão. A filtragem de pesquisa se tornou ainda melhor, porque Agora os resultados podem ser filtrados por tipo MIME.
2019.12.20
Lançamos a tão esperada atualização do Archivarix CMS. Na nova versão, além de várias melhorias e otimizações, foi adicionado um recurso muito útil para filtragem adicional dos resultados da pesquisa e suporte completo à estrutura em árvore dos URLs para recuperações com um grande número de arquivos. Mais detalhes podem ser encontrados no log de alterações no script Archivarix CMS .
2019.11.27
Foi lançado nosso plugin Importador de Imagens Externas Archivarix, que importa imagens de sites de terceiros, links para os quais estão localizados em postagens e páginas, na galeria do WordPress. Se a imagem estiver indisponível ou excluída no momento, o plug-in fará o download de uma cópia do arquivo da web.
2019.11.20
Adicionamos uma nova seção do nosso site - Archivarix Blog . Lá você pode ler informações úteis sobre a operação do nosso sistema e sobre a restauração de sites no Archive.org.