Expressões regulares usadas no Archivarix CMS

Postado por: 2020-02-06

Este artigo descreve expressões regulares usadas para procurar e substituir conteúdo em sites restaurados usando o Sistema Archivarix. Eles não são exclusivos para este sistema. Se você conhece as expressões regulares de PHP, Perl, Java ou outras linguagens de programação, já sabe como usar nossa pesquisa e substituição.

Expressões regulares são uma linguagem formal para encontrar e manipular substrings no texto, com base no uso de metacaracteres. Para a pesquisa, é usado um modelo que consiste em caracteres e metacaracteres e na definição de uma regra de pesquisa. Para manipulação de texto, também é especificada uma sequência de substituição adicional, que também pode conter caracteres especiais.

Aqui está o construtor de expressões regulares on-line, que permite criar e testar expressões regulares usando uma interface simples - https://regexr.com/

A lista de expressões regulares usadas:

[abc] Um único caractere: a, b ou c
[^ abc] Qualquer caractere único, exceto a, b ou c
[az] Qualquer caractere único no intervalo az
[a-zA-Z] Qualquer caractere único no intervalo az ou AZ
^ Início da linha
$ Fim de linha
\ Um início de string
\ z Fim da sequência
. Qualquer caractere único
\ s Qualquer caractere de espaço em branco
\ S Qualquer caractere que não seja um espaço em branco
\ d Qualquer dígito
\ D Qualquer não dígito
\ w Qualquer caractere de palavra (letra, número, sublinhado)
\ W Qualquer caractere que não seja palavra
\ b Qualquer caractere de limite de palavra
(...) Capture tudo o que está incluído
(a | b) a ou b
a? Zero ou um de
a * Zero ou mais de um
a + Um ou mais de
a {3} Exatamente 3 de um
a {3,} 3 ou mais de
a {3,6} Entre 3 e 6 de uma

O uso de materiais de artigo é permitido apenas se o link para a fonte for publicado: https://archivarix.com/pt/blog/regex/

Últimas notícias:
2020.11.03
A nova versão do CMS tornou-se mais conveniente e compreensível para webmasters de todo o mundo.

- Localização completa do Archivarix CMS em 13 idiomas (inglês, espanhol, italiano, alemão, francês, português, polonês, turco, japonês, chinês, russo, ucraniano, bielorrusso).
- Exportar todos os dados atuais do site para um arquivo zip para salvar um backup ou transferir para outro site.
- Mostra e remove arquivos zip quebrados nas ferramentas de importação.
- Verificação da versão do PHP durante a instalação.
- Informações para instalar o CMS em um servidor com NGINX PHP-FPM.
- Na busca, quando o modo especialista está ligado, são exibidos a data / hora da página e um link para sua cópia no WebArchive.
- Melhorias na interface do usuário.
- Otimização de código.

Se você é um falante nativo de um idioma para o qual nosso CMS ainda não foi traduzido, nós o convidamos a tornar nosso produto ainda melhor. Através do serviço Crowdin, você pode se inscrever e se tornar nosso tradutor oficial para novos idiomas.
2020.10.06
Nova versão do Archivarix CMS.
- Suporte à interface de linha de comando para implantação de sites diretamente da linha de comando, importações, configurações, estatísticas, histórico de limpeza e atualizações do sistema.
- Suporte para senhas criptografadas password_hash (), que podem ser usadas no CLI.
- Modo especialista para incluir informações de depuração adicionais, ferramentas experimentais e links diretos para instantâneos salvos do WebArchive.
- As ferramentas para imagens e links internos corrompidos agora podem retornar uma lista de todos os URLs ausentes em vez de removê-los.
- A ferramenta de importação mostra arquivos zip corrompidos / incompletos que podem ser removidos.
- Suporte aprimorado de cookies para atender aos requisitos dos navegadores modernos.
- Definir a escolha do editor padrão para páginas HTML (editor visual ou código).
- Aba "Mudanças" mostrando diferenças de texto, desabilitada por padrão, pode ser habilitada nas configurações.
- Você pode reverter para uma alteração específica na guia "Alterações".
- Corrigido url de mapa de site XML para sites construídos com subdomínio www.
- Corrigida a exclusão de arquivos temporários que foram criados durante a instalação / importação.
- Limpeza mais rápida da história.
- Removidas frases de localização não utilizadas.
- Mudar o idioma na tela de login.
- Pacotes externos atualizados para as versões mais recentes.
- Uso de memória otimizado para calcular diferenças de texto na guia Alterações.
- Suporte aprimorado para versões antigas de extensão php-dom.
- Uma ferramenta experimental para corrigir os tamanhos dos arquivos no banco de dados se você editou os arquivos diretamente no servidor.
- Uma ferramenta de exportação de design plano experimental e muito crua.
- Suporte experimental de chave pública para funções API futuras.
2020.06.08
A primeira atualização de junho do Archivarix CMS com recursos novos e convenientes.
- Corrigido: a seção Histórico não funcionava se o php da extensão zip não estava ativado.
- Guia Histórico com detalhes das alterações ao editar arquivos de texto.
- Ferramenta de edição de .htaccess.
- Capacidade de limpar backups até o ponto de reversão desejado.
- O bloco "URLs ausentes" foi removido das Ferramentas, pois é acessível no painel principal
- Adicionado verificação e exibição de espaço livre em disco no painel principal.
- Verificação aprimorada das extensões PHP necessárias na inicialização e instalação inicial.
- Pequenas mudanças cosméticas.
- Todas as ferramentas externas atualizadas para as versões mais recentes.
2020.05.21
Uma atualização que os estúdios da web e aqueles que usam terceirização apreciarão.
- Senha separada para o modo de segurança.
- Modo de segurança estendido. Agora você pode criar regras e arquivos personalizados, mas sem código executável.
- Reinstalar o site do CMS sem precisar excluir manualmente nada do servidor.
- Capacidade de classificar regras personalizadas.
- Pesquisa e substituição aprimoradas para sites muito grandes.
- Configurações adicionais para a ferramenta "Meta tag Viewport"
- Suporte para domínios IDN na hospedagem com a versão antiga da UTI.
- Na instalação inicial com uma senha, a capacidade de sair é adicionada.
- Se .htaccess for detectado durante a integração com o WP, as regras do Archivarix serão adicionadas ao seu início.
- Ao baixar sites por número de série, o CDN é usado para aumentar a velocidade.
- Outras pequenas melhorias e correções.
2020.05.12
Nosso Archivarix CMS está se desenvolvendo aos trancos e barrancos. Nova atualização em que apareceu:
- Novo painel para visualização de estatísticas, configurações do servidor e atualizações do sistema.
- Capacidade de criar modelos e adicionar convenientemente novas páginas ao site.
- Integração com Wordpress e Joomla em um clique.
- Agora, na Pesquisa-Substituição, a filtragem adicional é feita como um construtor, onde você pode adicionar qualquer número de regras.
- Agora você pode filtrar os resultados por domínio / subdomínios, data e hora, tamanho do arquivo.
- Uma nova ferramenta para redefinir o cache no Cloudlfare ou ativar / desativar o Modo de Desenvolvimento.
- Uma nova ferramenta para remover controle de versão em URLs, por exemplo, "?ver=1.2.3" em css ou js. Permite reparar até mesmo as páginas que pareciam tortas no WebArchive devido à falta de estilos com versões diferentes.
- A ferramenta robots.txt tem a capacidade de ativar e adicionar imediatamente um mapa do Sitemap.
- Criação automática e manual de pontos de reversão para alterações.
- Importar pode importar modelos.
- Salvar / Importar as configurações do carregador contém os arquivos personalizados criados.
- Para todas as ações que podem durar mais que um tempo limite, uma barra de progresso é exibida.
- Uma ferramenta para adicionar uma meta tag de viewport a todas as páginas de um site.
- As ferramentas para remover links e imagens quebrados têm a capacidade de contabilizar arquivos no servidor.
- Uma nova ferramenta para corrigir links de códigos de URL incorretos no código html. Raramente, mas pode ser útil.
- Melhoria na ferramenta de URLs ausentes. Juntamente com o novo carregador, agora conta chamadas para URLs inexistentes.
- Dicas Regex em pesquisa e substituição.
- Melhoria na verificação de extensões php ausentes.
- Atualizadas todas as ferramentas js usadas para as versões mais recentes.

Esta e muitas outras melhorias cosméticas e otimizações de velocidade.