Expressões Regulares com Google Planilhas
Muitas linguagens, ferramentas e plataformas utilizam expressões regulares e sua utilização é
importante para todas elas. Conhecer REGEX certamente ajudará os profissionais em Análise e
Desenvolvimento de Sistemas a resolver muitos problemas em qualquer área de atuação. Nesta
Disciplina, considerando as diferentes experiências e habilidades dos estudantes, optamos por
avançar com a utilização da Google Planilhas. Além de não ser necessária a instalação e a
configuração, a ferramenta está disponível on-line. Dessa forma, todos poderão acessá-la sem
grandes esforços e utilizar sua lógica em qualquer linguagem de programação.
Inicialmente, podemos utilizar a função Find and Replace, disponível em Google Docs, Google Slides e
Google Sheets. Com um documento aberto, navegue até o menu Editar e clique em Localizar e
Substituir. Ao lado de “Localizar”, digitamos a expressão procurada e caso haja a necessidade de
substituição será preciso preencher o novo termo no campo “Substituir”. Para ativar a REGEX,
clicamos em “Pesquisar usando expressões regulares”.
Na ferramenta de planilha, as expressões regulares são úteis para resolver problemas com strings de
texto por meio da combinação de padrões e, por meio dela, podemos encontrar nomes ou números
de telefone entre uma grande quantidade de dados, validar endereços de e-mail, extrair URLs,
renomear nomes de arquivos etc.
Para trabalhar com REGEX no âmbito das planilhas, a Google disponibiliza três funções:
REGEXMATCH, REGEXEXTRACT e REGEXREPLACE. Com ela, podemos localizar e substituir strings de
texto, incluindo caracteres, números e palavras ou padrões por expressões regulares documentos,
planilhas e slides.
REGEXMATCH confirmará se encontrou o padrão no texto;
REGEXEXTRACT extrairá o texto que corresponde ao padrão;
REGEXREPLACE substituirá o texto que corresponde ao padrão.
A função REGEXMATCH retorna TRUE se corresponder ao padrão fornecido for localizado em
qualquer lugar do texto e FALSE caso não haja correspondências no texto. Vejamos uma breve lista
com livros da série Vaga-Lume, uma coleção que fez a cabeça de muitos jovens e adolescentes
entre os anos 1970 e 2000. No primeiro exemplo, a expressão ‘=REGEXMATCH(A2, “[0-9]”)’ retornou
TRUE apenas para as células cujo texto continha algum valor numérico:
Considerando esse mesmo exemplo, você poderá extrair o ano de publicação dos livros. Para isso,
foi criada uma coluna chamada ano e utilizada a função REGEXEXTRACT. Observe que o
metacaractere dígito seguido do sinal de positivo retornou valores individuais para as células que
continham valor numérico e o erro #N/A para a única que não continha. Embora não seja o foco,
saiba que a Google Sheet fornece uma função para tratar esse tipo de erro ISNA() que, quando
combinada a outras funções, poderia dar um tratamento mais adequado ao problema. Experimente
usar a expressão ‘=IF(ISNA(REGEXEXTRACT(A4,”\d+”)),FALSE)’.