Encontrar números de documentos usando RegEx

Como encontrar números de documentos usando RegEx

Por em 15/02/2022

Ene Tutoriais

Temos visto aqui no site diversos tipos de dados que podemos encontrar através das expressões regulares. Hoje o artigo será um pouco mais abrangente, pois veremos como encontrar vários números de documentos usando RegEx.

Utilizar RegEx para encontrar documentos é bem mais simples do que se imagina. Números de documentos costumam seguir alguns padrões como, por exemplo, sequências de dois ou três números, separação usando pontos, e um hífen antes da sequência final.

Esse tipo de padrão pode ser visto em diversos documentos importantes como RG, CPF, CNPJ, entre outros. A exceção no CNPJ é a existência de uma barra antes da penúltima sequência de números.

É justamente por isso que usaremos um determinado comando várias vezes em todos os casos. O comando em questão é este: \d{2}. Em resumo, o \d busca por dígitos de 0 a 9, enquanto que {2} define a sequência de dígitos a ser buscada (no exemplo, uma sequência de dois dígitos).

Além deste, também serão usados alguns outros comandos, porém, de maneira mais específica. Por isso, nós veremos abaixo alguns exemplos de documentos que podemos encontrar via RegEx. Vamos lá!

RG – Registro Geral

Para começar, vejamos como buscar números de RG usando expressões regulares. Para isso, usaremos o seguinte comando:

\d{2}\.\d{3}\.\d{3}-[0-9X]

Como você pode ver, a expressão utiliza diversas vezes o comando citado mais acima, para buscar uma sequência de dígitos. Aliás, o comando é justamente \d{2} para buscar a primeira sequência de dois dígitos do RG, seguido por \. que busca pelo ponto logo após a primeira sequência. Como sempre, é necessário inserir uma \ antes do . para que ele seja interpretado como um caractere comum na expressão.

Resultado de busca por RG usando RegEx no Notepad++

Resultado da busca por RG no Notepad++

Em seguida, temos a busca pela primeira sequência de três dígitos usando \d{3}, a busca pelo ponto após essa sequência usando \., e novamente o comando \d{3} para buscar a segunda sequência de três dígitos.

Por fim, temos o seguinte código: -[0-9X]. Nesta parte, há o - que busca de fato pelo hífen que antecipa o dígito final, além de [0-9X] que irá buscar pelo dígito final, sendo que ele pode ser um dígito de 0 a 9, ou ainda, a letra X.

Leia também »  Configurando Páginas no LibreOffice Draw

CPF – Cadastro de Pessoa Física

Se você achou simples encontrar RG, vai achar ainda mais fácil a busca por CPF através das expressões regulares. O comando que usaremos será este:

\d{3}\.\d{3}\.\d{3}-\d{2}

No caso do CPF, as três primeiras sequências de números possuem três dígitos cada, e são separadas por pontos. Por isso, o início da expressão repete três vezes o comando \d{3} que busca pelas sequências, intercalados pelo comando \. que busca pelos pontos.

Resultado de busca por CPF usando RegEx no Brackets

Busca por CPF através do Brackets

Ao final, há apenas duas mudanças no comando -\d{2}. Primeiro buscamos pelo hífen que antecede os dígitos finais com o comando -, e depois usamos o comando \d{2} para buscar os dois dígitos finais do CPF. E pronto, é só isso que você precisa para buscar números de CPF via RegEx.

CNPJ – Cadastro Nacional da Pessoa Jurídica

Outro documento que pode ser encontrado facilmente via RegEx é o CNPJ. Neste caso, o comando usado será o seguinte:

\d{2}\.\d{3}\.\d{3}\/\d{4}-\d{2}

Para começar, usamos o comando \d{2} para buscar pela sequência inicial de dois dígitos. Logo após vem o comando \. que busca pelo ponto que encerra a sequência inicial.

Em seguida, o CNPJ possui duas sequências de três dígitos separadas por um ponto. Por isso, usaremos duas vezes o comando \d{3} para buscar as sequências, separados pelo comando \. que buscará o ponto de separação.

Resultado da busca por CNPJ usando RegEx no VS Code

Busca por CNPJ usando RegEx no VS Code

Depois disso, vem a sequência de quatro dígitos antecedidos pela barra, comumente chamada de “mil contra”. A barra pode ser buscada simplesmente pelo caractere /. Já a busca pela sequência de números é feita com o comando \d{4}.

Para finalizar, usaremos o - para buscar pelo hífen que antecede os dois dígitos finais. Já o comando \d{2} será o responsável por buscar os dígitos que encerram o número do CNPJ.


Esses são só três dos diversos tipos de documento que você pode encontrar utilizando expressões regulares. Apesar disso, você pode adaptar essa expressão para encontrar outros números de documento com base nos padrões do número desejado.

E caso queira, você pode seguir nossas redes sociais ou inscrever-se em nossa newsletter mensal no rodapé do site para ficar por dentro dos nossos tutoriais.

PUBLICIDADE