Consulta de CPF e CNPJ na Receita Federal com Web-Scraping

Last update: Nov 29, 2021

Overview

Consulta de CPF e CNPJ na Receita Federal com Web-Scraping

Repositório contendo scripts Python que realizam a consulta de CPF e CNPJ diretamente no site da Receita Federal.

Requerimentos

Python 3.x instalado;
Driver do navegador que será utilizado. Clique aqui para mais informações;
Caminho do driver baixado adicionado ao PATH.

Instalação

Na pasta do repositório, execute o comando:

pip install -r requirements.txt

Alterações necessárias

Para a execução, é necessário adaptar o código para o navegador que será utilizado. Por padrão o código utiliza o navegador Microsoft Edge. Modificar se necessário:

Importações dos módulos. Mudar edge para o navegador que será usado:

from selenium.webdriver.edge.service import Service
from selenium.webdriver.edge.options import Options

Caminho do driver baixado:

PATH_TO_DRIVER = "C:/edge_driver/msedgedriver.exe"

Inicialização do webdriver. Mudar Edge para o navegador que será usado:

driver = webdriver.Edge(service=serv, service_log_path="NUL", options=options)

Consulta de CNPJ - Exemplo

Na pasta do repositório, execute o comando:

python cnpj/consulta_cnpj.py

Digite os campos necessários:

Digite o CNPJ (somente números): 06990590000395
Digite os caracteres da imagem exibida: ZaQO5z

Com os dados inseridos corretamente, a consulta exibirá um JSON de retorno:

{
    "cnpj": "06.990.590/0003-95",
    "tipo_empresa": "FILIAL",
    "data_abertura": "11/01/2008",
    "nome_empresarial": "GOOGLE BRASIL INTERNET LTDA.",
    "nome_fantasia": "********",
    "endereco": {
        "logradouro": "AV DOS ANDRADAS",
        "numero": "3000",
        "complemento": "ANDAR 5 14 15 16 17 EDIF BOULEVARD CORPORATE",
        "cep": "30.260-070",
        "bairro": "SANTA EFIGENIA",
        "municipio": "BELO HORIZONTE",
        "estado": "MG"
    },
    "email": "[email protected]",
    "telefone": "(11) 2395-8400",
    "situacao_cadastral": "ATIVA",
    "data_situacao_cadastral": "11/01/2008"
}

Consulta de CPF - Exemplo

Na pasta do repositório, execute o comando:

python cpf/consulta_cpf.py

Digite os campos necessários:

Digite o CPF (somente números): 12345678901
Digite a data de nascimento (DD/MM/AAAA): 25/12/2000
Digite os caracteres da imagem exibida: 9XETCm

Com os dados inseridos corretamente, a consulta exibirá um JSON de retorno:

{
    "cpf": "123.456.789-01",
    "nome": "FULANO BELTRANO CICLANO",
    "data_nascimento": "25/12/2000",
    "situacao_cadastral": "REGULAR",
    "data_inscricao": "12/04/2006",
    "digito_verificador": "00"
}

Consulta de CPF e CNPJ na Receita Federal com Web-Scraping

Related tags

Overview

Consulta de CPF e CNPJ na Receita Federal com Web-Scraping

Requerimentos

Instalação

Alterações necessárias

Consulta de CNPJ - Exemplo

Consulta de CPF - Exemplo

Owner

Josué Campos

A spider for Universal Online Judge(UOJ) system, converting problem pages to PDFs.

Amazon scraper using scrapy, a python framework for crawling websites.

NASA APOD Discord Bot - Fetches information from NASA APOD site.

Google Maps crawler using Selenium

A python tool to scrape NFT's off of OpenSea

Automated data scraper for Thailand COVID-19 data

API to parse tibia.com content into python objects.

A simple reddit scraper to get memes (only images) from r/ProgrammerHumor.

A training task for web scraping using python multithreading and a real-time-updated list of available proxy servers.

Scraping Top Repositories for Topics on GitHub,

Web scrapping tool written in python3, using regex, to get CVEs, Source and URLs.

Scrapes Every Email Address of Every Society in Every University

PaperRobot: a paper crawler that can quickly download numerous papers, facilitating paper studying and management

Jobinja.ir jobs scraper.

A module for CME that spiders hashes across the domain with a given hash.

淘宝茅台抢购最新优化版本，淘宝茅台秒杀，优化了茅台抢购线程队列

This is my CS 20 final assesment.

🐞 Douban Movie / Douban Book Scarpy

Screenhook is a script that captures an image of a web page and send it to a discord webhook.

The open-source web scrapers that feed the Los Angeles Times California coronavirus tracker.