Como Importar PDF no Excel com Power Query

Como importar PDF no Excel com Power Query passo-a-passo com exemplo e download gratuito do arquivo.

Como importar arquivo PDF no Excel com Power Query?

Veja neste artigo, como importar arquivo PDF, utilizando o Power Query no Microsoft Excel.

É possível trabalhar com uma tabela de dados de arquivo PDF no Excel?

Sim e não, confuso, mas muita calma nessa hora.

Se você possui o Office 365, a resposta é SIM, caso contrário, lamento em dizer, mas você NÃO conseguirá importar uma tabela diretamente de arquivo pdf.

Mas, quais são essas possibilidades com Office 365?

Sabemos que existe o suplemento Power Query no Excel, desde sua versão 2010, porém, apenas na versão disponibilizada no Office 365, podemos importar e tratar dados de arquivos salvos na extensão .pdf.

Porém, ligue o alerta, muitos sistemas possibilitam ao usuário exportar relatórios em diversas extensões, como: .csv, .xls, .xlsx, .pdf, entre outras.

O Excel consegue importar PDF, então vou utilizar sempre esta extensão? Não.

Cuide para a estrutura dos dados dispostos no arquivo PDF, veja se o mesmo apresenta um padrão tabular, afinal, você quer e precisa facilitar sua vida e não arrumar mais um problema, correto?

Tá ok, mas como importamos o arquivo?

Antes de importar, lembre-se de verificar e conhecer a estrutura do arquivo. No exemplo iremos trabalhar com uma tabela, apresentada em um arquivo salvo na extensão .pdf, contendo apenas 1 página.

Siga as seguintes etapas:

  1. Abra uma nova pasta de trabalho do Excel;
  2. Vá até a guia DADOS;
  3. No grupo Obter e Transformar Dados, selecione Obter Dados;
Como importar pdf no excel com power query 1

Deste modo, encerramos a importação e tratamento de um arquivo PDF com página única e tabela estruturada.

Se o pdf tiver mais de uma página?

O processo é o mesmo até a etapa nº6 (Navegador), aqui começa o ponto de diferença, ao invés de selecionar as tabelas, você irá clicar sobre a pasta amarela.

Ao entrar no editor do Power Query, você verá algumas colunas, logo, irá até a coluna Kind, procure o item Table em alguma das linhas, clique com botão direito do mouse, em Filtro de Texto, marque a opção “Igual a”.

Agora, selecione a coluna Data, clique com botão direito e selecione a opção de Remover outras colunas, deste modo, a única coluna que será mantida será a coluna selecionada.

Com a coluna Data, você deverá clicar no objeto de expansão (seta para esquerda e direita).

Após clicar no botão de expansão, desmarque a opção de usar o nome da coluna como prefixo, clique em ok.

Agora, deveremos promover a primeira linha como cabeçalho.

Note que na coluna ID, alguns registros aparecem com os caracteres “##”, precisamos neste caso, substituir estes caracteres por 0 (zero), para realizarmos as etapas seguintes da maneira correta e ao fim, iremos remover esta coluna ID, pois não será necessário para este exemplo.

Para substituir estes caracteres “##” por 0, selecione a coluna, em Página Inicial vá até o grupo Trasnformar e selecione o comando Substituir Valores.

Surgirá a caixa de diálogo, insira o caractere a ser procurado (##), no campo abaixo insira o valor 0, clique em OK.

Por fim, você deverá replicar as etapas que foram feitas com o arquivo de PDF com página única, tratar o erro das colunas de nomes e renomear as colunas de datas.

Deste modo, você terá seu arquivo pdf multi-páginas consolidado.

Finalizando os tratamentos, clique em Fechar e carregar Para e selecione o destino final da sua consulta.

Espero ter ajudado com mais este artigo, bons estudos.

Download Planilha Exemplo Importar PDF no Excel com Power Query

Clique no botão abaixo para realizar o  download do arquivo de exemplo:

Baixe a planilha

Avalie este post
Sair da versão mobile