Pivotando Tabelas: As Tabelas Dinâmicas em Python

Ana Maria Gomes
4 minutos de leitura

Conteúdos do tutorial

As tabelas dinâmicas são ferramentas poderosas para quem trabalha com grandes volumes de dados, especialmente em ambientes de escritório onde o Excel reina supremo. No entanto, para quem está começando a explorar o mundo da programação com Python, pode parecer um desafio replicar essa funcionalidade. Felizmente, com a biblioteca pandas, pivotar tabelas em Python é não apenas possível, mas também incrivelmente eficiente. Vamos aprender então a criar tabelas dinâmicas em Python.

O que são Tabelas Dinâmicas?

Tabelas dinâmicas são uma forma de resumir, analisar, explorar e apresentar dados. Elas permitem reorganizar e agrupar dados de maneira que possamos extrair informações úteis e insights de um conjunto de dados, muitas vezes complexo. No Excel, as tabelas dinâmicas são amplamente utilizadas para esses fins, mas e em Python?

A Biblioteca Pandas

Pandas é uma biblioteca de código aberto que fornece estruturas de dados de alto desempenho e ferramentas de análise de dados para a linguagem de programação Python. É a ferramenta ideal para trabalhar com dados tabulares, pois oferece operações para manipular tabelas e realizar cálculos complexos com facilidade.

Instalando Pandas

Para começar a trabalhar com pandas, primeiro precisamos instalá-lo. Se você já tem Python configurado em seu ambiente de trabalho, a instalação é simples. Abra o terminal ou prompt de comando e digite:

pip install pandas

Agora, com pandas instalado, podemos começar a explorar como pivotar tabelas.

Pivotando Tabelas com Pandas

Pivotar uma tabela em pandas é realizado através do método pivot_table. Este método é extremamente flexível e permite especificar índices, colunas e valores para a agregação dos dados.

Exemplo de Código

Vamos ver um exemplo de como pivotar uma tabela com pandas:

import pandas as pd

# Suponha que temos o seguinte DataFrame:
dados = {
    'Produto': ['Maçã', 'Banana', 'Maçã', 'Banana', 'Maçã', 'Banana'],
    'Vendas': [100, 150, 200, 220, 300, 350],
    'Ano': [2020, 2020, 2021, 2021, 2022, 2022]
}

df = pd.DataFrame(dados)

# Criando uma tabela dinâmica
tabela_dinamica = df.pivot_table(values='Vendas', index='Ano', columns='Produto', aggfunc='sum')
print(tabela_dinamica)
resultado do pivot_table

Parâmetros do Método pivot_table

  • values: A coluna que queremos resumir.
  • index: A coluna que queremos usar para criar um novo índice na tabela pivotada.
  • columns: As colunas que queremos usar para criar novas colunas na tabela pivotada.
  • aggfunc: A função de agregação a ser usada nos valores, como sum, mean, count, etc.

Conclusão

As tabelas dinâmicas em Python, com a ajuda da biblioteca pandas, oferecem uma maneira poderosa e flexível de analisar dados. Com a capacidade de pivotar tabelas, você pode transformar dados brutos em informações significativas, tudo isso com a facilidade e a potência da programação em Python. Se você está acostumado com o Excel e está dando seus primeiros passos em Python, verá que pandas é uma ferramenta indispensável para suas análises de dados.

Inscreva-se gratuitamente e fique atualizado

Receba toda semana um resumo dos principais conteúdos da Asimov direto no seu e-mail. 100% livre de spam.

Áreas de interesse: