Renomear Nomes de Colunas no Pandas

Ana Maria Gomes
5 minutos de leitura

Conteúdos do tutorial

Ao trabalhar com dados em Python, a biblioteca Pandas é uma ferramenta poderosa para manipulação e análise de dados. Uma tarefa comum que você pode encontrar é a necessidade de renomear rótulos de colunas em um DataFrame. Seja quando preparamos dados para análise ou simplesmente organizamos nosso conjunto de dados para melhor legibilidade, renomear colunas é um processo comum no Pandas. Neste post, exploraremos vários métodos para renomear nomes de colunas de forma eficaz.

Renomear Colunas Específicas com rename()

A função rename() no Pandas é versátil e permite que você renomeie colunas específicas com facilidade. Você não precisa renomear todas as colunas; pode escolher quais deseja atualizar. Veja como você pode usá-la:

import pandas as pd

# Criar um DataFrame
df = pd.DataFrame({'$a':[1,2], '$b': [10,20]})

# Renomear colunas usando a função rename()
df = df.rename(columns={'$a': 'a', '$b': 'b'})

Alternativamente, se você quiser modificar o DataFrame existente sem criar um novo, você pode usar o parâmetro inplace=True:

df.rename(columns={'$a': 'a', '$b': 'b'}, inplace=True)

Reatribuir Cabeçalhos de Colunas Diretamente

Se você está procurando renomear todas as colunas de uma só vez, você pode atribuir diretamente uma nova lista de nomes de colunas ao atributo .columns do DataFrame:

# Atribuir novos cabeçalhos de colunas diretamente
df.columns = ['a', 'b', 'c', 'd', 'e']

Este método é muito direto e é particularmente útil quando você tem um novo conjunto de nomes de colunas pronto para substituir os antigos.

Use set_axis() para Renomear Colunas

Outro método para renomear colunas é usando a função set_axis() com axis=1:

# Usar set_axis() para renomear colunas
df.set_axis(['a', 'b', 'c', 'd', 'e'], axis=1, inplace=True)

Este método é semelhante a atribuir diretamente a .columns, mas oferece funcionalidades adicionais, como a capacidade de especificar se a operação deve ser feita no local.

Aplicar uma Função para Renomear Colunas

Para operações de renomeação mais complexas, você pode aplicar uma função aos nomes das colunas. Isso é particularmente útil quando você quer fazer alterações em cada nome de coluna seguindo um certo padrão:

# Renomear colunas aplicando uma função
df.rename(columns=lambda x: x.strip('$'), inplace=True)

Neste exemplo, estamos usando uma função lambda para remover o sinal de dólar de cada nome de coluna. Este método oferece a flexibilidade para realizar várias transformações nos nomes das colunas.

Resumo

Renomear colunas em um DataFrame do Pandas é uma tarefa comum que podemos realizar de várias maneiras. Você pode usar a função rename() para atualizar colunas específicas, atribuir diretamente uma nova lista de nomes de colunas, usar set_axis() para um efeito semelhante ou aplicar uma função para transformar os nomes das colunas de acordo com um padrão. Cada método tem seus casos de uso, e saber como usá-los tornará suas tarefas de preparação de dados muito mais fáceis.

Lembre-se de sempre verificar seu DataFrame após renomear colunas para garantir que as alterações foram aplicadas conforme o esperado. Com essas técnicas no seu conjunto de ferramentas, você será capaz de lidar com a renomeação de colunas com facilidade e confiança.

Inscreva-se gratuitamente e fique atualizado

Receba toda semana um resumo dos principais conteúdos da Asimov direto no seu e-mail. 100% livre de spam.

Áreas de interesse: