Séries do Pandas: Um Guia para Iniciantes

Avatar de Ana Maria Gomes Ana Maria Gomes
3 minutos de leitura 5 meses atrás

Quando falamos em análise de dados com Python, uma das bibliotecas mais populares e poderosas é o Pandas. Imagine o Pandas como uma caixa de ferramentas cheia de recursos para lidar com tabelas de dados, semelhante às planilhas do Excel, mas com superpoderes. Dentro dessa caixa de ferramentas, um dos itens mais utilizados é a pd.Series, também conhecidas como as “Séries” do Pandas.

Neste tutorial, vamos explorar o que são as Séries do Pandas e como você pode manipulá-las para extrair informações valiosas dos seus dados.

O que é uma Série do Pandas?

Imagine uma coluna de uma tabela do Excel. Essa coluna contém uma lista de valores, que podem ser números, textos ou até mesmo datas. No Pandas, essa coluna é chamada de Série. Tecnicamente, uma Série é um array unidimensional capaz de armazenar qualquer tipo de dado e vem com um índice que nos ajuda a localizar esses dados rapidamente.

Exemplo de código de uma Série do Pandas.

Criando e Manipulando Séries do Pandas

Para começar a trabalhar com Séries, primeiro precisamos importar a biblioteca Pandas. Fazemos isso com o seguinte comando:

import pandas as pd

Agora, vamos criar nossa primeira Série:

# Criando uma Série a partir de uma lista
numeros = pd.Series([10, 20, 30, 40, 50])

Pronto! Agora temos uma Série chamada numeros que contém uma sequência de números de 10 a 50, pulando valores de 10 em 10.

Acessando Elementos

Para acessar os elementos de uma Série, você pode usar colchetes e passar o índice do elemento que deseja acessar. Por padrão, uma Série do Pandas possui índice numérico partindo de zero. Portanto, é possível acessar os elementos da mesma forma que uma lista:

# Acessando o primeiro elemento
print(numeros[0])

Métodos Úteis

As Séries do Pandas vêm com uma variedade de métodos que nos permitem realizar operações úteis. Aqui estão alguns dos mais comuns:

  • .unique(): Retorna os valores únicos da Série.
  • .value_counts(): Conta a frequência de cada valor único na Série.
  • .sum(): Soma todos os valores numéricos da Série.
  • .mean(): Calcula a média dos valores numéricos.
  • .std(): Calcula o desvio padrão dos valores numéricos.

Vamos ver alguns exemplos:

# Contando valores únicos de uma Série
cores = pd.Series(['azul', 'verde', 'azul', 'vermelho'])
print(cores.value_counts())

# Output:
# azul        2
# verde       1
# vermelho    1
# Name: count, dtype: int64


# Calculando a média de uma Série
numeros = pd.Series([10, 20, 30, 40, 50])
print(numeros.mean())

# Output:
# 30.0

Alterando a Série do Pandas

Mesmo depois de criarmos uma Série do pandas, podemos alterar seus valores ou até mesmo adicionar novos. Veja este exemplo:

# Alterando o valor do primeiro elemento
numeros[0] = 15

# Adicionando um novo elemento
numeros[5] = 60

print(numeros)
# Output:
# 0    10
# 1    20
# 2    30
# 3    40
# 4    50
# 5    60
# dtype: int64

Filtrando Dados

Suponha que você queira filtrar sua Série para encontrar apenas os números maiores que 30:

# Filtrando a Série
numeros_maiores_que_trinta = numeros[numeros > 30]

print(numeros_maiores_que_trinta)
# Output:
# 3    40
# 4    50
# 5    60
# dtype: int64

Conclusão

As Séries no Pandas são como colunas de uma tabela que você pode manipular, filtrar e calcular de forma rápida e eficiente. Elas são uma parte fundamental da análise de dados em Python e, com a prática, você descobrirá que são ferramentas extremamente versáteis e poderosas. Experimente criar suas próprias Séries e veja o que você pode descobrir sobre seus dados!

Curso Gratuito

Curso gratuito de Python

Do zero ao primeiro projeto em apenas 2 horas

Criar conta gratuita

Comentários

Comentar
Faça parte da discussão Crie sua conta gratuita e compartilhe
sua opinião nos comentários
Entre para a Asimov