Como Criar um Histograma em Python

Ana Maria Gomes
6 minutos de leitura

Conteúdos do tutorial

Os histogramas são uma ferramenta fundamental na análise de dados. Neste tutorial, vamos aprender a criar um histograma em Python. Você aprenderá o que são histogramas, como interpretá-los e como usar Python para criá-los e configurá-los de forma simples.

O que é um Histograma?

Um histograma é um tipo de gráfico que permite visualizar a distribuição de um conjunto de dados numéricos. Ele é construído agrupando os valores em “caçapas” ou intervalos (os chamados bins) e, em seguida, contando quantos valores caem em cada intervalo. As contagens são representadas por barras, onde a altura de cada barra indica a frequência dos dados dentro do intervalo.

Interpretando Histogramas

Interpretar um histograma é relativamente simples. Aqui estão alguns pontos para se prestar atenção:

  • Picos: Os picos em um histograma indicam onde os dados são mais frequentes.
  • Simetria: Um histograma simétrico sugere que os dados estão distribuídos uniformemente em torno de um valor central.
  • Assimetria: Se o histograma estiver inclinado para a esquerda ou direita, isso indica assimetria nos dados, o que pode sugerir a presença de outliers ou uma tendência nos dados.
  • Largura dos bins: A largura dos bins pode afetar a aparência do histograma. Bins mais estreitos podem revelar mais detalhes sobre a distribuição dos dados, enquanto bins mais largos podem simplificar a visualização.

Veja estes elementos no histograma abaixo (que ilustra as notas de uma prova qualquer):

O pico no valor 7 do histograma indica que esta nota foi a mais frequente da turma. O histograma parece ser simétrico, com muitos alunos tirando notas 6 e 7, e poucos alunos nas notas mais baixas ou mais altas. Note ainda que, graças à estrutura do histograma, valores próximos acabam agrupados em um mesmo bin: alunos que tiraram nota 6,9 ou 7,2 ambos ficam posicionados no bin de valor 7.

Criando Histogramas com Python

Python, com a ajuda da biblioteca Matplotlib, torna a criação de histogramas um processo bastante simples. Se você ainda não tem o Matplotlib instalado, você pode instalá-lo usando o pip (o gerenciador de arquivos de Python):

pip install matplotlib

Em seguida, importe a biblioteca em seu script Python:

import matplotlib.pyplot as plt

Preparando os Dados

Para este exemplo, vamos criar um conjunto de dados aleatórios usando a biblioteca NumPy:

import numpy as np

# Gerando dados aleatórios
dados = np.random.randn(1000)

Criando o Histograma

Agora, com os dados prontos, podemos criar o histograma:

plt.hist(dados, bins=30, alpha=0.5, color='blue', edgecolor='black')

# Exibindo o gráfico
plt.show()

Eis o resultado (o seu gráfico pode ficar diferente, em função do componente aleatório do NumPy):

Neste código, bins=30 define o número de intervalos que queremos em nosso histograma. A partir desse valor, o Matplotlib define automaticamente os pontos de corte de cada bin no nosso histograma. O parâmetro alpha controla a transparência das barras, e color e edgecolor definem as cores das barras e das bordas, respectivamente.

Passo 4: Personalizando o Histograma

Você pode personalizar ainda mais o histograma ajustando os bins, as cores e adicionando mais elementos ao gráfico, como linhas de grade, rótulos nos eixos, e título na figura:

# Ajustando os bins para 50
plt.hist(dados, bins=50, alpha=0.7, color='green', edgecolor='black')

# Adicionando grade ao fundo do gráfico
plt.grid(True)

# Escrevendo rótulos dos eixos
plt.xlabel('Valores')
plt.ylabel('Frequência')

# Escrevendo título na figura
plt.title('Histograma Personalizado')

# Exibindo o gráfico
plt.show()

Conclusão

Histogramas são uma ferramenta poderosa para entender a distribuição dos seus dados. Com Python e Matplotlib, você pode criar rapidamente histogramas e personalizá-los para se adequar às suas necessidades analíticas. Lembre-se de que a interpretação correta de um histograma pode fornecer insights valiosos sobre a natureza dos seus dados, ajudando você a tomar decisões informadas com base em suas análises.

Inscreva-se gratuitamente e fique atualizado

Receba toda semana um resumo dos principais conteúdos da Asimov direto no seu e-mail. 100% livre de spam.

Áreas de interesse: