Começaremos pelo básico, aprendendo a ler e carregar os dados em Python. A partir daí, exploraremos cada aspecto da tabela de dados, entendendo suas colunas, tipos de dados e estrutura. Você dominará a identificação de valores ausentes e como lidar com eles, garantindo que seus dados estejam prontos para análise.
Em seguida, nos aprofundaremos nas técnicas para explorar os valores numéricos do conjunto de dados. Usaremos boxplots para identificar outliers, compreender a distribuição dos dados e detectar possíveis discrepâncias. Com histogramas, violinos e outras visualizações, você irá investigar a distribuição dos valores e entender suas características.
Além dos valores numéricos, também exploraremos os valores categóricos do conjunto de dados. Veremos como criar gráficos de barras para comparar diferentes categorias e analisar sua distribuição. Descobriremos como medir a normalidade e outras métricas de dispersão para entender a variabilidade dos dados e sua relevância para a análise. Também abordaremos os conceitos de correlação e regressão linear, tanto do ponto de vista gráfico quanto estatístico.
Comece agora e desbloqueie todo o potencial dos seus conjuntos de dados!