Limpeza e Transformação de Dados com Pandas: preparando para IA

Aprenda como tratar valores nulos, corrigir erros e preparar dados com pandas para uso em IA, dashboards e automações

Compartilhe

Como Limpar e Preparar Dados com Pandas | Bootcamp Dia 20
This entry is parte 15 de 24 in the series Python + IA: Fundamentos e Projetos Práticos

Python + IA: Fundamentos e Projetos Práticos

Python para Iniciantes: Instalando o Ambiente, Sintaxe e Variáveis (Dia 1/30)

Ambiente, Sintaxe Básica e Variáveis em Python — Bootcamp Dia 1

Como Trabalhar com Listas no Python — Bootcamp Dia 6

Como Trabalhar com Listas no Python — Bootcamp Dia 6

Tuplas e Sets em Python — Estruturas Imutáveis e Conjuntos Inteligentes

Tuplas e Sets em Python — Estruturas Imutáveis e Conjuntos Inteligentes | Bootcamp Dia 7

Como Usar Dicionários em Python — Bootcamp Python + IA Dia 8

Dicionários em Python: chave e valor, o jeito inteligente de armazenar dados

Como Criar Funções em Python — Parâmetros, Retorno e Reutilização

Funções em Python: Escreva Menos, Faça Mais

Como Tratar Erros em Python com try, except e finally

Tratamento de Erros em Python: programe com segurança

Leitura e Escrita de Arquivos em Python

Leitura e Escrita de Arquivos em Python: salve seus dados no mundo real

Como Salvar Listas de Dicionários em Arquivo JSON com Python

Salvando Dados Estruturados com JSON em Python

Funções com Múltiplos Retornos em Python — Análise de Dados com Elegância

Funções com Múltiplos Retornos em Python: eficiência e organização

Parâmetros Opcionais e Valores Padrão em Python

Parâmetros Opcionais e Valores Padrão em Python

Como Usar args e kwargs em Funções Python

*args e **kwargs em Python: flexibilidade total nas funções

Como Usar List Comprehensions em Python

List Comprehensions em Python: código elegante e eficiente

Como Manipular Arquivos CSV com Python

Manipulando Arquivos CSV com Python: automatize leitura e escrita de dados

Como Usar Pandas em Python para Análise de Dados

Começando com Pandas em Python: análise de dados para IA e automações

Como Limpar e Preparar Dados com Pandas | Bootcamp Dia 20

Limpeza e Transformação de Dados com Pandas: preparando para IA

Como usar a OpenAI com Python (API Atualizada, GPT-3.5)

Inteligência Artificial com Python: Fundamentos e Primeira Integração com a OpenAI

Como Classificar Textos com IA e Python (Zero-Shot Classification)

Classificação de Texto com IA: Detectando Temas e Categorias

Como Criar Textos com Python e IA (NLP + GPT-2)

Geração de Texto com IA: Criando Respostas Inteligentes com Python

Como Criar um Chatbot com IA em Python (com DialoGPT)

Chatbot com IA em Python: Construindo um Assistente Inteligente

Como Detectar Fake News com Python e IA — Projeto Prático

Como Detectar Fake News com Python e IA

Como Criar uma Interface com IA em Python para Detectar Fake News

Como Criar uma Interface com IA em Python para Detectar Fake News

Como Avaliar a Qualidade de um Modelo de IA com Python

Como Avaliar a Qualidade de um Modelo de IA com Python — Além da Acurácia

Como Balancear Dados e Validar Modelos com Python e IA

Como Balancear Dados e Validar Modelos com Python e IA

Classificador de Fake News com Interface Web em Python (Streamlit)

Projeto Final: Criando um Classificador de Fake News com Interface Web em Python (Streamlit)

Não basta apenas carregar dados — é preciso prepará-los para uso real.

Hoje vamos aprender como corrigir, preencher e transformar dados com pandas, deixando tudo pronto para sistemas, dashboards ou modelos de IA.


🎯 O que você vai aprender

  • Identificar valores ausentes (NaN)
  • Preencher ou remover linhas inválidas
  • Alterar tipos de colunas
  • Renomear colunas para padrão
  • Aplicar transformação com .apply()

📂 Preparando o arquivo contatos.csv

Suponha que temos um arquivo assim:

Nome;Idade;E-mail
Asllan;41;[email protected]
Luiza;;[email protected]
Bella;5;[email protected]
João;abc;[email protected]

📦 Lendo e limpando os dados

import pandas as pd

# Leitura com separador ;
df = pd.read_csv("contatos.csv", sep=";")

# Renomear colunas
df.columns = ["nome", "idade", "email"]

# Substituir valores inválidos
df["idade"] = pd.to_numeric(df["idade"], errors="coerce")  # converte 'abc' em NaN

# Remover linhas com idade vazia
df = df.dropna(subset=["idade"])

# Converter idade para inteiro
df["idade"] = df["idade"].astype(int)

# Aplicar transformação
df["categoria"] = df["idade"].apply(lambda x: "adulto" if x >= 18 else "criança")

print(df)

📌 Desafio do Dia: Corrigir e classificar contatos

Você deve:

  1. Carregar o arquivo CSV com erros
  2. Corrigir dados ausentes e inválidos
  3. Classificar cada contato como “criança” ou “adulto” com base na idade
  4. Exibir os dados prontos para uso

🧠 O que você aplicou hoje?

  • Correção e padronização de dados
  • Transformações condicionais com .apply()
  • Prevenção de erros antes de usar os dados
  • Base para automações, IA e relatórios

💬 Dica profissional

Todo sistema com IA ou automação depende de dados limpos e estruturados.

Hoje você deu um passo simples, mas totalmente técnico e estratégico.

Python + IA: Fundamentos e Projetos Práticos

Começando com Pandas em Python: análise de dados para IA e automações Inteligência Artificial com Python: Fundamentos e Primeira Integração com a OpenAI