Este projeto faz parte do curso Python para Data Science e Machine Learning da Udemy e tem como objetivo principal demonstrar o tratamento e análise de dados utilizando a biblioteca pandas.
O projeto utiliza um conjunto de dados de salários pagos para realizar operações comuns de Data Wrangling. As principais tarefas realizadas incluem:
- Leitura de dados a partir de arquivos CSV.
- Limpeza de dados ausentes ou inconsistentes.
- Filtragem e seleção de colunas relevantes.
- Agrupamento e resumo de informações.
- Transformações e cálculos sobre os dados.
- Preparação dos dados para análises futuras ou modelagem.
O pandas é a biblioteca central utilizada neste projeto, fornecendo estruturas de dados eficientes como DataFrame e Series, permitindo manipular, explorar e transformar os dados de forma rápida e intuitiva.
Siga os passos abaixo para rodar o projeto diretamente no VS Code:
-
Clonar o repositório (opcional):
git clone https://github.com/JsnEvt/DataFrames.git cd DataFrames
-
Abra o arquivo no VSCode: Pandas & DataFrames - Salaries.jpynb
Execute as células em ordem
Feito por Jason Everton 👋🏽 Entre em contato!