Este projeto tem como objetivo realizar uma análise exploratória de dados (EDA) sobre salários de profissionais da área de dados ao redor do mundo. A análise busca identificar padrões, tendências e fatores que influenciam a remuneração, como nível de experiência, cargo, localização e características das empresas.
- Analisar a distribuição salarial de profissionais de dados
- Identificar os cargos mais bem remunerados
- Avaliar o impacto da experiência na remuneração
- Comparar salários entre países
- Investigar a influência do tamanho da empresa e modelo de trabalho
- Python
- Pandas
- NumPy
- Matplotlib
- Seaborn
- Jupyter Notebook
📦 data-salary-analysis
┣ 📂 data
┃ ┗ dataset.csv
┣ 📂 notebooks
┃ ┗ analise_exploratoria.ipynb
┣ 📂 images
┃ ┗ graficos.png
┗ README.md
- Carregamento dos dados
- Verificação de tipos e estrutura
- Identificação de valores nulos
- Remoção e tratamento de valores ausentes
- Padronização de variáveis categóricas
- Ajustes estruturais no dataset
- Distribuição de salários
- Análise por nível de experiência
- Comparação entre cargos
- Avaliação por país
- Impacto do tamanho da empresa
- Gráficos de barras
- Boxplots
- Heatmap de correlação
- Profissionais com maior nível de experiência apresentam salários significativamente mais elevados
- Cargos especializados, como cientistas de dados e engenheiros de machine learning, tendem a possuir maior remuneração média
- A localização geográfica influencia fortemente os salários, com determinados países apresentando maior concentração de renda
- Empresas de maior porte tendem a oferecer salários mais competitivos
- O modelo de trabalho (remoto/presencial) apresenta variações relevantes na distribuição salarial
Durante a análise, foram identificadas inconsistências estruturais no dataset, como valores ausentes e possíveis problemas de formatação. Foram aplicadas técnicas de limpeza e padronização para garantir maior confiabilidade nas análises.
- Desenvolvimento de dashboard interativo no Power BI
- Aplicação de modelos estatísticos para análise mais aprofundada
- Integração com outras fontes de dados
Este projeto foi desenvolvido como parte de um desafio prático de análise de dados, com foco em aplicar conceitos de manipulação, análise e visualização de dados utilizando Python.