Skip to content

Mikaely-ADS/Analise-de-regressao-com-Python

Repository files navigation

Panorama Global de Salários em Data Science

📌 Sobre o Projeto

Este projeto tem como objetivo realizar uma análise exploratória de dados (EDA) sobre salários de profissionais da área de dados ao redor do mundo. A análise busca identificar padrões, tendências e fatores que influenciam a remuneração, como nível de experiência, cargo, localização e características das empresas.


🎯 Objetivos

  • Analisar a distribuição salarial de profissionais de dados
  • Identificar os cargos mais bem remunerados
  • Avaliar o impacto da experiência na remuneração
  • Comparar salários entre países
  • Investigar a influência do tamanho da empresa e modelo de trabalho

🛠️ Ferramentas Utilizadas

  • Python
  • Pandas
  • NumPy
  • Matplotlib
  • Seaborn
  • Jupyter Notebook

📂 Estrutura do Projeto

📦 data-salary-analysis
 ┣ 📂 data
 ┃ ┗ dataset.csv
 ┣ 📂 notebooks
 ┃ ┗ analise_exploratoria.ipynb
 ┣ 📂 images
 ┃ ┗ graficos.png
 ┗ README.md

🔍 Etapas da Análise

🔹 1. Importação e Exploração Inicial

  • Carregamento dos dados
  • Verificação de tipos e estrutura
  • Identificação de valores nulos

🔹 2. Limpeza e Tratamento de Dados

  • Remoção e tratamento de valores ausentes
  • Padronização de variáveis categóricas
  • Ajustes estruturais no dataset

🔹 3. Análise Exploratória (EDA)

  • Distribuição de salários
  • Análise por nível de experiência
  • Comparação entre cargos
  • Avaliação por país
  • Impacto do tamanho da empresa

🔹 4. Visualização de Dados

  • Gráficos de barras
  • Boxplots
  • Heatmap de correlação

📈 Principais Insights

  • Profissionais com maior nível de experiência apresentam salários significativamente mais elevados
  • Cargos especializados, como cientistas de dados e engenheiros de machine learning, tendem a possuir maior remuneração média
  • A localização geográfica influencia fortemente os salários, com determinados países apresentando maior concentração de renda
  • Empresas de maior porte tendem a oferecer salários mais competitivos
  • O modelo de trabalho (remoto/presencial) apresenta variações relevantes na distribuição salarial

⚠️ Tratamento de Dados

Durante a análise, foram identificadas inconsistências estruturais no dataset, como valores ausentes e possíveis problemas de formatação. Foram aplicadas técnicas de limpeza e padronização para garantir maior confiabilidade nas análises.


🚀 Próximos Passos

  • Desenvolvimento de dashboard interativo no Power BI
  • Aplicação de modelos estatísticos para análise mais aprofundada
  • Integração com outras fontes de dados

💼 Sobre o Projeto

Este projeto foi desenvolvido como parte de um desafio prático de análise de dados, com foco em aplicar conceitos de manipulação, análise e visualização de dados utilizando Python.


About

Análise de Regressão com Python

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors