Esse Projeto visa mostrar relações existentes em um Dataset com informações de quase 4000 filmes, para gerar insights e facilitar a tomada de decisões por profissionais da indústria cinematográfica.
Os dados utilizados nessa análise podem ser encontrados em: https://www.kaggle.com/datasets/delfinaoliva/movies.
Enzo Martins: https://github.com/Enzo-Martins-dev
Fábio Monteiro: https://github.com/Fabio-Mnte
- Python: linguagem de programação base.
- Pandas: visualizar e manipular os dados de forma mais eficaz.
- Matplotlib: criação de gráficos para auxiliar na visualização.
- Seaborn: gerar gráficos de mais fácil visualização e entendimento.
- Streamlit: mostrar todas as informações visuais em um ambiente mais agradável e fazer deploy para acesso remoto.
- Exploração: conhecer o Dataset, suas tabelas, tamanho, valores inconsistentes e/ou faltantes. Alguns gráficos foram gerados no processo, com o único intuito de entender os dados, e não de mostrar para os usuários.
- Tratamento: Tratar os valores inconsistentes encontrados na etapa anterior e gerar um dataset novo, tratado, para ser utilizado na última etapa.
- Visualização: mostrar os dados ao usuário, através de gráficos interativos, onde o usuário pode utilizar os filtros disponibilizados para que os gráficos considerem apenas os dados que obedeçam às condições especificadas.