Skip to content

LilianeAquino/projeto_ML_coders_2023

Repository files navigation

Projeto Turma 1006 - Machine Learning I

Descrição do Trabalho:

O objetivo deste projeto é aplicar técnicas de Machine Learning para determinar se o sujeito vai ter ou não avc a partir de uma base de dados fornecida. O conjunto de dados utilizado para este projeto é "Stroke Prediction Dataset", disponível no Kaggle: https://www.kaggle.com/competitions/playground-series-s3e2/data?select=train.csv.

Análise do Dataset:

  • Exploração inicial do conjunto de dados para entender suas características.
  • Identificação das variáveis relevantes para o problema de determinar o "Stroke".
  • Tratamento de dados ausentes ou inconsistentes, se necessário.

Escolha dos Algoritmos:

  • É necessário escolher no mínimo três algoritmos para aplicar ao problema de predição de AVC.
  • Alguns exemplos de algoritmos que podem ser escolhidos: Árvore de Decisão, Random Forest, KNN, MLP, Regressão Linear ou Regressão Logística.
  • Deve haver justificativa para a escolha do(s) algoritmo(s) com base na adequação dos algoritmos para o problema em questão.

Amostragem de Dados:

  • Qualquer técnica de amostragem de dados pode ser utilizada para preparar o conjunto de treinamento e teste.
  • Exemplos de técnicas de amostragem incluem divisão aleatória, validação cruzada, bootstrap ou leave-one-out.
  • A escolha da técnica de amostragem deve ser explicada e justificada.

Implementação:

  • A implementação do projeto deve ser feita utilizando a linguagem de programação Python.
  • O pacote obrigatório a ser utilizado é o scikit-learn (sklearn), que oferece uma ampla variedade de algoritmos de Machine Learning.
  • Os demais pacotes utilizados ficam a critério dos alunos, podendo escolher livremente.
  • O ambiente de execução do script python pode ser escolhido livremente (Google Colab, Jupyter Notebook, local...)

Avaliação e Comparação dos Modelos:

  • Deve haver treinamento e teste para os modelos escolhidos utilizando os dados amostrados.
  • Os modelos devem ser avaliados com base em métricas adequadas para problemas de classificação, como acurácia, precisão, recall e F1-score.
  • Os resultados dos modelos devem ser comparados e discutidos, identificando qual apresenta o melhor desempenho na tarefa de determinar a classe.

Apresentação dos Resultados:

  • Os alunos devem preparar uma apresentação final (podem escolher livremente como fazê-la) que inclua uma descrição do projeto, as etapas realizadas, os algoritmos escolhidos, os resultados obtidos e as conclusões alcançadas.
  • É importante destacar os desafios encontrados durante o projeto e possíveis melhorias ou próximos passos que podem ser realizados.

About

Projeto prático do módulo: Machine Learning I

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published