Este repositório contém códigos para resolver o problema de classificação de câncer de mama usando redes neurais. O conjunto de dados utilizado foi obtido do repositório de aprendizado de máquina da UCI. A solução é implementada em três scripts, cada um demonstrando uma abordagem diferente para resolver o problema.
Este script implementa uma rede neural simples usando a biblioteca Keras. Ele carrega o conjunto de dados, divide-o em conjuntos de treinamento e teste, constrói um modelo sequencial de rede neural com duas camadas ocultas e uma camada de saída, compila o modelo e o treina nos dados de treinamento. O script também avalia o modelo nos dados de teste, calcula a precisão e cria uma matriz de confusão para a avaliação de desempenho.
- Funções de perda: binary_crossentropy
- Função de ativação: relu (camadas ocultas), sigmoid (camada de saída)
Este script demonstra a validação cruzada para o modelo de rede neural. Utiliza a biblioteca scikeras para envolver o modelo Keras, permitindo seu uso com as ferramentas de validação cruzada do scikit-learn. O script define uma função para criar a arquitetura da rede neural, configura o KerasClassifier e realiza a validação cruzada com 10 folds, medindo a precisão.
- Funções de perda: binary_crossentropy
- Função de ativação: relu (camadas ocultas), sigmoid (camada de saída)
O terceiro script foca na sintonização de hiperparâmetros usando o GridSearchCV. Explora diferentes combinações de hiperparâmetros, como tamanho do lote, número de épocas, otimizador, função de perda, inicializador de kernel, função de ativação e número de neurônios. A melhor combinação de hiperparâmetros e a precisão correspondente são então determinadas.
O código foi desenvolvido no ambiente Anaconda com o Spyder como IDE.
O conjunto de dados utilizado é proveniente do Instituto de Oncologia e apareceu repetidamente na literatura de aprendizado de máquina. Ele consiste em 286 instâncias, com 201 pertencendo a uma classe e 85 a outra. Os atributos incluem dados lineares e nominais relacionados a características de câncer de mama.
Referência: UCI Breast Cancer Dataset
Este projeto foi desenvolvido como parte do curso "Deep Learning com Python de A a Z - O Curso Completo" da IA Expert Academy. O curso fornece uma compreensão abrangente de deep learning e python, e você pode encontrá-lo aqui.