Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
Date
2023Metadata
Show full item recordAbstract
El objetivo de la investigación fue comparar la eficiencia diagnóstica del
cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural
Networks - Redes Neuronales Convolucionales), RF (Random Forest -
Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz
de confusión del sistema para comparar y plasmar los resultados de la
sensibilidad, la especificidad, la precisión, la exactitud, el tiempo de
entrenamiento y el tiempo de diagnóstico de cáncer de mama de los
algoritmos mencionados.
Se consideró un total de 7632 imágenes mamográficas entre
benignos (2520) y malignos (5112) para el diagnóstico de la enfermedad. La
investigación fue de tipo aplicada, con un enfoque cuantitativo y diseño no
experimental y tipo de diseño transversal descriptivo. Se usaron librerías
gratuitas tales como Django, Keras, Tensorflow, OpenCV-Python, entre
otras, para el desarrollo de lenguaje de programación Python. Además, se
usó los criterios de inclusión y exclusión en la investigación para diferenciar
qué imágenes no están incluidas y cuáles sí están incluidas para la
población. Se utilizó el tipo y la cantidad de imágenes mamográficas para
precisar la fuente (Data Science Kaggle) tipo (benigno y maligno), muestreo,
el tiempo de identificación y tiempo de entrenamiento.
Los resultados de la comparación indicaron que NB tuvo una
repercusión positiva en la sensibilidad y precisión, debido a que estos
indicadores fueron mayores a los obtenidos por los algoritmos CNN y RF;
asimismo, NB tuvo menor tiempo de entrenamiento e identificación. La
especificidad y la exactitudno fueron mayores a los resultados obtenidos por
el algoritmo RF, pero fueron mayores a lo obtenido por el algoritmo CNN. Se
recomendó emplear el algoritmo regresión logística, con la finalidad de
manejar datos de alta dimensionalidad, lo cual permite identificar
características relevantes, manejar datos no lineales y capturar relaciones
complejas en los datos para una investigación a futuro.
Collections
- Lima Este [973]