Mostrar el registro sencillo del ítem

dc.contributor.advisorDaza Vergaray, Alfredo
dc.contributor.authorChira Bohorquez, Piero Alejandro
dc.contributor.authorRivera Munive, Kevin
dc.date.accessioned2024-02-21T15:17:03Z
dc.date.available2024-02-21T15:17:03Z
dc.date.issued2023
dc.identifier.urihttps://hdl.handle.net/20.500.12692/133747
dc.description.abstractEn siguiente trabajo se realizó con el objeto de aplicar un análisis comparativo de técnicas de Machine Learning sobre el método de muestreo para la predicción de la diabetes. Para esto, se realizó una investigación usando un método de enfoque cuantitativo, aplicado a los datos de un repositorio de base de datos de Kaggle de medición de factores de diabetes en mujeres de al menos 21 años de herencia indígena Pima, la misma que consta de 768 ítems, las mismas que han sido considerados como población para posteriormente ser usada como muestra. Asimismo, el estudio es de tipo aplicada, con un diseño de investigación experimental de tipo pre-experimental de un solo grupo, ya que luego de aplicar las técnicas de Machine Learning a través de métricas como rendimiento; exactitud, precisión, especificidad, sensibilidad y F1 Score, se podrá verificar los resultados y realizar la medición. Para ello, se consideró aplicar la metodología Knowledge Discovery in Databases (KDD), la misma que está divida de 5 etapas, la primera comienza con la selección de datos, la segunda y tercera etapa, con el preprocesamiento y transformación de los datos, en la cuarta etapa se efectúa la minería de datos, aplicado a la presente investigación, haciendo el entrenamiento en 6 algoritmos de aprendizaje automático Árbol de decisiones (DT), Random Forest (RF), máquina de vectores de soporte (SVM), Gradient Boosting Machine (GBM), K-vecino más cercano (K-NN) y Redes Neuronales (ANN), basando los resultado en los mejores hiperparámetros y por último en la quinta etapa, se diseñó un software para apoyar en la detección de la diabetes en función a 5 métricas, obteniendo los resultados en base a 6 algoritmos. Como resultado se obtuvo que el modelo Random Forest (RF), Gradient Boosting Machine (GBM) y Árbol de Decisiones (DT) superaron a los demás modelos, el modelo Random Forest obtuvo un 79,22%, en cuanto a la métrica exactitud, mientras que el modelo GMB obtuvo un 75,32%, de exactitud, del mismo modo el árbol de decisiones (DT) obtuvo un 74.09% en cuanto a la precisión. Por otro lado, el KNN, ANN y SVM fueron los modelos de menor rendimiento en la mayoría de las cinco métricas, KNN con un 74.02%, ANN con un 63.63 % y SVM con un 73.10% de exactitud. Finalmente, en función a los resultados obtenidos por las métricas evaluadas se puede afirmar que el uso de Técnicas de Machine Learning para la predicción de la diabetes, son favorables para el sector salud.es_PE
dc.formatapplication/pdfes_PE
dc.language.isospaes_PE
dc.publisherUniversidad César Vallejoes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/es_PE
dc.sourceRepositorio Institucional - UCVes_PE
dc.sourceUniversidad César Vallejoes_PE
dc.subjectMachine learninges_PE
dc.subjectMétricas de precisiónes_PE
dc.subjectDiabeteses_PE
dc.titleAnálisis comparativo de técnicas de machine learning sobre el método de muestreo para la predicción de diabeteses_PE
dc.typeinfo:eu-repo/semantics/bachelorThesises_PE
thesis.degree.disciplineIngeniería de Sistemases_PE
thesis.degree.grantorUniversidad César Vallejo. Facultad de Ingeniería y Arquitecturaes_PE
thesis.degree.nameIngeniero de Sistemases_PE
dc.description.sedeLima Nortees_PE
dc.description.escuelaEscuela de Ingeniería de Sistemases_PE
dc.description.lineadeinvestigacionSistema de Información y Comunicacioneses_PE
renati.advisor.dni40466240
renati.advisor.orcidhttps://orcid.org/0000-0002-2259-1070es_PE
renati.author.dni43976691
renati.author.dni47977218
renati.discipline612076es_PE
renati.jurorEstrada Aro, Willabaldo Marcelino
renati.jurorPerez Huaman, Omar
renati.jurorDaza Vergaray, Alfredo
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesionales_PE
renati.typehttps://purl.org/pe-repo/renati/type#tesises_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.02.04es_PE
dc.publisher.countryPEes_PE
dc.description.ligTecnologías de la información y comunicaciónes_PE
dc.description.rsuDesarrollo económico, empleo y emprendimientoes_PE
dc.description.odsTrabajo decente y crecimiento económicoes_PE


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(es)

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess
Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess