Mejora del algoritmo de agrupamiento Fuzzy C-Means

Roblero Aguilar, Sandra Silvia%553549

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Morelos

Centro Nacional de Investigación y Desarrollo Tecnológico

Tesis CENIDET "O"

Tesis Doctorado "O"

Tesis de Doctorado en Computación "O"

Por favor, use este identificador para citar o enlazar este ítem: https://rinacional.tecnm.mx/jspui/handle/TecNM/5749

Título :	Mejora del algoritmo de agrupamiento Fuzzy C-Means
Autor :	Roblero Aguilar, Sandra Silvia%553549
Fecha de publicación :	2023-05-29
Editorial :	Tecnológico Nacional de México
metadata.dc.publisher.tecnm:	Centro Nacional de Investigación y Desarrollo Tecnológico
Descripción :	La presente investigación, se ubica en el contexto de los problemas relacionados con las mejoras de los algoritmos de agrupamiento o clustering. En particular, el problema que se aborda consiste en reducir el tiempo de procesamiento del algoritmo de agrupamiento Fuzzy C-Means (FCM) para la solución de grandes datasets. El enfoque de solución, consistió en mejorar la fase de inicialización de FCM mediante la optimización de la matriz de pertenencia inicial. A este nuevo algoritmo se le denominó Hybrid OK-Means Fuzzy C-Means (HOFCM). El problema de agrupamiento de FCM es del tipo NP-Hard, lo cual justifica el uso de métodos heurísticos para su solución. A la fecha, se han propuesto mejoras en la etapa de inicialización del algoritmo FCM. Sin embargo, no están orientadas a la solución de grandes datasets como las que se presentan en el Big Data. En este sentido, el algoritmo propuesto reduce el número de iteraciones al optimizar los valores iniciales de la matriz de pertenencia. Este enfoque consta de tres pasos: a) generar un conjunto de n soluciones de un dataset dado, aplicando una variante del algoritmo KMeans; b) seleccionar la mejor solución como base para generar la matriz de pertenencia optimizada y c) resolver el dataset dado con FCM. Para validar los resultados del algoritmo HOFCM, se diseñaron y ejecutaron un conjunto de experimentos compuestos de datasets reales y sintéticos. HOFCM se contrastó con los algoritmos: FCM estándar, FCM-KMeans, FCM++ y NFCM. Con base en los resultados experimentales, se observó que HOFCM obtuvo una reducción en el tiempo de solución en todos los datasets grandes, comparado con el algoritmo FCM estándar. Al contrastar los resultados de HOFCM con los algoritmos FCM-KMeans, FCM++ y NFCM, se observó que, en promedio, fue más rápido 1.51, 2.87 y 3.01 veces respectivamente. Finalmente, con base en los resultados obtenidos, es posible afirmar que, con esta investigación, se aportaron beneficios para usuarios que buscan resolver el problema de agrupamiento difuso de grandes datasets, como los que se presentan en Big Data en tiempo razonable.
metadata.dc.type:	info:eu-repo/semantics/doctoralThesis
Aparece en las colecciones:	Tesis de Doctorado en Computación "O"

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
DCC_Sandra_Silvia_Robledo_Aguilar_2023.pdf	Tesis	1.79 MB	Adobe PDF	Visualizar/Abrir
DCC_Sandra_Silvia_Roblero_Aguilar_2023_c.pdf Restricted Access	Cesión de Derechos	243.92 kB	Adobe PDF	Visualizar/Abrir Request a copy

Este ítem está protegido por copyright original

Visualizar la licencia

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM) Tesis de Posgrado Morelos Centro Nacional de Investigación y Desarrollo Tecnológico Tesis CENIDET "O" Tesis Doctorado "O" Tesis de Doctorado en Computación "O"

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Morelos

Centro Nacional de Investigación y Desarrollo Tecnológico

Tesis CENIDET "O"

Tesis Doctorado "O"

Tesis de Doctorado en Computación "O"