Please use this identifier to cite or link to this item:
https://rinacional.tecnm.mx/jspui/handle/TecNM/4155
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Lopez Perez, Ricardo Gudiel%857530 | - |
dc.creator | Lopez Perez, Ricardo Gudiel%857530 | - |
dc.date.accessioned | 2022-07-08T19:35:54Z | - |
dc.date.available | 2022-07-08T19:35:54Z | - |
dc.date.issued | 2020-02-06 | - |
dc.identifier.uri | https://rinacional.tecnm.mx/jspui/handle/TecNM/4155 | - |
dc.description | En esta investigación se aborda el problema de seleccionar los lenguajes de programación más apropiados para el desarrollo de aplicaciones en Ciencia de Datos. Esto es un problema debido a que en la actualidad existen muchos lenguajes de programación utilizados en varios ámbitos y en distintas aplicaciones, por ello, es necesario identificar los lenguajes que tengan las características más favorables que permitan el desarrollo de aplicaciones en el área de Ciencia de Datos. Para resolver esta problemática, se siguió un enfoque de solución que se desarrolló en cuatro etapas. En la primera, se seleccionaron dentro de un conjunto de lenguajes de programación, los más utilizados en esta área de conocimiento. En la segunda etapa, se caracterizaron los lenguajes elegidos, los cuales fueron Python y R, en esta etapa, se conocieron los rasgos distintivos de cada lenguaje. En la tercera etapa, se estudiaron de manera teórica y práctica. En la última etapa, se desarrolló un conjunto de casos de prueba para comparar los resultados de la función K-means, que se trata de un algoritmo utilizado en la técnica del agrupamiento de datos, asimismo, este último es utilizado en el ámbito de Ciencia de Datos. Al experimentar con 10 bases de datos y 30 muestras tomadas de una de las bases de datos llamada 3D_spatial_network se observó que R presentó un promedio en tiempo de ejecución 1.373487697 segundos y Python 1.737771034 segundos, lo que muestra que R en esta experimentación resultó 1.26 veces más veloz que Python, R mostró una tendencia de ser más veloz que Python, esto se observó debido a que en 38 ejecuciones de 40, obtuvo ventaja en velocidad. En calidad de agrupamiento, para esta experimentación, Python logró en 18 ocasiones mejor calidad y R en 22 ocasiones. En promedio Python obtuvo una pérdida de calidad de 0.208982961 % y R 1.124429758 %. Dos conclusiones relevantes son las siguientes: el lenguaje Python cuenta con una representación de resultados numéricos más precisos que R. Ambos lenguajes tienen funciones para importar archivos de datos de cualquier tamaño, siendo su limitante el tamaño de la memoria virtual del sistema operativo. | es_MX |
dc.language.iso | spa | es_MX |
dc.publisher | Tecnológico Nacional de México | es_MX |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | es_MX |
dc.subject | info:eu-repo/classification/cti/7 | es_MX |
dc.title | Análisis comparativo de lenguajes de programación para el desarrollo de aplicaciones en Ciencia de Datos | es_MX |
dc.type | info:eu-repo/semantics/masterThesis | es_MX |
dc.contributor.director | Perez Ortega, Joaquin%7939 | - |
dc.folio | 20-0140 | es_MX |
dc.rights.access | info:eu-repo/semantics/openAccess | es_MX |
dc.publisher.tecnm | Centro Nacional de Investigación y Desarrollo Tecnológico | es_MX |
Appears in Collections: | Tesis de Maestría en Computación |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdf | Tesis | 1.72 MB | Adobe PDF | View/Open |
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdf Restricted Access | Cesión de derechos | 96.89 kB | Adobe PDF | View/Open Request a copy |
This item is protected by original copyright |
This item is licensed under a Creative Commons License