Ver el Mapa de Ciencia de Datos

Analisis de Market Basket utilizando R
Hay varias formas de ver las similitudes entre elementos. Estas son tecnicas que caen dentro del paraguas de asociacion. El resultado de este tipo de tecnicas, en terminos simples, es un conjunto de reglas que se pueden entender como “si esto, entonces aquello”.
SQL a Shell Unix (Bash, etc)
Muchas veces se necesitan hacer operaciones de datos con archivos de texto, y suele ser complicado, hay que subir los archivos nuevamente a la base de datos, etc. Utilizando esta guia y con un poco de conocimiento de SQL, vas a poder hacer “magia”. Consideremos el siguiente archivo de prueba
1 2 3 4 5 6 |
/tmp/prueba.txt 1|Valor11|Valor21|Campo33 2|Valor12|Valor22|Campo32 3|Valor12|Valor21|Campo33 4|Valor13|Valor21|Campo32 5|Valor11|Valor23|Campo31 |
SELECT * FROM cat $archivo … Continue reading SQL a Shell Unix (Bash, etc)
Limpieza de texto utilizando Python
Como buen científico de datos, es muy común tenes proyectos e historias donde tengas que analizar grandes cantidades de texto. A veces te puede suceder que tengas que analizar texto escrito por los operadores de atención al público, o quizá analizar publicaciones de redes sociales. Las ventajas y posibilidades que te abre minar el texto … Continue reading Limpieza de texto utilizando Python
Scrapping de Mercadolibre con Python utilizando su API pública
En el trabajo hace unos días nos surgió la necesidad de presentar en un mapa cierto tipo de publicaciones, ya que uno de nuestros equipos estaba buscando locales para expandirnos. Así es cómo me encomendaron la tarea de obtener información de varios sitios y dejarlos disponibles en nuestro software de mapeo. Hoy vamos a ver … Continue reading Scrapping de Mercadolibre con Python utilizando su API pública
La evolución del Datawarehouse, ETL vs ELT
Una de las definiciones más conocidas del datawarehouse incluye tres componentes claves: ETL (Extracción Transformacion y Loading/Carga) Reportería Minería Durante años la forma tradicional de realizar la ingesta de datos al warehouse fue el proceso de ETL. Pero en los últimos años con la llegada del “Big Data” de la mano de herramientas como Hadoop, … Continue reading La evolución del Datawarehouse, ETL vs ELT