SQL a Shell Unix (Bash, etc)

Muchas veces se necesitan hacer operaciones de datos con archivos de texto, y suele ser complicado, hay que subir los archivos nuevamente a la base de datos, etc. Utilizando esta guia y con un poco de conocimiento de SQL, vas a poder hacer "magia". Consideremos el siguiente archivo de prueba

SELECT * FROM cat $archivoContinue reading SQL a Shell Unix (Bash, etc)

Limpieza de texto utilizando Python

Como buen científico de datos, es muy común tenes proyectos e historias donde tengas que analizar grandes cantidades de texto. A veces te puede suceder que tengas que analizar texto escrito por los operadores de atención al público, o quizá analizar publicaciones de redes sociales. Las ventajas y posibilidades que te abre minar el texto … Continue reading Limpieza de texto utilizando Python

Scrapping de Mercadolibre con Python utilizando su API pública

En el trabajo hace unos días nos surgió la necesidad de presentar en un mapa cierto tipo de publicaciones, ya que uno de nuestros equipos estaba buscando locales para expandirnos. Así es cómo me encomendaron la tarea de obtener información de varios sitios y dejarlos disponibles en nuestro software de mapeo. Hoy vamos a ver … Continue reading Scrapping de Mercadolibre con Python utilizando su API pública

La evolución del Datawarehouse, ETL vs ELT

Una de las definiciones más conocidas del datawarehouse incluye tres componentes claves: ETL (Extracción Transformacion y Loading/Carga) Reportería Minería Durante años la forma tradicional de realizar la ingesta de datos al warehouse fue el proceso de ETL. Pero en los últimos años con la llegada del "Big Data" de la mano de herramientas como Hadoop, … Continue reading La evolución del Datawarehouse, ETL vs ELT