Curso Online

Especialista en Datawarehouse y ETL

Aprendé a implementar almacenes de datos y procedimientos ETL para la optimización de información.

Ir al temarioInscripción
CAPTCHA
consultanos

Las organizaciones son cada vez más dependientes del inteligente uso de sus datos para la toma de decisiones. Esos datos para ser útiles deben estar almacenados en una plataforma que sea compatible con múltiples consultas concurrentes de gran complejidad y que no traben la operación normal. A estas plataformas se las conoce como "almacenes de datos" o Al mismo tiempo es preciso que esta información esté libre de errores y deformaciones que se producen al cargar los datos en las aplicaciones transaccionales y que podrían arruinar el esfuerzo analítico que se busca construir sobre ellos. Estos conjuntos de datos deben también actualizarse en forma periódica para ir incorporando la nueva información que generan las aplicaciones transaccionales que soportan la operación. Los procedimientos que se encargan de esa actualización se llaman ETL (Las siglas de extracción, transformación y carga) Tanto el diseño del almacén de datos como de los ETL requieren de técnicas de optimización que, de no aplicarse, atascos, inconsistencias. En este curso les proporcionamos a los participantes conocimientos y herramientas para implementar almacenes de datos y realizar los procesos de limpieza y carga correspondientes.

 

Objetivo general 

Formar a los participantes en el diseño e implementación de almacenes de datos y los procesos de limpieza y carga correspondientes.

 

Objetivos específicos

- Desarrollar criterios de diseño para un DW y practicar la construcción de distintos tipos de repositorios.

- Elegir la estrategia de ETL conveniente para una carga inicial y para una actualización.

- Utilizar Pentaho como herramienta de ETL y tomar conciencia de fortalezas y debilidades de Pentaho.

- Entender el problema de negocios que un almacén de datos viene a solucionar y desde allí comprendan los fundamentos de diseño y de los programas de carga y limpieza asociados

- Utilizar Open Refine como herramienta de limpieza de datos y distinguir entre los problemas que conviene encarar con Open Refine y los que resultan menos apropiados.

  

Destinatarios

 

- Profesionales que quieran desarrollar almacenes de datos y los correspondientes programas de ETL.

  

Temario

 

Módulo 1: Datawarehouses y ETL

 

Unidad 1: Introducción a los DW y ETL

 

-  Definición de almacén de datos

-  Diseño de almacén de datos

-  Ejeercicio de diseño básico de almacén de datos

-  Definición de ETL

-  Ejercicios de diseño básico de ETL

-  Definición de Staging

 

Unidad 2: Estructuras de Datos

 

-  Bases de datos

-  Tipos de datos y soportes

-  Estimación de recursos y tiempos según los tipos de datos

-  Ejemplos de staging

-  Problemas y complicaciones típicas de los procesos de ETL

-  Interacción entre equipos (DB-ETL-Soporte-FrontEnd-Usuarios)

-  Backend y Frontend

-  Ejercicios avanzados de diseño de un almacén de datos

 

Unidad 3: Flujos de datos

 

-  Procesos de ETL: generalidades, buenas prácticas, esquemas de ETL

-  Detalles de las etapas de extracción, limpieza, normalización, transformación y carga

-  Estrategias de actualización

-  Ejercicios avanzados de diseño de ETL para la carga inicial

-  Ejercicios avanzados de diseño de ETL para una actulización incremental

 

Unidad 4: Open Refine

 

-  Licencia, descarga e instalación de Open Refine

-  Uso general de Open Refine como herramienta de limpieza de datos

-  Pre-procesado de los datos

-  Casos de interés y ejemplos

 

Unidad 5: Pentaho

 

-  Licencias, descarga e instalación

-  Introducción a ETL con herramientas profesionales

-  Pentaho Kettle: funciones, características y utilización

-  Auditoría y documentación

-  Ejemplos de uso

 

Unidad 6: Revisión General y Examen Final

 

 

Requisitos previos

- Es necesario que los participantes posean conocimientos equivalentes a los impartidos en los cursos de Fundamentos de Programación y la Diplomatura en Bases de Datos.

 

Metodología de enseñanza-aprendizaje

 

La modalidad de e - Learning Colaborativo es totalmente mediada por tecnologías a través del Campus Virtual FRBA. Se trata de una modalidad básicamente asincrónica que aprovecha pedagógicamente los recursos de la Web 2.0, con un complemento sincrónico, por medio de la realización de clases en tiempo real, logrando superar de esta forma, la instancia de autoestudio.


El trayecto formativo consta de Módulos; cada uno de ellos está conformado por unidades, las cuales a su vez, integran los contenidos temáticos.


Así, en cada unidad, Usted contará con:

  • Foros Proactivos de interacción y comunicación propuestos por el docente para la presentación de dudas, consultas y opiniones, la discusión y la retroalimentación (feedback) entre profesores/tutores - alumnos; y alumnos entre sí.
  • Otras vías de consulta al docente, foro de dudas, salas de chat, mensajería interna del campus.
  • Material de lectura obligatoria y complementaria.
  • Actividades y trabajos integradores de aplicación de los conocimientos adquiridos, individuales y/o grupales.
  • Clase en tiempo real, 2 encuentros por módulo, en el Aula Virtual Sincrónica.

 

Modalidad de evaluación y acreditación

 

La Evaluación del trayecto formativo comprende una Evaluación Integradora por módulo y una Evaluación Integradora Final Obligatoria (EFIO), que se basa en la realización por parte del alumno de la entrega de una tarea (consigna específica para su desarrollo) o cuestionario autoadministrado (calificación automática). Dicha evaluación final cuenta con una segunda instancia de Exámen Recuperatorio, para aquellos participantes que no aprobaron la primera o no la realizaron dentro de las fechas estipuladas por Cronograma.


A su vez, se tendrá en cuenta también, para la evaluación:


  • La descarga y lectura de todos los elementos que componen la unidad temática.
    Grado de participación en todos los foros proactivos propuestos en cada una de las unidades temáticas.
  • La asistencia y/o descarga de las clases virtuales en tiempo real.
  • La entrega y aprobación de todas las actividades y ejercicios que se consignen como obligatorios.
  • La dedicación horaria indicada en cada caso para lograr el máximo rendimiento del estudio.
  • El alumno deberá finalizar la cursada dentro de la duración del trayecto sin excepción. - Terminado el mismo, no podrá entregar ni descargar nada adeudado y deberá cursar nuevamente en un próximo inicio, en caso de desear finalizarlo.

La acreditación del trayecto constará de la Aprobación de lo indicado en la evaluación obligatoria.


La calificación será cualitativa: Excelente, Muy Bueno, Bueno, Regular, Malo.
Las tres calificaciones primeras, otorgan un certificado de "Aprobación".
Aquellos alumnos que no hayan alcanzado alguna de estas tres calificaciones o no hayan realizado la EFI, podrán obtener una calificación y certificación de Participación, previa comprobación por parte del Profesor – Tutor de ciertos criterios de evaluación.

 

 

Duración 

6 Semanas

 

 

Carga horaria

 

45.0 hs.

 

  

Dirección y cuerpo docente

 

Coordinador: Ulises Martins

Ulises Martins es Ingeniero en Sistemas de Información de la Universidad Tecnológica Nacional (UTN). Posee un Postgrado en Ingeniería en Calidad (UTN), un Postgrado en Gestión Tecnológica (Universidad Austral) y las certificaciones Project Management Professional, Agile Certified Practitioner, Certified ScrumMaster e ITIL Foundation. Habiendo comenzado su carrera en 1996, trabajó en diversas posiciones (soporte, desarrollo, testing, integración, arquitectura y gestión de proyectos) en distintas organizaciones multinacionales.Su experiencia laboral comprende más de 20 años trabajando en proyectos de IT en compañías como Accenture, Telefónica de Argentina, Banco Santander, IBM, Capgemini, Banco Galicia, Banco de Córdoba y SAP.De los distintos desafíos en los que trabajó se destacan el liderazgo de un equipo de más de 70 personas (SW Factory), Proyectos complejos distribuidos en Latinoamérica, Servicios de infraestructura para todas las sucursales y casas centrales de Banco Santander en Argentina, Proyectos de outsourcing para España y la Migración de Datos del sistema CORE Banking de Banco Galicia a SAP Banking Services (2M de Cuentas y 102M de movimientos).A nivel académico dirige el Posgrado de Gestión de Proyectos en la Universidad Tecnológica Nacional y es el creador y coordinador de diversos cursos a distancia, eLearning.Actualmente se desempeña como Gerente de Programas para Latinoamérica en Kimberly-Clark.

Profesor: Jeronimo Peralta Ramos

Jerónimo Peralta es Doctor en Física y se desempeñó como Investigador del Conicet. Actualmente se dedica full time a la minería de datos en forma independiente.Se especializó en inteligencia de negocios, análisis, visualización, minería de datos,ETL, web scraping, optimización de procesos, presentaciones de alto impacto y ventas

Profesor: Jesús Ignacio Matías Urteaga

Completó la Licenciatura en Física en la UBA y trabajó en ese campo como investigador por cuatro años. Paulatinamente se fue reorientando a sistemas con foco en desarrollo de aplicaciones e inteligencia artificial.Trabajó durante 8 años Emergencias SA en diferentes posiciones gerenciales participando de varios proyectos de desarrollo de software y de consultoría. Desarrollo un proceso de auto - aprendizaje supervisado para el sistema experto de clasificación telefónica de Emergencias Médicas. Este logro obtuvo un premio en EUNITE 2001 y fue objeto de un proceso de transferencia de ""Know How"" hacia SEMSA SA (gestor del sistema de emergencias de la Comunidad Autónoma de Catalunya)Tras cumplir dos años como Gerente de Proyectos en una consultora especializada en la gestión de la tecnología en el ámbito público se independizó como consultor cubriendo temáticas de gestión de proyectos, gestión de la tecnología, emergencias públicas y análisis y gestión de proyectos.En la actualidad se desempeña como Director de Business Intelligence en Sprayette SA, es profesor adjunto en el MBA en Dirección de Sistemas de Información de la Universidad del Salvador y en el Postgrado en Gestión de Proyectos de la UTN.

Profesora: Laura Cristina Siri

Comunicóloga graduada de la Universidad de Buenos Aires, actualmente cursando el doctorado en Ciencias Sociales. Ha integrado equipos de investigación UBACYT en la misma casa de estudios desde 1994 hasta la actualidad, en el marco de los cuales ha publicado artículos, libros y capítulos de libros. Es jefe de trabajos prácticos en la carrera de Ciencias de la Comunicación de dicha universidad, en el área de políticas tecnológicas, y posee estudios de posgrado en estudios sociales de la ciencia y la tecnología. Durante casi quince años fue periodista y editora especializada en informática en distintas revistas, diarios y medios digitales de Argentina y América Latina y, posteriormente, se desempeñó cuatro años como responsable regional de medios sociales online para sistemas empresariales de una compañía global de hardware, software y servicios.

Profesor: Alejo Martin Lazzati

Quiero enfrentar nuevos desafíos, encontrar un lugar donde poder desarrollarme y crecer, proyectándome a largo plazo. Actualmente me encuentro en el fin de mi carrera universitaria, por lo tanto considero este un momento de encarar un nuevo proyecto.

Profesor: Carolina Juarez

Mi nombre es Carolina Juárez, en 1995 me recibí de Ing. en Sistemas en la UTN - Tucumán, en el 2007 me gradué de Profesora en la UCA-La Plata, en el 2015 finalicé un Pos título de Especialización Docente en Educación y TIC. Inicié como docente Secundario y Terciario en el año 2003. A partir del 2015 en la UNComa - Viedma, en la Tecnicatura en Adm. de Sistemas y Software Libre. Mi trayectoria laboral comienza como data entry en Telecom, durante los 9 años que me desempeñé allí, tuve la oportunidad de crecer profesionalmente, en los últimos años trabajé en la gerencia de Análisis de Mercados realizando el desarrollo de indicadores para el mercado de Internet. Actualmente soy Líder de Proyectos en ALTEC SE - Río Negro, coordinando y gestionando la implementación de un nuevo sistema de RRHH

 

Bibliografía

Casters, Matt, Bouman, Roland, and van Dongen, Jos. Pentaho kettle solutions: Building open source ETL solutions with Pentaho data integration. Indianapolis, Ind: Wiley, 2010. 

Inmon, Bill. Turning spreadsheets into corporate data. S.l.: Technics Pubns LLC, 2017.

Kimball, Ralph. Kimball's data warehouse toolkit classics: The data warehouse toolkit, 3rd edition. John Wiley & Sons Inc, 2013.

Verborgh, Ruben, and Wilde, Max. Using OpenRefine: The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the web. Birmingham: Packt Publ, 2013.

Precio para Argentina

9126 Pesos Argentinos

Precio para Otros Países

228 Dólares Estadounidenses

Certificado Digital

Ayudamos al medioambiente mediante la reducción de uso de papel

Apto Crédito Fiscal para Capacitación ¡Somos UCAP!

Sepyme

El Centro de e-Learning UTN FRBA es Unidad Capacitadora, de manera que los cursos que dictamos pueden canalizarse a través del Régimen de Crédito Fiscal para Capacitación.


Subir