✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
ETL = flujo de datos, son los pasos que deben seguir los datos en su estado inicial para que sean extraídos, transformados y finalmente cargados al sistema SAP BI
PROCESO DE EXTRACCIÓN,
La primera parte del proceso ETL consiste en extraer los datos des el sistema origen
La mayoría de los proyectos que se realizan para generar un Datawarehouse obtienen los datos provenientes de diferentes sistemas
Cada uno de estos sistemas por separado puede tener almacenados de una manera diferente sus datos esto significa que puede tenerlo en ficheros Excel, en texto plano, en ficheros xml, en base de datos relacionales, entre otros
La extracción busca en un primer momento obtener los datos y dejarlos listos para que se les pueda aplicar algún proceso de transformación
Una parte muy importante es este proceso es que se deben analizar los datos a extraer para determinar cuáles son los que serán útiles y cuáles no, para de esta manera rechazar los que no utilizaremos y evitar datos innecesarios en nuestro sistema
Otro ítem muy importante al momento de realizar el análisis de la extracción que vamos a realizar es el de determinar el impacto que puede generar esta extracción en el sistema fuente, ya que podría perjudicar a los sistemas transaccionales y por tanto complicar la operatoria diaria de la empresa
PROCESO DE TRANSFORMACIÓN, busca adaptar los datos extraídos en datos que finalmente serán cargados en el datawarehouse. Estas transformaciones serán adaptaciones de los datos basándose en reglas preestablecidas
Modificaciones que pueden ocurrir:
Codificar, por ejemplo queremos establecer que el producto chocolate sea almacenado como CH
Obtener, nuevos valores, por ejemplo Importe_total = importe_producto impuesto
Generar campos claves en el destino de datos, por ejemplo como mencionamos en la unidad 1, cuando en varios sistemas se llama de diferentes manera un producto se busca establecer un nuevo código de identificación único para todos, pero al mismo tiempo queremos identificar de que sistema nos llegó dicha información, entonces por ejemplo podemos establecer un campo clave Producto que estará formado por 3 caracteres iniciales que no indica de donde proviene un código que identifica el tipo de producto
Generar registros con cálculos totales, esto sirve cuando se quiere tener almacenados por ejemplo los totales de ventas por ciudad
Armar varias columnas partiendo de solo una o viceversa, por ejemplo se tienen los campos Nombre = “juan”, Apellido = “Lopez” y se almacena en un solo campo Nombre = “Juan Lopez”
Establecer que determinados campos que vengan con determinados tipos de datos sean convertidos. Por ejemplo si un campo viene de la siguiente forma Nombre = “Juan#Lopez” y el separador # no nos sirve para nuestra implementación, podemos hacer que llegue a nuestro sistema como Nombre = “Juan Lopez”
PROCESO DE CARGA,
Es el proceso en el cual los datos pasan por la fase de transformación y son cargados en nuestro sistema
Existen varias maneras de cubrir los requerimientos por ejemplo en algunos casos sobrescriben los datos que se obtienen y en otros se va almacenando un historial de los registros de forma que se pueda conocer como fue variado un determinado valor a lo largo del tiempo
Las cargas pueden realizarse de 2 maneras
Cargas full: este tipo de cargas generalmente se realizan inicialmente y es cuando queremos que pasen todos los datos de la fuente del destino
Cargas delta: con este tipo de cargas solo traeremos a nuestro sistema los datos que aun no fueron almacenados, las cargas delta son imprescindibles, ya que sin ellas todas las veces que realicemos una carga, sobrecargaría al sistema fuente con esta solicitud
 
 
 
Agradecimiento:
Ha agradecido este aporte: Nestor Andino Argueta
Sobre el autor
Publicación académica de Julian Lara, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Julian Lara
Profesión: Ejecutivo Comercial - Colombia - Legajo: RE86N
✒️Autor de: 16 Publicaciones Académicas
🎓Cursando Actualmente: Consultor BI / BW BO Nivel Avanzado
Certificación Académica de Julian Lara