🚀PROMO #PLANCARRERA2024 - 🔥Bonificaciones, Precios Congelados y Cuotas

 X 

✒️SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

1.- Procesos ETL (Extract, Transform and Load - Extraccion, transformacion y carga) de datos

También conocido como flujo de datos, los cuales corresponden a los pasos que deben seguir los datos en su estado inicial, sistema fuente, para que sean extraídos, transformados y finalmente cargados en nuestro sistema, caso de estudio SAP BI. En resumen, tendremos un dato inicial "crudo" proveniente de nuestro sistema fuente/base para luego realizar las transformaciones del dato necesarios; union, desunion, eliminacion de caracteres especiales, etc para luego ser cargados en nuestras tablas del modelo de datos final.

2.- Proceso de Extracción

Este proceso es el paso inicial de un ETL, el cual consiste en recuperar/leer/extraer los datos desde los sistemas fuentes/origen/base.

Los sistemas fuentes pueden ser de diferentes tipos; por ejemplo archivos Excel, de texto plano, XML, bases de datos relacionales, etc.

La función principal del proceso de extracción es la de poner a disposición los datos útiles, desde los sistemas fuentes antes mencionados, para que luego sean "manipulados" por el siguiente proceso llamado Transformación.

Dato importante en este paso es siempre considerar que los datos deben ser útiles, para lo cual es necesario realizar un análisis previos de cuales serán considerados y cuales no, como también de la carga/volumen de datos que serán extraídos para no afectar el diario comportamiento de los sistemas de la empresa, esto cuando el sistema fuente es una base transaccional.

3.- Proceso de Transformación

Tal como lo dice la palabra, en este paso se realizará la transformación de los datos, habilitados en el proceso anterior de extracción, para luego darle un valor agregado con respecto a las reglas del negocio, esto se puede considerar en seis puntos bases, los cuales serán:

* Codificación: asignación de una nomenclatura/abreviación a una palabra/detalle/concepto empresarial. ejemplo chocolate = CH

* Cálculos: Realizar cálculos en base a dos o mas variables, ejemplo valor total = valor inicial + valor final

* Llaves primarias: Asignar un identificador único al registro que se esta cargando, por ejemplo cuando se consideran varios orígenes de datos, pero no existe una "norma" en cuanto a la definición de los mismos, en este punto, se puede hacer la diferenciación, por ejemplo datos cargados del sistema fuente A, queda con la asignación 1 y los del sistema fuente B con la asignación 2 y así sucesivamente.

* Agrupación: generación de registros con cálculos totales, por ejemplo se agrupan los datos para obtener las ventas por ciudad.

* Concatenación: Acción de unir dos o mas palabras para generar una sola, ejemplos los nombres con los apellidos, la dirección completa de un lugar, etc.

¨Limpieza: Eliminación de todo caracter "extraño" en los datos existentes, para no "arrastrar" estas "basuras" en los datos y que pueda ser perjudicial o entorpecer el proceso de análisis final.

4.- Proceso de Carga

Este paso corresponde a la realización de la carga de los datos, ya extraídos y posteriormente transformados, en nuestro sistema final, el cual puede ser un cubo de datos o una ODS.

Las cargas de datos pueden ser realizadas de 2 maneras:

* Cargas Full: Como lo indica la palabra, se carga todo desde el sistema fuente al sistema destino.

* Cargas Delta: A diferencia de la carga full, la carga delta solo cargara los datos que aún no han sido almacenados.

Punto a favor de la carga delta es que "aliviana" el proceso de carga del sistema fuente ya que no realizaría una sobre carga del sistema a diferencia de lo que si podría ocurrir con una carga full.

DATAWAREHOUSE: Es un repositorio de la información transaccional obtenida desde los sistemas de gestión (incluido SAP ERP), organizada de tal manera que se adapte mejor a las necesidades de reportes, disminuyendo los tiempos de consulta y optimizando el uso de recursos de hardware. Las fuentes de información de un datawarehouse puede que provenga de la propia plataforma SAP instalada, o bien de fuentes externas como ser datos provenientes de la web, aplicaciones externas, documentaciones anexadas etc.


 

 

 


Sobre el autor

Publicación académica de Mauricio Osenga Vasquez, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.

SAP Senior

Mauricio Osenga Vasquez

Profesión: Ingeniero Informatico - Chile - Legajo: XR81O

✒️Autor de: 46 Publicaciones Académicas

🎓Cursando Actualmente: Consultor BI / BW BO Nivel Avanzado

🎓Egresado del módulo:

Certificación Académica de Mauricio Osenga

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "Introducción al ETL" de la mano de nuestros alumnos.

SAP SemiSenior

En esta lección se hace una introducción al proceso ETL. Consiste en un flujo de datos que va desde la extracción de la información, su transformación en un formatoestándar y su carga al datawarehouse. a. Proceso de extracción: - Distintas fuentes. Determinar el impacto b. Proceso de transformación: - Se estandarizan los datos para que puedan ser manipulados. c. Proceso de carga. - Se sube la información al sistema datawarehouse. Se sube mediante carga full (completa y se usa a las primeras veces) y cargas delta (modificaciones sobre las cargas iniciales)

Acceder a esta publicación

Creado y Compartido por: David Antonio Montoya Morales

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Unidad 2 - Introducción al ETL ETL = Extracción / Transformación / Carga (Load) 1.- Proceso de Extracción: Es el paso en que se extraen los datos desde diferentes sistemas de información. Estos datos pueden estar almacenados en diferentes formatos (excel, txt, xml, bd transaccional...) y se dejan preparados para que se pueda aplicar algún proceso de transformación. En este paso es necesario hacer un estudio previo para discernir los datos que nos interesan y despreciar los que no serán de utilidad. 2.- Proceso de transformación: Es el paso en que se adaptan los datos extraídos, aplicando reglas de negocio, para cargarlos al DW. Algunas de las adaptaciones que se suelen...

Acceder a esta publicación

Creado y Compartido por: Carme Vicens Paul

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Junior

Unidad 2. El proceso ETL 2.1 Introducción al ETL El ETL también es llmado fujo de datos y son los pasos que se deben seguir para que los datos sean extraidos, transformados y cargads al sistema SAP. Paso 1 . Extracción: esta es la primera parte del proceso de ETL y busca principalmente obtener los datos y dejarlos listos para poder realizarles el proceso de transformación. En la extracción es importate hacer la selección de los datos que se van a utilizar para no tener datos innecesarios en el sistema fuente. Paso 2. Transformación: Busca adaptar los datos exraidos en los datos que finalemnete seran cargados en el Datawarehouse. En las trasnfomaciones se puede dar las siguientes modificaciones:...

Acceder a esta publicación

Creado y Compartido por: Claudia De La Hoz / Disponibilidad Laboral: PartTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

Unidad 2: Introducción al ETL 1. Proceso ETL ETL también llamado flujo de datos, son los pasos que debe seguir la informacion (datos) contenbida en los sistemas fuentes (SAP y NO SAP), para que la misma sea extraida, transformada y cargada a nuestro sistema SAP BI El flujo seria: FUENTES / area Staging / transformaciones / cargas (ODS y Cubos) 2. Proceso de Extracción: La extracción puede ser de diferentes sistemas. (SAP y NO SAP) El almancenamiento puede hacerse desde archivos excel, en texto plano, en ficheros XML, en bases de datos relacionales, entre otros. La idea es obtener los datos y dejarlos listos para que se pueda aplicar algún proceso de transformación. Se deben analizar los datos a extraer...

Acceder a esta publicación

Creado y Compartido por: Vanessa Cristal Vera

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Introducción a ETL Proceso ETL El proceso ETL también se lo denomina flujo de datos, que son los pasos que deben seguir los datos en su estado inicial (Sistema fuente) para que sean extraidos, transformados y finalmente cargados en nuestro sistema SAP BI. Proceso de Extracción La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. Los proyectos que se realizan para generar un Datawarehouse extraen datos de diferentes sistemas y estos están almacenados de maneras diferentes como por ejemplo Excel, xml bases de datos. Proceso de Transformación Busca adaptar los datos extraídos en datos que finamente sean cargados en el Datawarehouse. Estas transformaciones serán...

Acceder a esta publicación

Creado y Compartido por: Daniel Fernando Yanez Guevara

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

INTRODUCCIÓN ETL Proceso ETL Son los pasos que debe seguir los datos en su estado inicial para que sean extraídos, transformados y cargados a SAP BI Proceso de Extracción La primer parte del proceso de ETL consiste en extraer los datos desde el sistema de origen. La mayoría de los proyectos obtienen datos provenientes de diferentes sistemas y cada uno puede almacenarlos de una manera diferente, es decir en excel, txt, xml, etc. La extracción busca en primer momento obtener los datos y dejarlos listos para que se les pueda aplicar un proceso de transformación, por lo tanto se debe determinar cuáles serán útiles y cuales no y de esta manera evitar datos innecesarios...

Acceder a esta publicación

Creado y Compartido por: Cesar Augusto Bedoya Gomez / Disponibilidad Laboral: FullTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Audio de Procesos de Carga: Unidad 2: Ventajas que vienen de la mano del Flujo de Datos de la Versión 7.0 ü Mejora de Performance en las cargas. Ya que se pueden paralelizar los procesos ü Hacer más sencillo el proceso de creación., mantenimiento del flujo desde la Fuente de datos , pasando por la Transformación hasta el Destino de Datos, ü Y la mejora en el manejo de errores en caso de detectar registros erróneos en la PSA.

Acceder a esta publicación

Creado y Compartido por: Eugenia Saucedo

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Proceso ETL ETL - este termino viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en una empresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes (externas), a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), t La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de los sistemas principales, realice transformación, validación,...

Acceder a esta publicación

Creado y Compartido por: Guillermo Lozada Yanguas

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

ETL = flujo de datos, son los pasos que deben seguir los datos en su estado inicial para que sean extraídos, transformados y finalmente cargados al sistema SAP BI PROCESO DE EXTRACCIÓN, La primera parte del proceso ETL consiste en extraer los datos des el sistema origen La mayoría de los proyectos que se realizan para generar un Datawarehouse obtienen los datos provenientes de diferentes sistemas Cada uno de estos sistemas por separado puede tener almacenados de una manera diferente sus datos esto significa que puede tenerlo en ficheros Excel, en texto plano, en ficheros xml, en base de datos relacionales, entre otros La extracción busca en un primer momento obtener los datos y dejarlos listos para que se les pueda...

Acceder a esta publicación

Creado y Compartido por: Julian Lara

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

En esta lección aprendemos conceptos básicos sobre ETL. 1. Es un Proceso de Extract-Transformation-Load de datos de los sistemas sap o no sap y archivos fuentes hacia el sistema BI 2. Extracción: Los datos se obtienes de las fuentes y mediante la ejecución de un objeto InfoPackage se trasladan hacia el PSA (Persistent Staging Area), que son tablas con la misma estructura de la fuente de datos. Si el proceso de extracción con consultas a BD o Extractores posee mucha lógica de negocio y el volumen de datos es bastante podemos ocasionar bloqueos o lentitud en el sistema origen. 3. Transformación En este proceso se ejecutan las reglas del negocio para depurar datos o realizar lógica de sumatorias...

Acceder a esta publicación

Creado y Compartido por: Dennis Ned Urbano Eusebio

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 79.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!