🚀PROMO #PLANCARRERA2024 - 🔥Bonificaciones, Precios Congelados y Cuotas

 X 

✒️SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

Proceso ETL

ETL - este termino viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en una empresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), también llamado “Gestión de los Datos” (Data Management).

La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de sistemas principales, realice transformación, validación, el proceso cualitativo, filtración y al final escriba datos en el almacén y en este momento los datos son disponibles para analizar por los usuarios.

Fase extracción

Para realizar de manera correcta el proceso de extracción se deben seguir los siguientes pasos:

  • Extraer los datos desde los sistemas de origen.
  • Analizar los datos extraídos obteniendo un chequeo.
  • Interpretar este chequeo para verificar que los datos extraídos cumplen la pauta o estructura que se esperaba. Si no fuese así, los datos deberían ser rechazados.
  • Convertir los datos a un formato preparado para iniciar el proceso de transformación.

Además, una de las prevenciones más importantes a tomar en cuenta durante el proceso de extracción sería el exigir siempre que esta tarea cause un impacto mínimo en el sistema de origen. Este requisito se basa en la práctica, ya que si los datos a extraer son muchos, el sistema de origen se podría ralentizar e incluso colapsar, provocando que no pudiera volver a ser utilizado con normalidad para su uso cotidiano.

Fase de transformación

La fase de transformación de un proceso de ETL aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Estas directrices pueden ser declarativas, basarse en excepciones o restricciones, pero para potenciar su pragmatismo y eficacia es preciso asegurarse de que sean:

  • Declarativas.
  • Independientes.
  • Claras.
  • Inteligibles.
  • Con una finalidad útil para el negocio.

Proceso de carga

En esta etapa, los datos procedentes de la fase anterior (fase de transformación) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar una amplia variedad de acciones diferentes.
Existen dos formas básicas de desarrollar el proceso de carga:

Acumulación simple

Esta manera de cargar los datos consiste en realizar un resumen de todas las transacciones comprendidas en el periodo seleccionado y transportar el resultado como una única transacción hacia el data warehouse, almacenando un valor calculado que consistirá típicamente en un sumatorio o un promedio de la magnitud considerada. Es la forma más sencilla y común de llevar a cabo el proceso de carga.

Rolling

Este proceso sería el recomendable en los casos donde se busque mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondiendo a distintas agrupaciones de la unidad de tiempo o diferentes niveles jerárquicos en alguna o varias de las dimensiones de la magnitud almacenada (por ejemplo, totales diarios, totales semanales, totales mensuales, etcétera).

Cualquiera que sea la manera de desarrollar este proceso, hay que tener en cuenta que esta fase interactúa directamente con la base de datos de destino, y por eso al realizar esta operación se aplicarán todas las restricciones que se hayan definido en esta. Si están bien definidas, la calidad de los datos en el proceso ETL estará garantizada.

¿Para qué sirve una herramienta ETL?

ETL es un instrumento potente que puede trabajar junto a otras herramientas de gestión e integración de datos para cumplir con los objetivos de nuestra compañía. Algunos casos de usos incluyen:

  • Migración de datos desde sistemas legacy con formatos de datos distintos.
  • Consolidación de datos como consecuencia de una fusión empresarial.
  • Recolección y fusión de datos desde proveedores o partners externos.
  • Integración de nuevas fuentes de datos como social media, videos, dispositivos conectados a internet de las cosas, entre otras.
  • Analítica “Self-Service” para ofrecer la posibilidad de hacer decisiones basadas en los datos a perfiles de negocio y sin conocimientos técnicos.
  • Integrarse con herramientas de Data Quality para asegurar que los datos sean confiables.
  • Trabajar con metadatos para permitir la trazabilidad de los datos.
  • Integrarse con sistemas transaccionales, almacenes de datos operativos, plataformas de Business Intelligence y sistemas de Master Data Management (MDM).
Principales beneficios de ETL

En resumen, los beneficios principales que una herramienta ETL puede proporcionar a nuestra empresas son:

  • Permitir extraer y consolidar datos de múltiples fuentes.
  • Proporcionar un contexto histórico profundo sobre nuestra empresa y negocio.
  • Facilitra el análisis y el reporte de datos de una forma sencilla y eficiente, mediante representación visual.
  • Aumentar la productividad y facilitar el trabajo en equipo.
  • Permitir adaptarse a la evolución de las tecnologías e integrar nuevas fuentes de datos con las tradicionales.
  • Permitir la toma de decisión estratégica basadas en datos por parte de los directivos de la empresa.

En definitiva, ETL nos pone en condición de poder extraer de ellos el conocimiento que nos pueda ayudar a solucionar nuestros problemas de negocio y ser verdaderas empresas data driven.

Desafíos de ETL

Los procesos ETL son fundamentales para cada empresa. Sin embargo, se encuentran con importantes retos que tienes que superar para adaptarse a las nuevas necesidades:

  • Procesamiento de datos en tiempo real. Cada día más se necesita tomar decisiones con mayor velocidad, lo que contrasta con el funcionamiento en batch de los sistemas ETL tradicionales, que tiene que adecuarse para operar lo más cercano posible al tiempo real.
  • Aumentar la velocidad del procesamiento de datos. El aumento tanto de la cantidad como de la complejidad de los datos, dificulta a veces las tareas de transformación. En este sentido, nación el concepto de ELT (Extract, Load and Transformation), que pospone la transformación en último lugar, realizándose ya en el sistema destino, y aprovechando de la potencia de cálculo del motor de la base de datos.
  • Integración de nuevas fuentes de datos. En la actualidad, las empresas necesitan acceder a todo tipo de fuentes de datos heterogéneas: videos, redes sociales y hasta datos generados por máquinas (Internet de las cosas). Por esto, las herramientas ETL necesitan evolucionar y agregar nuevas transformaciones para soportar estas nuevas fuentes de datos y las que vendrán en futuro.


 

 

 


Sobre el autor

Publicación académica de Mary Galicia, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.

SAP Senior

Mary Galicia

Profesión: Ingeniero en Informatica - Venezuela - Legajo: JZ82V

✒️Autor de: 47 Publicaciones Académicas

🎓Egresado del módulo:

Disponibilidad Laboral: FullTime

Certificación Académica de Mary Galicia

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "Introducción al ETL" de la mano de nuestros alumnos.

SAP SemiSenior

En esta lección se hace una introducción al proceso ETL. Consiste en un flujo de datos que va desde la extracción de la información, su transformación en un formatoestándar y su carga al datawarehouse. a. Proceso de extracción: - Distintas fuentes. Determinar el impacto b. Proceso de transformación: - Se estandarizan los datos para que puedan ser manipulados. c. Proceso de carga. - Se sube la información al sistema datawarehouse. Se sube mediante carga full (completa y se usa a las primeras veces) y cargas delta (modificaciones sobre las cargas iniciales)

Acceder a esta publicación

Creado y Compartido por: David Antonio Montoya Morales

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Unidad 2 - Introducción al ETL ETL = Extracción / Transformación / Carga (Load) 1.- Proceso de Extracción: Es el paso en que se extraen los datos desde diferentes sistemas de información. Estos datos pueden estar almacenados en diferentes formatos (excel, txt, xml, bd transaccional...) y se dejan preparados para que se pueda aplicar algún proceso de transformación. En este paso es necesario hacer un estudio previo para discernir los datos que nos interesan y despreciar los que no serán de utilidad. 2.- Proceso de transformación: Es el paso en que se adaptan los datos extraídos, aplicando reglas de negocio, para cargarlos al DW. Algunas de las adaptaciones que se suelen...

Acceder a esta publicación

Creado y Compartido por: Carme Vicens Paul

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Junior

Unidad 2. El proceso ETL 2.1 Introducción al ETL El ETL también es llmado fujo de datos y son los pasos que se deben seguir para que los datos sean extraidos, transformados y cargads al sistema SAP. Paso 1 . Extracción: esta es la primera parte del proceso de ETL y busca principalmente obtener los datos y dejarlos listos para poder realizarles el proceso de transformación. En la extracción es importate hacer la selección de los datos que se van a utilizar para no tener datos innecesarios en el sistema fuente. Paso 2. Transformación: Busca adaptar los datos exraidos en los datos que finalemnete seran cargados en el Datawarehouse. En las trasnfomaciones se puede dar las siguientes modificaciones:...

Acceder a esta publicación

Creado y Compartido por: Claudia De La Hoz / Disponibilidad Laboral: PartTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

Unidad 2: Introducción al ETL 1. Proceso ETL ETL también llamado flujo de datos, son los pasos que debe seguir la informacion (datos) contenbida en los sistemas fuentes (SAP y NO SAP), para que la misma sea extraida, transformada y cargada a nuestro sistema SAP BI El flujo seria: FUENTES / area Staging / transformaciones / cargas (ODS y Cubos) 2. Proceso de Extracción: La extracción puede ser de diferentes sistemas. (SAP y NO SAP) El almancenamiento puede hacerse desde archivos excel, en texto plano, en ficheros XML, en bases de datos relacionales, entre otros. La idea es obtener los datos y dejarlos listos para que se pueda aplicar algún proceso de transformación. Se deben analizar los datos a extraer...

Acceder a esta publicación

Creado y Compartido por: Vanessa Cristal Vera

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Introducción a ETL Proceso ETL El proceso ETL también se lo denomina flujo de datos, que son los pasos que deben seguir los datos en su estado inicial (Sistema fuente) para que sean extraidos, transformados y finalmente cargados en nuestro sistema SAP BI. Proceso de Extracción La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. Los proyectos que se realizan para generar un Datawarehouse extraen datos de diferentes sistemas y estos están almacenados de maneras diferentes como por ejemplo Excel, xml bases de datos. Proceso de Transformación Busca adaptar los datos extraídos en datos que finamente sean cargados en el Datawarehouse. Estas transformaciones serán...

Acceder a esta publicación

Creado y Compartido por: Daniel Fernando Yanez Guevara

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

INTRODUCCIÓN ETL Proceso ETL Son los pasos que debe seguir los datos en su estado inicial para que sean extraídos, transformados y cargados a SAP BI Proceso de Extracción La primer parte del proceso de ETL consiste en extraer los datos desde el sistema de origen. La mayoría de los proyectos obtienen datos provenientes de diferentes sistemas y cada uno puede almacenarlos de una manera diferente, es decir en excel, txt, xml, etc. La extracción busca en primer momento obtener los datos y dejarlos listos para que se les pueda aplicar un proceso de transformación, por lo tanto se debe determinar cuáles serán útiles y cuales no y de esta manera evitar datos innecesarios...

Acceder a esta publicación

Creado y Compartido por: Cesar Augusto Bedoya Gomez / Disponibilidad Laboral: FullTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Audio de Procesos de Carga: Unidad 2: Ventajas que vienen de la mano del Flujo de Datos de la Versión 7.0 ü Mejora de Performance en las cargas. Ya que se pueden paralelizar los procesos ü Hacer más sencillo el proceso de creación., mantenimiento del flujo desde la Fuente de datos , pasando por la Transformación hasta el Destino de Datos, ü Y la mejora en el manejo de errores en caso de detectar registros erróneos en la PSA.

Acceder a esta publicación

Creado y Compartido por: Eugenia Saucedo

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Proceso ETL ETL - este termino viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en una empresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes (externas), a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), t La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de los sistemas principales, realice transformación, validación,...

Acceder a esta publicación

Creado y Compartido por: Guillermo Lozada Yanguas

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

ETL = flujo de datos, son los pasos que deben seguir los datos en su estado inicial para que sean extraídos, transformados y finalmente cargados al sistema SAP BI PROCESO DE EXTRACCIÓN, La primera parte del proceso ETL consiste en extraer los datos des el sistema origen La mayoría de los proyectos que se realizan para generar un Datawarehouse obtienen los datos provenientes de diferentes sistemas Cada uno de estos sistemas por separado puede tener almacenados de una manera diferente sus datos esto significa que puede tenerlo en ficheros Excel, en texto plano, en ficheros xml, en base de datos relacionales, entre otros La extracción busca en un primer momento obtener los datos y dejarlos listos para que se les pueda...

Acceder a esta publicación

Creado y Compartido por: Julian Lara

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

En esta lección aprendemos conceptos básicos sobre ETL. 1. Es un Proceso de Extract-Transformation-Load de datos de los sistemas sap o no sap y archivos fuentes hacia el sistema BI 2. Extracción: Los datos se obtienes de las fuentes y mediante la ejecución de un objeto InfoPackage se trasladan hacia el PSA (Persistent Staging Area), que son tablas con la misma estructura de la fuente de datos. Si el proceso de extracción con consultas a BD o Extractores posee mucha lógica de negocio y el volumen de datos es bastante podemos ocasionar bloqueos o lentitud en el sistema origen. 3. Transformación En este proceso se ejecutan las reglas del negocio para depurar datos o realizar lógica de sumatorias...

Acceder a esta publicación

Creado y Compartido por: Dennis Ned Urbano Eusebio

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 79.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!