🚀PROMO #PLANCARRERA2024 - 🔥Bonificaciones, Precios Congelados y Cuotas

 X 

✒️SAP BI / BW BO Introducción al Datawarehouse

SAP BI / BW BO Introducción al Datawarehouse

SAP BI / BW BO Introducción al Datawarehouse

Este tipo de modelo de datos consta principalmente de dos tipos de elementos:

  • DIMENSIONES: Representan factores por lo que se analiza un determinado área del negocio. Son pequeñas y usualmente están desnormalizadas.
  • HECHOS: Son el objeto de los análisis y están relacionados con las dimensiones. Son tablas muy grandes y suelen estar desnormalizadas. Se a menudo incluyen diferentes agregaciones como máximo, mínimo, media, …

Los hechos contiene los datos de estudio y las dimensiones contienen los metadatos sobre dichos hechos.

Si la información necesita disponer de varios niveles de granularidad se crean jerarquías con las dimensiones. Por ejemplo la jerarquía fecha podría ser “día – semana – mes – trimestre – año”.

Las jerarquías de las dimensiones presentan relaciones n-1 de manera que un valor de un nivel sólo puede ser agrupado por un único valor de cada nivel inmediatamente superior en la jerarquía. Esto facilita de manera rápida y sencilla el profundizar en el nivel de detalle (drill-down), disminuir el detalle(roll-up), selección (dice), proyección (slice) o pivotaje en las dimensiones (pivot), que son propios de los informes obtenidos a partir de data warehouse.

Diagrama en Estrella

Uno de los tipos de consultas más usadas en las OLAP es la llamada Estrella. Su nombre lo adquiere debido a que su implementación en un ambienterelacional (MOLAP Multidimentional Online Analitical Processing) está dado por varias tablas que almacenan las jerarquías dimensionales y una tabla que contiene el hecho con una relación 1:m con estas tablas de dimensiones. Veamos un ejemplo gráfico:

Figura 2: Diagrama en estrella del Hecho, Ventas. (Microsoft Data Warehouse Training Kit, 2000)

Como podemos ver en la figura las tablas de dimensiones están ligadas a la tabla Hecho, por relaciones. La integridad referencial es llevada a cabo por la creación de llaves foráneas en la tabla Hecho, que a su ves forman parte de la llave principal de la esta tabla. Es importante destacar que las jerarquías completas son guardadas en una sola tabla dimensión. Este es el formato no normalizado, existe otro formato que intenta normalizar estas tablas dimensión. Ejemplo (Time_Dim). Cada tabla dimensión tiene su propia llave que es mantenida por el sistema Data Warehouse. A estas llaves se les llama "Surrogate Key". Las llaves Surrogate Jerárquicas, no son más que una codificación de cada elemento de la jerarquía almacenado en la tabla dimensión. Veamos la figura 3 de cómo se logran estas llaves.

El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser:

Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios

Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.

Otra característica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de refresco, su fiabilidad, forma de cálculo... etc.

Los metadatos serán los que permiten simplificar y automatizar la obtención de la información desde los sistemas operacionales a los sistemas informacionales.

Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:

Dar soporte a los responsables técnicos del datawarehouse en aspectos de auditoría, gestión de la información histórica, administración del datawarehouse, elaboración de programas de extracción de la información, especificación de las interfaces para la realimentación a los sistemas operacionales de los resultados obtenidos... etc.

Por último, destacar que para comprender íntegramente el concepto de datawarehouse, es importante entender cual es el proceso de construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía:

Extracción: obtención de información de las distintas fuentes tanto internas como externas.

Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.

Carga: organización y actualización de los datos y los metadatos en la base de datos.


 

 

 


Sobre el autor

Publicación académica de Mary Galicia, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.

SAP Senior

Mary Galicia

Profesión: Ingeniero en Informatica - Venezuela - Legajo: JZ82V

✒️Autor de: 47 Publicaciones Académicas

🎓Egresado del módulo:

Disponibilidad Laboral: FullTime

Certificación Académica de Mary Galicia

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "Introducción al Datawarehouse" de la mano de nuestros alumnos.

SAP Training

Datawarehouse traduce "Almacén de datos." Y el fin de un datawarehouse es consolidar todo tipo de datos desde cualquier fuente y dejarlos de forma homogénea y listos para su análisis. Hay dos maneras de modelar el datawarehouse, que son el modelo estrella que consiste en tablas muy sencillas y concretas que se relacionan, y el modelo estrella extendido que consiste en tablas mas al detalle y mas extendido que se relacionan Un ETL es Extracción, transformación y carga, es un puente entre la información y el datawarehouse, y su función es extraer la información y volverla homogénea para almacenar en el datawarehouse. El BI es mujy importatnte en las empresas debido a que...

Acceder a esta publicación

Creado y Compartido por: Eider Julian Lopez Fajardo

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Datawarehouse ---> almacen de datos --> proceso ETL (extraccion, transformacion y carga) Modelos de datawarehouse --> modelo estrella clasico y el modelo estrella extendido (usado por sap bi) La tabla de dimension, dentro del modelo estrella extendido, es llamada SID

Acceder a esta publicación

Creado y Compartido por: Rolando Aguilera Dreyse

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

DataWarehouse: Datos de distintas fuentes en un mismo lugar Diferentes sistemas en el tiempo de una empresa dan a lugar por ejemplo a que cambien las codigueras de productos; por lo que se complica para ver datos historicos de un determinado producto. Hay es donde empiezan a jugar los DataWarehouse. Para armar los DataWarehouse se utilizan los ETLs (Extraccion , Transformacino y carga) Dar apoyo a la toma de deicisiones mediante KPIs Por que usar DataWarehouses? El diseño normalizado de las bases de datos nos complica para realizar un análisis complejo de datos. Por este motivo es que el esquema estrella clásico, como veremos en los gráficos siguientes, es el modelo multidimensional que más se utiliza para...

Acceder a esta publicación

Creado y Compartido por: Gaston Ashby

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Expert


El DataWarehouse es un almacén de la información corporativa de la empresa derivada directamente de los sistemas operacionales y de otras fuentes externas de datos. En él se reflejan los datos claves de los procesos de negocio con el fin de soportar la toma de decisiones. El DataWarehouse se caracteriza por contener información: - Integrada - Orientada al negocio - De sólo lectura - Histórica Integración de datos de más de un sistema operacional: Los sistemas de DataWarehouse son más efectivos cuando pueden combinar datos desde más de un sistema operacional. Cuando los datos deben ser extraídos desde más de una aplicación fuente, es natural que esta...

Acceder a esta publicación

Creado y Compartido por: Juan Pablo Sadoly / Disponibilidad Laboral: FullTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Datawarehouse: se traduce como almacén de datos y se utiliza para recopilar información que bien pueden provenir de un solo sistema o fuentes de datos o de diferentes de fuentes de datos. Los datos que provienen de las diferentes fuentes quedan de una manera homogenea en el datawarehouse en cuanto a su estructura.

Acceder a esta publicación

Creado y Compartido por: Angel Severo Read Baez

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Datawarehouse es una bodega o almacén de datos que lo que busca es reunir en un mismo lugar, todos los datos que posee una empresa sin importar de donde provienen. Datawarehouse ayuda a homogenizar o depurar la información, cuando esta contiene datos con varios nombres o identificadores. Dentro de las maneras de modelar un datawarehouse están: El modelo estrella clásico siendo el más utilizado en bases de datos relacionales ya que busca clasificar los datos en dos grupos, los hechos (FACT) que agrupa los valores, cantidades, etc., útiles para los análisis de los datos empresariales. El grupo de los atributos de dimensión es donde agrupa las características de datos como proveedor,...

Acceder a esta publicación

Creado y Compartido por: Carlos Arturo Herrera Lugo / Disponibilidad Laboral: PartTime + Carta Presentación

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

DATAWAREHOUSE: concentra los datos de la empresa, indistintamente del sistema que provengan, ni las características de configuración que tengan los mismos. Para configurar un Datawarehouse se realiza un proceso ETL (Extracción, Transformación y Carga). MODELOS DE DATAWAREHOUSE ESTRELLA CLÁSICO Es el modelo más utilizado en DB de datos relacionales. Clasifica los datos en dos grupos: Los Hechos (FACT). Valores o medidas. La tabla de hechos contiene los datos centrales Los atributos de dimensión. Caractéristicas ESTRELLA EXTENDIDO No almacena los datos en tabla de dimensiones sino en tablas específicas de atributos, textos y jerarquías. Todas éstas...

Acceder a esta publicación

Creado y Compartido por: Julio Genaro Ponciano Mantilla

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

-Datawarehouse: almacén de datos. Tiene todos los datos de una empresa, indistintamente su fuente de origen, obtenidos a través de procesos ETL. -KPI (indicadores clave de rendimiento): indicador que mide el éxito de una empresa o negocio.BI es un proceso que permite a las empresas dar apoyo en la toma de decisiones, apoyándose en estos indicadores KPI. -Modelos de Datawarehouse:. Estrella clásico: Comúnmente usado en bases de datos relacionales. Dos tipos de datos: hechos(o medidas) y atributos. La tabla de hechos contiene los datos centrales para el análisis de datos empresarial. Estrella extendido: No almacena datos maestros dentro de las dimensiones, sino que lo hace en las tablas...

Acceder a esta publicación

Creado y Compartido por: Patricia Garrido Campillo

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Introduccion al Datawarehouse Qué es un Datawarehouse? es un almacén de datos, busca obtener los datos de una empresa en un mismo lugar. En el proceso de un DataWarehouse es necesario el ETL(Extracción, Transformación y Carga) Los modelos de un Datawarehouse pueden ser diferentes, acá se enfocan en dos que es el Modelo de Estrella Clásico y el Modelo Estrella Extendido. El modelo de estrella clásico se utiliza para bases de datos relacionales, utiliza un diseño normalizado, clasifica dos grupos de datos, uno son las FACT y la otra las Dimensiones. En la tabla de hechos o FACT contine los datos para un análisis empresarial, que se compone de las metricas y mediciones. ...

Acceder a esta publicación

Creado y Compartido por: Bayron Teodoro Chocochic Ramos / Disponibilidad Laboral: FullTime + Carta Presentación

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

INTRODUCCION AL DATAWAREHOUSE 1. Que es y para que sirve un datawarehouse? -Datawarehouse (almacenamiento de datos) : Busca tener todos los datos de una empresa en un mismo lugar que ayude a la toma de decisiones -Para armar un datawarehouse se realiza un ETL (extraction, transformation and loading) -Es preciso concluir que BI permite a las empresas dar apoyo entorno a la toma de decisones mediante los indicadores KPI (Key Performance Indicators) 2. Modelos de datawarehouse 2.1 Modelo de estrella clasico: es el que se utiliza normalmente en las BD relacionales, esto se clasifica en dos grupos: -Los Hechos: son las medidas (cantidades) -Los atributos de Dimensiones: caracteristicas (clientes, materiales) 2.2 Modelo de estrella extendida...

Acceder a esta publicación

Creado y Compartido por: Vicmar Matilde Fernandez Medina

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 79.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!