fbpx
Wikipedia

Esquema en estrella

En las bases de datos usadas para data warehousing, un esquema en estrella es un modelo de datos que tiene una tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada de las tablas de dimensiones. Este aspecto, de tabla de hechos (o central) más grande rodeada de radios o tablas más pequeñas es lo que asemeja a una estrella, dándole nombre a este tipo de construcciones.

Ejemplo de modelo de datos en estrella.

Las tablas de dimensiones tendrán siempre una clave primaria simple, mientras que en la tabla de hechos, la clave principal estará compuesta por las claves principales de las tablas dimensionales.

Modelo

El esquema estrella separa los datos del proceso de negocios en: hechos y dimensiones. Los hechos contienen datos medibles, cuantitativos, relacionados con la transacción del negocio, y las dimensiones son atributos que describen los datos indicados en los hechos (una especie de meta-datos, o sea datos que describen otros datos).

Tabla de Hechos

La tabla de hechos registra medidas o métricas de un evento específico. (definición de evento: suceso que se da en un punto determinado del tiempo). Por ejemplo un evento puede ser: Un cliente compra: 5 pares de zapatillas marca: Nike, modelo: Pegasus II, número: 28, color: gris y negro, el día: 25 de mayo de 2010 a la hora: 19:48 h en la Sucursal: Acoite 1200, Caballito, Capital México, el Vendedor fue: Romulo Pérez. Esto es un evento, o sea un suceso (una venta) que se da en un punto determinado del tiempo.

Las tablas de hechos generalmente consisten de valores numéricos (datos asociados específicamente con el evento), y claves foráneas que referencian a tablas de datos dimensionales que guardan información descriptiva. (en el ejemplo de la transacción de venta de zapatillas, hay datos que, por ser repetitivos, es necesario proyectar la tabla y hacer una tabla aparte -tabla de dimensiones- que mantengan estos datos, pues es redundante poner en cada evento, los datos completos de la dirección de la sucursal donde tuvo lugar el evento, en su lugar, se pone un identificador de sucursal y ese identificador es una clave foránea, que hace referencia a una tabla de dimensiones, donde se guardan los datos de todas las sucursales, cada una con una clave primaria, a la cual hace referencia la clave foránea de la tabla de hechos. Adicionalmente, en caso de que la sucursal se mude, solo será necesario hacer un solo cambio en la base de datos -en la tabla de dimensiones, donde figura la dirección de la sucursal que se muda- y no hay que hacerlo en la tabla de hechos, en cada transacción que se efectuó en esa sucursal)

Las tablas de hechos se diseñan para contener detalles uniformes a bajo nivel (referidos como "granularidad" o "grano"), o sea que los hechos pueden registrar eventos a un gran nivel de atomicidad. Esto puede resultar en la acumulación de un gran número de registros en la tabla de hechos, a lo largo del tiempo. Tablas de hechos se definen como una de los siguientes tres tipos:

  • Tablas de hechos transaccionales registran hechos relativos a eventos específicos (por ejemplo, el evento de una venta)
  • Tablas de hechos Snapshot registran hechos en un punto dado en el tiempo -con un intervalo específico para realizar la medición sobre la entidad objeto de observación- (por ejemplo, Detalles de una cuenta al final del mes)
  • Tablas Snapshot Acumulativas registran hechos agregados -acumulados- a un punto dado en el tiempo (por ejemplo, ventas totales mensuales para un producto dado)

Las tablas de hechos generalmente tienen asignada una surrogate key para asegurar que cada fila puede ser identificada de forma unívoca.

Ejemplos de datos hechos incluyen: precio de venta, cantidad vendida, fecha y hora de venta, distancia, velocidad, y medidas de peso. Ejemplos de atributos dimensionales relacionados incluyen: modelo de producto, color del producto, tamaño del producto, localización geográfica y nombre del vendedor que realizó la venta.

Tabla de dimensiones

Las tablas de dimensiones generalmente tienen un bajo número de registros, en comparación a las tablas de hechos, pero cada registro puede tener un gran número de atributos para describir los datos del hecho. Las Dimensiones pueden definir una amplia variedad de características, algunos de los atributos más comunes definidos en las tablas de dimensiones incluyen:

  • Tablas de tiempo, describen el tiempo al más pequeño nivel de granularidad de tiempo para el cual los eventos se registran en el esquema estrella.
  • Tablas de dimensión Geográficas describen datos de localización, tales como país, region, provincia, estado, o ciudad.
  • Tablas de dimensión de Productos describen los productos
  • Tablas de dimensiones de Empleados describen los empleados, por ejemplo, los vendedores
  • Tablas de dimensión de Rangos, describen rangos de tiempo, valores de dólar, u otras cantidades medibles para simplificar los reportes.

La tablas de Dimensiones generalmente tienen asignada una surrogate primary key, usualmente una columna simple de tipo de dato entero, que mapea a la combinación de atributos de dimensiones que forman la clave natural.

Razones a favor del esquema en estrella

Este esquema es ideal por su simplicidad y velocidad para ser usado en análisis multidimensionales (OLAP, Datamarts, EIS, ...). Permite acceder tanto a datos agregados como de detalle.

El diseño de esquemas en estrella permite implementar la funcionalidad de una base de datos multidimensional utilizando una clásica base de datos relacional (más extendidas que las multidimensionales).

Otra razón para utilizar los esquemas en estrella es su simplicidad desde el punto de vista del usuario final. Las consultas no son complicadas, ya que las condiciones y las uniones (JOIN) necesarias solo involucran a la tabla de hechos y a las de dimensiones, no haciendo falta que se encadenen uniones y condiciones a dos o más niveles como ocurriría en un esquema en copo de nieve. En la mayoría de los casos son preferibles los de estrellas por su simplicidad respecto a los de copo de nieve por ser más fáciles de manejar.

Finalmente, es la opción con mejor rendimiento y velocidad pues permite indexar las dimensiones de forma individualizada sin que repercuta en el rendimiento de la base de datos en su conjunto.

Ejemplo

Considerar una base de datos de 'ventas' (de una cadena de grandes almacenes) clasificados por fecha, almacén y producto.

TH_ventas es la tabla de hechos, y tiene tres dimensiones, representadas por la tablas D_fecha, D_almacen, y D_producto.

Cada tabla de dimensión tiene una clave primaria denominada id. En la tabla de hechos TH_ventas los campos clave de las tablas de dimensión aparecerán como clave ajena (id_fecha, id_almacen e id_producto) y todos juntos formarán la clave principal de dicha tabla.

Otras columnas de datos incluidas en las tablas descritas serían:

  • TH_ventas.unidades_vendidas
  • D_fecha.año
  • D_almacen.país
  • D_producto.categoría
  • D_producto.marca

La siguiente instrucción SQL obtendría cómo han sido vendidos algunos conjuntos de televisores, para cada marca y país, en el año 2006.

SELECT P.marca, A.pais, SUM(TH.unidades_vendidas) FROM TH_ventas TH INNER JOIN D_fecha F ON F.id = TH.id_fecha INNER JOIN D_almacen A ON A.id = TH.id_almacen INNER JOIN D_producto P ON P.id = TH.id_producto WHERE F.anyo = 2006 AND P.categoria = 'tv' GROUP BY P.marca, A.pais 

Este ejemplo ilustra cómo se realizaría un análisis de datos a partir del esquema diseñado

Véase también

Referencias

  •   Datos: Q1331138

esquema, estrella, bases, datos, usadas, para, data, warehousing, esquema, estrella, modelo, datos, tiene, tabla, hechos, tabla, fact, contiene, datos, para, análisis, rodeada, tablas, dimensiones, este, aspecto, tabla, hechos, central, más, grande, rodeada, r. En las bases de datos usadas para data warehousing un esquema en estrella es un modelo de datos que tiene una tabla de hechos o tabla fact que contiene los datos para el analisis rodeada de las tablas de dimensiones Este aspecto de tabla de hechos o central mas grande rodeada de radios o tablas mas pequenas es lo que asemeja a una estrella dandole nombre a este tipo de construcciones Ejemplo de modelo de datos en estrella Las tablas de dimensiones tendran siempre una clave primaria simple mientras que en la tabla de hechos la clave principal estara compuesta por las claves principales de las tablas dimensionales Indice 1 Modelo 1 1 Tabla de Hechos 1 2 Tabla de dimensiones 2 Razones a favor del esquema en estrella 3 Ejemplo 4 Vease tambien 5 ReferenciasModelo EditarEl esquema estrella separa los datos del proceso de negocios en hechos y dimensiones Los hechos contienen datos medibles cuantitativos relacionados con la transaccion del negocio y las dimensiones son atributos que describen los datos indicados en los hechos una especie de meta datos o sea datos que describen otros datos Tabla de Hechos Editar Articulo principal Tabla de hechos La tabla de hechos registra medidas o metricas de un evento especifico definicion de evento suceso que se da en un punto determinado del tiempo Por ejemplo un evento puede ser Un cliente compra 5 pares de zapatillas marca Nike modelo Pegasus II numero 28 color gris y negro el dia 25 de mayo de 2010 a la hora 19 48 h en la Sucursal Acoite 1200 Caballito Capital Mexico el Vendedor fue Romulo Perez Esto es un evento o sea un suceso una venta que se da en un punto determinado del tiempo Las tablas de hechos generalmente consisten de valores numericos datos asociados especificamente con el evento y claves foraneas que referencian a tablas de datos dimensionales que guardan informacion descriptiva en el ejemplo de la transaccion de venta de zapatillas hay datos que por ser repetitivos es necesario proyectar la tabla y hacer una tabla aparte tabla de dimensiones que mantengan estos datos pues es redundante poner en cada evento los datos completos de la direccion de la sucursal donde tuvo lugar el evento en su lugar se pone un identificador de sucursal y ese identificador es una clave foranea que hace referencia a una tabla de dimensiones donde se guardan los datos de todas las sucursales cada una con una clave primaria a la cual hace referencia la clave foranea de la tabla de hechos Adicionalmente en caso de que la sucursal se mude solo sera necesario hacer un solo cambio en la base de datos en la tabla de dimensiones donde figura la direccion de la sucursal que se muda y no hay que hacerlo en la tabla de hechos en cada transaccion que se efectuo en esa sucursal Las tablas de hechos se disenan para contener detalles uniformes a bajo nivel referidos como granularidad o grano o sea que los hechos pueden registrar eventos a un gran nivel de atomicidad Esto puede resultar en la acumulacion de un gran numero de registros en la tabla de hechos a lo largo del tiempo Tablas de hechos se definen como una de los siguientes tres tipos Tablas de hechos transaccionales registran hechos relativos a eventos especificos por ejemplo el evento de una venta Tablas de hechos Snapshot registran hechos en un punto dado en el tiempo con un intervalo especifico para realizar la medicion sobre la entidad objeto de observacion por ejemplo Detalles de una cuenta al final del mes Tablas Snapshot Acumulativas registran hechos agregados acumulados a un punto dado en el tiempo por ejemplo ventas totales mensuales para un producto dado Las tablas de hechos generalmente tienen asignada una surrogate key para asegurar que cada fila puede ser identificada de forma univoca Ejemplos de datos hechos incluyen precio de venta cantidad vendida fecha y hora de venta distancia velocidad y medidas de peso Ejemplos de atributos dimensionales relacionados incluyen modelo de producto color del producto tamano del producto localizacion geografica y nombre del vendedor que realizo la venta Tabla de dimensiones Editar Articulo principal Tabla de dimension Las tablas de dimensiones generalmente tienen un bajo numero de registros en comparacion a las tablas de hechos pero cada registro puede tener un gran numero de atributos para describir los datos del hecho Las Dimensiones pueden definir una amplia variedad de caracteristicas algunos de los atributos mas comunes definidos en las tablas de dimensiones incluyen Tablas de tiempo describen el tiempo al mas pequeno nivel de granularidad de tiempo para el cual los eventos se registran en el esquema estrella Tablas de dimension Geograficas describen datos de localizacion tales como pais region provincia estado o ciudad Tablas de dimension de Productos describen los productos Tablas de dimensiones de Empleados describen los empleados por ejemplo los vendedores Tablas de dimension de Rangos describen rangos de tiempo valores de dolar u otras cantidades medibles para simplificar los reportes La tablas de Dimensiones generalmente tienen asignada una surrogate primary key usualmente una columna simple de tipo de dato entero que mapea a la combinacion de atributos de dimensiones que forman la clave natural Razones a favor del esquema en estrella EditarEste esquema es ideal por su simplicidad y velocidad para ser usado en analisis multidimensionales OLAP Datamarts EIS Permite acceder tanto a datos agregados como de detalle El diseno de esquemas en estrella permite implementar la funcionalidad de una base de datos multidimensional utilizando una clasica base de datos relacional mas extendidas que las multidimensionales Otra razon para utilizar los esquemas en estrella es su simplicidad desde el punto de vista del usuario final Las consultas no son complicadas ya que las condiciones y las uniones JOIN necesarias solo involucran a la tabla de hechos y a las de dimensiones no haciendo falta que se encadenen uniones y condiciones a dos o mas niveles como ocurriria en un esquema en copo de nieve En la mayoria de los casos son preferibles los de estrellas por su simplicidad respecto a los de copo de nieve por ser mas faciles de manejar Finalmente es la opcion con mejor rendimiento y velocidad pues permite indexar las dimensiones de forma individualizada sin que repercuta en el rendimiento de la base de datos en su conjunto Ejemplo EditarConsiderar una base de datos de ventas de una cadena de grandes almacenes clasificados por fecha almacen y producto TH ventas es la tabla de hechos y tiene tres dimensiones representadas por la tablas D fecha D almacen y D producto Cada tabla de dimension tiene una clave primaria denominada id En la tabla de hechos TH ventas los campos clave de las tablas de dimension apareceran como clave ajena id fecha id almacen e id producto y todos juntos formaran la clave principal de dicha tabla Otras columnas de datos incluidas en las tablas descritas serian TH ventas unidades vendidas D fecha ano D almacen pais D producto categoria D producto marcaLa siguiente instruccion SQL obtendria como han sido vendidos algunos conjuntos de televisores para cada marca y pais en el ano 2006 SELECT P marca A pais SUM TH unidades vendidas FROM TH ventas TH INNER JOIN D fecha F ON F id TH id fecha INNER JOIN D almacen A ON A id TH id almacen INNER JOIN D producto P ON P id TH id producto WHERE F anyo 2006 AND P categoria tv GROUP BY P marca A pais Este ejemplo ilustra como se realizaria un analisis de datos a partir del esquema disenadoVease tambien EditarAlmacen de datos Base de datos relacional Cubo OLAP Esquema en copo de nieve OLAP ROLAP Tabla de dimension Tabla de hechosReferencias EditarDarmawikarta Djoni 2007 Dimensional Data Warehousing with MySQL Pub BrainySoftware ISBN 0 9752128 2 6 Datos Q1331138Obtenido de https es wikipedia org w index php title Esquema en estrella amp oldid 137002488, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos