Modos de Agregación
Cuando se trabaja con medidas básicas es necesario definir que modo de agregación o acumulación se utilizará. En el caso de las medidas derivadas no es necesario, ya que éstas medidas se calculan para cada nivel de la jerarquía correspondiente a cada dimensión.
Los modos de agregación o métodos de acumulación disponibles son:
Modo | Descripción |
---|---|
Suma | La suma de todos los valores del nivel inmediatamente inferior. |
Máximo | El valor máximo del nivel inmediatamente inferior. |
Mínimo | El valor mínimo del nivel inmediatamente inferior. |
Promedio | El promedio de todos los valores de las tuplas correspondientes a los nodos del nivel inmediatamente inferior a este. |
Promedio Ponderado | Es el promedio ponderado según el campo indicado de la fuente de datos. Por ejemplo, pensemos en el promedio de venta de los artículos. |
Cantidad | La cantidad de elementos (tuplas) correspondientes a las hojas del subárbol considerado. |
Promedio Transcurrido | Es una agregación especifica para medidas que implican tiempo. |
Desviación Estándar Poblacional | Ejemplos en el siguiente tutorial de funciones estadísticas |
Ejemplo
Considere un nivel de jerarquía con tres elementos (hojas) E1, E2 y E3, y el nivel superior con el elemento ET.
Consideremos también que las hojas se construyeron a partir de 5 registros de la fuente de datos.
La siguiente es la expresión usada en cada modo de agregación al calcular el valor t del elemento ET:
Modo | Expresión |
---|---|
Suma | t = (a + b + c) |
Máximo | t = Max(a, b, c) |
Mínimo | t = Min(a, b, c) |
Promedio | t = ((a + b + c) / 5) (es decir Sum / Cantidad) |
Cantidad | t = 5 |
Promedio Ponderado | Si el campo usado para el cálculo tiene valores P1, P2 y P3 para cada elemento E1, E2 y E3 respectivamente: t = ((a*P1 + b*P2 + c*P3) / (P1 + P2 + P3)) |
Dependencias de Dimensiones Fecha
Es posible definir distintos tipos de dependencias de dimensiones fecha:
Ultimo | Toma el último valor del período del nivel inmediatamente inferior. |
---|---|
Ultimo Dinámico | Toma el valor del nivel inmediatamente inferior correspondiente al último período para el que hay datos. |
Primero | Toma el valor del primer período del nivel inmediatamente inferior. |
Primero Dinámico | Toma el valor del nivel inmediatamente inferior correspondiente al primer período para el que hay datos. |
Promedio | Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de hojas de la dimensión Fecha comprendidas por la consulta. |
Promedio de Hijos | Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de "hijos", en la dimensión Fecha, comprendidas por la consulta, es decir nodos del nivel inmediato inferior. |
Primero con Datos | |
Último con Datos |
Supongamos que se tiene una dimensión fecha con una jerarquía en tres niveles, que incluyen Año, trimestre y Mes.
La figura de la izquierda muestra un ejemplo para el año 2003 donde v1 a v4 representan los valores cargados de las fuentes de datos para la medida Inventario.
Los valores para los niveles superiores de la jerarquía se calculan por el método de agregación elegido.
La siguiente tabla muestra los valores tomados por la medida para los diferentes tipos de dependencias existentes de acuerdo con el ejemplo mostrado en la figura.
Tipo de Dependencia | Valores | Explicación |
---|---|---|
Primero | Primer Trimestre = NaN Segundo Trimestre = Abril (v3) Año 2003 = Primer Trimestre = NaN | No existe valor para Enero que sería el primer período del Primer Trimestre, por lo que el valor para el Primer Trimestre es NaN. Luego el valor para el año 2003 es igual al valor del Primer Trimestre, debido a que corresponde al primer período del año. |
Último | Primer Trimestre = Marzo (v2) Segundo Trimestre = Junio (NaN) Año 2003 = NaN | El valor del Primer Trimestre es igual al valor de Marzo (v2), debido a que Marzo es el último período de dicho Trimestre |
Primero Dinámico | Primer trimestre = Febrero (v1) Segundo Trimestre = Abril (v3) Año 2003 = Primer Trimestre | El valor del Primer Trimestre es igual al valor del mes de Febrero (v1) que es el primer período del Trimestre que tiene datos. |
Último Dinámico | Primer Trimestre = Marzo (v2) Segundo Trimestre = Mayo (v4) Año 2003 = Segundo Trimestre | El valor del Primer Trimestre es igual al valor del último período del Trimestre para el cual hay datos que es Marzo (v2). |
Promedio | Primer Trimestre = (v1 + v2) / 2 Segundo Trimestre = (v3 + v4) / 2 Año 2003 = (v1 + v2 + v3 + v4) / 4 | El valor del Primer Trimestre es la suma de los valores de los elementos dividido la cantidad de hojas que es dos. |
Promedio de Hijos | Primer Trimestre = (v1 + v2) / 2 Segundo Trimestre = (v3 + v4) / 2 Año 2003 = (v1 + v2 + v3 + v4) / 2 | Es similar al caso anterior con la diferencia que se divide entre la cantidad de hijos, por lo que para el Año la cantidad por la que se divide es 2. |
Nota
Para el cálculo del promedio, se consideran los nodos creados en el momento de construir el cubo, que contienen datos distintos de cero.
Desviación Estándar Poblacional
Función | Descripción | Algoritmo |
---|---|---|
Desviación Estándar Poblacional | Medida de la variación de los datos en relación a su promedio poblacional. En la práctica es más utilizada que la varianza ya que tiene la misma unidad de medida que los datos originales |