Modos de Agregación

Unknown macro: {scrollbar}

 

Cuando se trabaja con medidas básicas es necesario definir que modo de agregación o acumulación se utilizará. En el caso de las medidas derivadas no es necesario, ya que éstas medidas se calculan para cada nivel de la jerarquía correspondiente a cada dimensión.

Los modos de agregación o métodos de acumulación disponibles son:

Modo

Descripción

Suma

La suma de todos los valores del nivel inmediatamente inferior.

Máximo

El valor máximo del nivel inmediatamente inferior.

Mínimo

El valor mínimo del nivel inmediatamente inferior.

Promedio

El promedio de todos los valores de las tuplas correspondientes a los nodos del nivel inmediatamente inferior a este.
Se consideran todas las tuplas presentes en la fuente de datos y no las tuplas creadas en la construcción del cubo.

Promedio Ponderado

Es el promedio ponderado según el campo indicado de la fuente de datos. Por ejemplo, pensemos en el promedio de venta de los artículos.
Tenemos que la venta bruta es Precio*Cantidad. El promedio ponderado de venta todos los articulos) es:
(Precio * Cantidad) / Cantidad.
Para definir una medida como promedio ponderado de A segun B, definimos: Sumatoria(A * B) / Sumatoria (B)

Cantidad

La cantidad de elementos (tuplas) correspondientes a las hojas del subárbol considerado.
Se consideran todas las tuplas presentes en la fuente de datos y no las tuplas creadas en la construcción del cubo

Promedio Transcurrido

Es una agregación especifica para medidas que implican tiempo.
Por ejemplo en el caso de tareas nos permite consultar el tiempo medio de duración de las mismas.

Desviación Estándar Poblacional

Ejemplos en el siguiente tutorial de funciones estadísticas

Ejemplo

Considere un nivel de jerarquía con tres elementos (hojas) E1, E2 y E3, y el nivel superior con el elemento ET.

Consideremos también que las hojas se construyeron a partir de 5 registros de la fuente de datos.

La siguiente es la expresión usada en cada modo de agregación al calcular el valor t del elemento ET:

Modo

Expresión

Suma

t = (a + b + c)

Máximo

t = Max(a, b, c)

Mínimo

t = Min(a, b, c)

Promedio

t = ((a + b + c) / 5) (es decir Sum / Cantidad)

Cantidad

t = 5

Promedio Ponderado

Si el campo usado para el cálculo tiene valores P1, P2 y P3 para cada elemento E1, E2 y E3 respectivamente: t = ((a*P1 + b*P2 + c*P3) / (P1 + P2 + P3))

Dependencias de Dimensiones Fecha

Es posible definir distintos tipos de dependencias de dimensiones fecha:

Ultimo

Toma el último valor del período del nivel inmediatamente inferior.

Ultimo Dinámico

Toma el valor del nivel inmediatamente inferior correspondiente al último período para el que hay datos.
A diferencia de la opción anterior que toma el valor correspondiente al último periodo independientemente de que exista información.

Primero

Toma el valor del primer período del nivel inmediatamente inferior.

Primero Dinámico

Toma el valor del nivel inmediatamente inferior correspondiente al primer período para el que hay datos.
A diferencia de la opción anterior que toma el valor correspondiente al primer período independientemente de que exista información.

Promedio

Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de hojas de la dimensión Fecha comprendidas por la consulta.

Promedio de Hijos

Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de "hijos", en la dimensión Fecha, comprendidas por la consulta, es decir nodos del nivel inmediato inferior.

Primero con Datos

Ver Agregación para Saldos

Último con Datos

Ver Agregación para Saldos


Supongamos que se tiene una dimensión fecha con una jerarquía en tres niveles, que incluyen Año, trimestre y Mes.

La figura de la izquierda muestra un ejemplo para el año 2003 donde v1 a v4 representan los valores cargados de las fuentes de datos para la medida Inventario.

Los valores para los niveles superiores de la jerarquía se calculan por el método de agregación elegido.

La siguiente tabla muestra los valores tomados por la medida para los diferentes tipos de dependencias existentes de acuerdo con el ejemplo mostrado en la figura.

Tipo de Dependencia

Valores

Explicación

Primero

Primer Trimestre = NaN
Segundo Trimestre = Abril (v3)
Año 2003 = Primer Trimestre = NaN

No existe valor para Enero que sería el primer período del Primer Trimestre, por lo que el valor para el Primer Trimestre es NaN. Luego el valor para el año 2003 es igual al valor del Primer Trimestre, debido a que corresponde al primer período del año.
El valor del Segundo Trimestre es igual al valor de Abril (v3), debido a que es el primer período del Segundo Trimestre.

Último

Primer Trimestre = Marzo (v2)
Segundo Trimestre = Junio (NaN)
Año 2003 = NaN

El valor del Primer Trimestre es igual al valor de Marzo (v2), debido a que Marzo es el último período de dicho Trimestre
El valor del Segundo Trimestre sería igual al valor del mes de Junio, y como no hay valores es NaN.
Por último el valor del año 2003 es NaN debido a que sería igual al valor del Cuarto Trimestre para el cual no existen datos.

Primero Dinámico

Primer trimestre = Febrero (v1)
Segundo Trimestre = Abril (v3)
Año 2003 = Primer Trimestre

El valor del Primer Trimestre es igual al valor del mes de Febrero (v1) que es el primer período del Trimestre que tiene datos.
El valor del Segundo Trimestre es igual al valor del mes de Abril (v3) que es el primer período del Trimestre.
El valor del año 2003 es igual al valor del Primer Trimestre que es el primer período del año para el cual existen datos.

Último Dinámico

Primer Trimestre = Marzo (v2)
Segundo Trimestre = Mayo (v4)
Año 2003 = Segundo Trimestre

El valor del Primer Trimestre es igual al valor del último período del Trimestre para el cual hay datos que es Marzo (v2).
Del mismo modo el valor del Segundo Trimestre es igual al valor del mes de Mayo (v4).
El valor del año 2003 es igual al valor del último período del año para el cual hay datos que es el Segundo Trimestre.

Promedio

Primer Trimestre = (v1 + v2) / 2
Segundo Trimestre = (v3 + v4) / 2
Año 2003 = (v1 + v2 + v3 + v4) / 4

El valor del Primer Trimestre es la suma de los valores de los elementos dividido la cantidad de hojas que es dos.
El valor del Segundo Trimestre es la suma de los valores de sus elementos dividido la cantidad de hojas que es dos.
Por ultimo el valor del año se calcula en forma similar, donde en este caso la cantidad de hojas es 4

Promedio de Hijos

Primer Trimestre = (v1 + v2) / 2
Segundo Trimestre = (v3 + v4) / 2
Año 2003 = (v1 + v2 + v3 + v4) / 2

Es similar al caso anterior con la diferencia que se divide entre la cantidad de hijos, por lo que para el Año la cantidad por la que se divide es 2.

Nota

Para el cálculo del promedio, se consideran los nodos creados en el momento de construir el cubo, que contienen datos distintos de cero.

Desviación Estándar Poblacional

Función

Descripción

Algoritmo

Desviación Estándar Poblacional

Medida de la variación de los datos en relación a su promedio poblacional. En la práctica es más utilizada que la varianza ya que tiene la misma unidad de medida que los datos originales

Unknown macro: {scrollbar}