Modos de Agregación

Unknown macro: {scrollbar}

Cuando se trabaja con medidas básicas es necesario definir que modo de agregación o acumulación se utilizará. En el caso de las medidas derivadas no es necesario, ya que éstas medidas se calculan para cada nivel de la jerarquía correspondiente a cada dimensión.

Los modos de agregación o métodos de acumulación disponibles son:

Modo	Descripción
Suma	La suma de todos los valores del nivel inmediatamente inferior.
Máximo	El valor máximo del nivel inmediatamente inferior.
Mínimo	El valor mínimo del nivel inmediatamente inferior.
Promedio	El promedio de todos los valores de las tuplas correspondientes a los nodos del nivel inmediatamente inferior a este. Se consideran todas las tuplas presentes en la fuente de datos y no las tuplas creadas en la construcción del cubo.
Promedio Ponderado	Es el promedio ponderado según el campo indicado de la fuente de datos. Por ejemplo, pensemos en el promedio de venta de los artículos. Tenemos que la venta bruta es PrecioCantidad. El promedio ponderado de venta todos los articulos) es: (Precio Cantidad) / Cantidad. Para definir una medida como promedio ponderado de A segun B, definimos: Sumatoria(A * B) / Sumatoria (B)
Cantidad	La cantidad de elementos (tuplas) correspondientes a las hojas del subárbol considerado. Se consideran todas las tuplas presentes en la fuente de datos y no las tuplas creadas en la construcción del cubo
Promedio Transcurrido	Es una agregación especifica para medidas que implican tiempo. Por ejemplo en el caso de tareas nos permite consultar el tiempo medio de duración de las mismas.
Desviación Estándar Poblacional	Ejemplos en el siguiente tutorial de funciones estadísticas

Ejemplo

Considere un nivel de jerarquía con tres elementos (hojas) E1, E2 y E3, y el nivel superior con el elemento ET.

Consideremos también que las hojas se construyeron a partir de 5 registros de la fuente de datos.

La siguiente es la expresión usada en cada modo de agregación al calcular el valor t del elemento ET:

Modo	Expresión
Suma	t = (a + b + c)
Máximo	t = Max(a, b, c)
Mínimo	t = Min(a, b, c)
Promedio	t = ((a + b + c) / 5) (es decir Sum / Cantidad)
Cantidad	t = 5
Promedio Ponderado	Si el campo usado para el cálculo tiene valores P1, P2 y P3 para cada elemento E1, E2 y E3 respectivamente: t = ((aP1 + bP2 + c*P3) / (P1 + P2 + P3))

Dependencias de Dimensiones Fecha

Es posible definir distintos tipos de dependencias de dimensiones fecha:

Ultimo	Toma el último valor del período del nivel inmediatamente inferior.
Ultimo Dinámico	Toma el valor del nivel inmediatamente inferior correspondiente al último período para el que hay datos. A diferencia de la opción anterior que toma el valor correspondiente al último periodo independientemente de que exista información.
Primero	Toma el valor del primer período del nivel inmediatamente inferior.
Primero Dinámico	Toma el valor del nivel inmediatamente inferior correspondiente al primer período para el que hay datos. A diferencia de la opción anterior que toma el valor correspondiente al primer período independientemente de que exista información.
Promedio	Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de hojas de la dimensión Fecha comprendidas por la consulta.
Promedio de Hijos	Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de "hijos", en la dimensión Fecha, comprendidas por la consulta, es decir nodos del nivel inmediato inferior.
Primero con Datos	Ver Agregación para Saldos
Último con Datos	Ver Agregación para Saldos

Supongamos que se tiene una dimensión fecha con una jerarquía en tres niveles, que incluyen Año, trimestre y Mes.

La figura de la izquierda muestra un ejemplo para el año 2003 donde v1 a v4 representan los valores cargados de las fuentes de datos para la medida Inventario.

Los valores para los niveles superiores de la jerarquía se calculan por el método de agregación elegido.

La siguiente tabla muestra los valores tomados por la medida para los diferentes tipos de dependencias existentes de acuerdo con el ejemplo mostrado en la figura.

Tipo de Dependencia	Valores	Explicación
Primero	Primer Trimestre = NaN Segundo Trimestre = Abril (v3) Año 2003 = Primer Trimestre = NaN	No existe valor para Enero que sería el primer período del Primer Trimestre, por lo que el valor para el Primer Trimestre es NaN. Luego el valor para el año 2003 es igual al valor del Primer Trimestre, debido a que corresponde al primer período del año. El valor del Segundo Trimestre es igual al valor de Abril (v3), debido a que es el primer período del Segundo Trimestre.
Último	Primer Trimestre = Marzo (v2) Segundo Trimestre = Junio (NaN) Año 2003 = NaN	El valor del Primer Trimestre es igual al valor de Marzo (v2), debido a que Marzo es el último período de dicho Trimestre El valor del Segundo Trimestre sería igual al valor del mes de Junio, y como no hay valores es NaN. Por último el valor del año 2003 es NaN debido a que sería igual al valor del Cuarto Trimestre para el cual no existen datos.
Primero Dinámico	Primer trimestre = Febrero (v1) Segundo Trimestre = Abril (v3) Año 2003 = Primer Trimestre	El valor del Primer Trimestre es igual al valor del mes de Febrero (v1) que es el primer período del Trimestre que tiene datos. El valor del Segundo Trimestre es igual al valor del mes de Abril (v3) que es el primer período del Trimestre. El valor del año 2003 es igual al valor del Primer Trimestre que es el primer período del año para el cual existen datos.
Último Dinámico	Primer Trimestre = Marzo (v2) Segundo Trimestre = Mayo (v4) Año 2003 = Segundo Trimestre	El valor del Primer Trimestre es igual al valor del último período del Trimestre para el cual hay datos que es Marzo (v2). Del mismo modo el valor del Segundo Trimestre es igual al valor del mes de Mayo (v4). El valor del año 2003 es igual al valor del último período del año para el cual hay datos que es el Segundo Trimestre.
Promedio	Primer Trimestre = (v1 + v2) / 2 Segundo Trimestre = (v3 + v4) / 2 Año 2003 = (v1 + v2 + v3 + v4) / 4	El valor del Primer Trimestre es la suma de los valores de los elementos dividido la cantidad de hojas que es dos. El valor del Segundo Trimestre es la suma de los valores de sus elementos dividido la cantidad de hojas que es dos. Por ultimo el valor del año se calcula en forma similar, donde en este caso la cantidad de hojas es 4
Promedio de Hijos	Primer Trimestre = (v1 + v2) / 2 Segundo Trimestre = (v3 + v4) / 2 Año 2003 = (v1 + v2 + v3 + v4) / 2	Es similar al caso anterior con la diferencia que se divide entre la cantidad de hijos, por lo que para el Año la cantidad por la que se divide es 2.

Nota

Para el cálculo del promedio, se consideran los nodos creados en el momento de construir el cubo, que contienen datos distintos de cero.

Desviación Estándar Poblacional

Función	Descripción	Algoritmo
Desviación Estándar Poblacional	Medida de la variación de los datos en relación a su promedio poblacional. En la práctica es más utilizada que la varianza ya que tiene la misma unidad de medida que los datos originales

Unknown macro: {scrollbar}