Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Migration of unmigrated content due to installation of a new plugin
Wiki Markup
{scrollbar}

 

Cuando se trabaja con medidas básicas es necesario definir que modo de agregación o acumulación se utilizará. En el caso de las medidas derivadas no es necesario, ya que éstas medidas se calculan para cada nivel de la jerarquía correspondiente a cada dimensión.

Los modos de agregación o métodos de acumulación disponibles son:

Modo

Descripción

Suma

La suma de todos los valores del nivel inmediatamente inferior.

Máximo

El valor máximo del nivel inmediatamente inferior.

Mínimo

El valor mínimo del nivel inmediatamente inferior.

Promedio

El promedio de todos los valores de las tuplas correspondientes a los nodos del nivel inmediatamente inferior a este.
Se consideran todas las tuplas presentes en la fuente de datos y no las tuplas creadas en la construcción del cubo.

Promedio Ponderado

Es el promedio ponderado según el campo indicado de la fuente de datos. Por ejemplo, pensemos en el promedio de venta de los artículos.
Tenemos que la venta bruta es Precio*Cantidad. El promedio ponderado de venta todos los articulos) es:
(Precio * Cantidad) / Cantidad.
Para definir una medida como promedio ponderado de A segun B, definimos: Sumatoria(A * B) / Sumatoria (B)

Cantidad

La cantidad de elementos (tuplas) correspondientes a las hojas del subárbol considerado.
Se consideran todas las tuplas presentes en la fuente de datos y no las tuplas creadas en la construcción del cubo

Promedio Transcurrido

Es una agregación especifica para medidas que implican tiempo.
Por ejemplo en el caso de tareas nos permite consultar el tiempo medio de duración de las mismas.

Desviación Estándar Poblacional

Ver Ejemplos en el siguiente tutorial de funciones estadísticas.

...

Ejemplo

Considere un nivel de jerarquía con tres elementos (hojas) E1, E2 y E3, y el nivel superior con el elemento ET.

Consideremos también que las hojas se construyeron a partir de 5 registros de la fuente de datos.

La siguiente es la expresión usada en cada modo de agregación al calcular el valor t del elemento ET:

Modo

Expresión

Suma

t = (a + b + c)

Máximo

t = Max(a, b, c)

Mínimo

t = Min(a, b, c)

Promedio

t = ((a + b + c) / 5) (es decir Sum / TotalCantidad)

Cantidad

t = 5

Promedio Ponderado

Si el campo usado para el cálculo tiene valores P1, P2 y P3 para cada elemento E1, E2 y E3 respectivamente: t = ((a*P1 + b*P2 + c*P3) / (P1 + P2 + P3))

...

Es posible definir distintos tipos de dependencias de dimensiones fecha:

Ultimo

...

Toma el último valor del período del nivel inmediatamente inferior.

Ultimo Dinámico

...

Toma el valor del nivel inmediatamente inferior correspondiente al último período para el que hay datos.
A diferencia de la opción anterior que toma el valor correspondiente al último periodo independientemente de que exista información.

Primero

...

Toma el valor del primer período del nivel inmediatamente inferior.

Primero Dinámico

...

Toma el valor del nivel inmediatamente inferior correspondiente al primer período para el que hay datos.
A diferencia de la opción anterior que toma el valor correspondiente al primer período independientemente de que exista información.

Promedio

...

Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de hojas de la dimensión Fecha comprendidas por la consulta.

Promedio de Hijos

...

Toma el valor correspondiente al elemento según la agregación y lo divide entre la cantidad de "hijos", en la dimensión Fecha, comprendidas por la consulta, es decir nodos del nivel inmediato inferior.

Primero con Datos

...

...

Último con Datos

...

...


Supongamos que se tiene una dimensión fecha con una jerarquía en tres niveles, que incluyen Año, trimestre y Mes.

...

La siguiente tabla muestra los valores tomados por la medida para los diferentes tipos de dependencias existentes de acuerdo con el ejemplo mostrado en la figura.

Tipo de Dependencia

Valores

Explicación

Primero

Code Block
Primer Trimestre = NaN


Segundo Trimestre = Abril (v3)


Año 2003 = Primer Trimestre = NaN

No existe valor para Enero que sería el primer período del Primer Trimestre, por lo que el valor para el Primer Trimestre es NaN. Luego el valor para el año 2003 es igual al valor del Primer Trimestre, debido a que corresponde al primer período del año.
El valor del Segundo Trimestre es igual al valor de Abril (v3), debido a que es el primer período del Segundo Trimestre.

Último

Code Block
Primer Trimestre = Marzo (v2)


Segundo Trimestre = Junio (NaN)


Año 2003 = NaN

El valor del Primer Trimestre es igual al valor de Marzo (v2), debido a que Marzo es el último período de dicho Trimestre
El valor del Segundo Trimestre sería igual al valor del mes de Junio, y como no hay valores es NaN.
Por último el valor del año 2003 es NaN debido a que sería igual al valor del Cuarto Trimestre para el cual no existen datos.

Primero Dinámico

Code Block
Primer trimestre = Febrero (v1)


Segundo Trimestre = Abril (v3)


Año 2003 = Primer Trimestre

El valor del Primer Trimestre es igual al valor del mes de Febrero (v1) que es el primer período del Trimestre que tiene datos.
El valor del Segundo Trimestre es igual al valor del mes de Abril (v3) que es el primer período del Trimestre.
El valor del año 2003 es igual al valor del Primer Trimestre que es el primer período del año para el cual existen datos.

Último Dinámico

Code Block
Primer Trimestre = Marzo (v2)


Segundo Trimestre = Mayo (v4)


Año 2003 = Segundo Trimestre

El valor del Primer Trimestre es igual al valor del último período del Trimestre para el cual hay datos que es Marzo (v2).
Del mismo modo el valor del Segundo Trimestre es igual al valor del mes de Mayo (v4).
El valor del año 2003 es igual al valor del último período del año para el cual hay datos que es el Segundo Trimestre.

Promedio

Code Block
Primer Trimestre = (v1 + v2) / 2


Segundo Trimestre = (v3 + v4) / 2


Año 2003 = (v1 + v2 + v3 + v4) / 4

El valor del Primer Trimestre es la suma de los valores de los elementos dividido la cantidad de hojas que es dos.
El valor del Segundo Trimestre es la suma de los valores de sus elementos dividido la cantidad de hojas que es dos.
Por ultimo el valor del año se calcula en forma similar, donde en este caso la cantidad de hojas es 4

Promedio de Hijos

Code Block
Primer Trimestre = (v1 + v2) / 2


Segundo Trimestre = (v3 + v4) / 2


Año 2003 = (v1 + v2 + v3 + v4) / 2

Es similar al caso anterior con la diferencia que se divide entre la cantidad de hijos, por lo que para el Año la cantidad por la que se divide es 2.

...

Warning
titleNota

Para el cálculo del promedio, se consideran los nodos creados en el momento de construir el cubo, que contienen datos distintos de cero.

Desviación Estándar Poblacional

Anchor
desvp
desvp

Función

Descripción

Algoritmo

Desviación Estándar Poblacional

Medida de la variación de los datos en relación a su promedio poblacional. En la práctica es más utilizada que la varianza ya que tiene la misma unidad de medida que los datos originales

Image Added

Wiki Markup
{scrollbar}

Child pages (Children Display)