Fuentes de Datos de Texto

Las Fuentes de Datos de Texto permiten obtener información de archivos ASCII. Estos deben contener un registro por fila, y columnas para cada uno de los campos correspondientes al registro. El acceso a estas Fuentes de Datos proporciona un medio para extraer los datos desde cualquier sistema sin acceso directo vía JDBC/ODBC.

Se describe a continuación:

  • Los pasos básicos para agregar este tipo de fuentes de datos a un modelo.
  • El panel de propiedades con sus cuatro secciones (Descripción, General, Campos e InputSets).
  • Los pasos necesarios para la definición completa de fuentes de datos de texto.

Definiendo las Fuentes de Datos de Texto

Use los comandos Agregar Archivo o Insertar Archivo para definir una fuente de datos de texto.
Para definir Fuentes de Datos de Texto, es necesario estar ubicado en la rama "Sistema de Archivos" dentro de Fuentes, o en cualquiera de las Fuentes de Datos de Texto ya definidas.

Para definir una fuente de datos de texto:

  1. Seleccione la rama Fuentes en el Árbol de Diseño.
  2. Seleccione la rama Fuente de Datos de Texto.
  3. Agregue un archivo con las posibilidades:
    • Para agregar una fuente de datos a continuación de las fuentes de datos existentes, seleccione el comando Agregar Archivo.
      La fuente de datos se agrega y aparece el Panel de Propiedades para la misma.
    • Para insertar una fuente de datos a continuación de otra existente, elija la fuente de datos y seleccione el comando Insertar Archivo.
      La fuente de datos se agrega y aparece el Panel de Propiedades para la misma.
  4. Complete la información en la sección Descripción, General e Input Set del Panel de Propiedades.
  5. Después de definir la fuente de datos de texto, agregue campos a la definición.

Panel de Propiedades de Fuentes de Datos de Texto

El panel de propiedades para las fuentes de datos de texto incluye cuatro secciones:

  • Descripción
  • General
  • Campos
  • Input Sets

Sección de Descripción

Propiedad

Descripción

Nombre

Ingrese el nombre de la fuente de datos.

Descripción

Ingrese una descripción de la fuente de datos.

Sección General

Propiedad

Descripción

Dimensión

Marque esta casilla para indicar que la Fuente de Datos contiene información para usar en la creación de Dimensiones (esto establece que dicha fuente de datos será usada durante la fase de Construcción de Metadata). El módulo de construcción de datamarts, O3 Builder, usa esta información para decidir si la fuente es relevante para la creación de Dimensiones o si es solamente una fuente de Medidas.

Verificar Antes de la Construcción

Marque esta casilla para verificar la existencia del archivo en el directorio especificado antes de proceder con la construcción del datamart. Si la verificación falla, el proceso de construcción se interrumpe con el siguiente status de finalización: UNAVAILABLE SOURCE: <nombre de fuente>.
Es posible definir una acción de construcción para este status. Ver Sección de Acción de Construcción.

Ruta de Acceso

Defina el nombre de archivo y ruta de acceso para la Fuente de Datos o presione el botón Explorar y use el diálogo Explorar Archivos para seleccionar la ruta de acceso y el nombre de archivo.
Es posible usar un parámetro para la ruta o el nombre de archivo. Los modelos de ejemplo que se distribuyen con la instalación de O3 cuentan con este mecanismo de definición de parámetros para que las fuentes de datos no queden dependiendo de la ruta de instalación o la plataforma en la que se instala el producto.

Separador de Decimales

Ingrese el separador de decimales usado en los archivos fuente, o seleccione uno de la lista desplegable.

Formato de Archivo

Indique si el formato de archivo es de campos de ancho fijo o si el archivo tiene delimitadores. Si se trata de un archivo delimitado, se debe indicar el delimitador de campos seleccionando uno de la lista o creando uno personalizado.
Para la definición de campos basada en archivos de formato de ancho fijo, la numeración de los caracteres comienza en 1. No es necesario indicar cuál es ese ancho fijo.
También debe tenerse en cuenta que el orden en que se definen los campos, debe coincidir con el orden de los campos en el archivo.

Saltear Líneas

Cuando se extraen datos de una fuente para el datamart, es posible excluir un número determinado de líneas iniciales en el archivo. En general, es recomendable incluir los nombres de archivo en la primera línea de los mismos, para simplificar su definición usando el Completado Automático (autollenado).
En este caso, la opción indica que la primera línea debe saltearse ya que no contiene datos, sino posiblemente corresponda a los nombres de los campos.

Tuplas por Registro

Indica que un número "n" de tuplas debe generarse en el datamart desde cada registro de fuente de datos. El valor por defecto es 1. Ver Acerca de Tuplas por Registro.



Sección de Definición de Campos

Propiedad

Descripción

Campos

Use el botón Nuevo para agregar un nuevo campo, indicando las columnas del archivo, esto es, los campos de registro para usar luego en la definición de Dimensiones y Medidas. Para cada campo, declare su nombre, el número de columna dentro del archivo y el tipo de datos que contiene. Cuando seleccione un nombre para el campo, recuerde que todas las referencias al campo que se hagan durante la definición del modelo usarán dicho nombre. Los tipos de datos son: String, Integer, Double y Date. Notar que para el caso del tipo Date existen varios formatos.
También es posible eliminar un campo seleccionándolo y presionando el botón Eliminar.

Autollenado

Use la opción de completado automático para completar los campos con los números de columna correspondientes. Los valores de campo en la primera fila del archivo se usarán como nombres de campo. Todos los tipos de datos se determinarán como String por defecto. Una vez que haya completado automáticamente los campos, puede personalizar la configuración de la Fuente de Datos cambiando los nombres y revisando los tipos de datos.

Vista Previa

Use el botón Vista Preliminar para ver el contenido de la fuente de texto. Esta función sólo muestra los primeros registros del archivo.

Tabla Local

Si marca la casilla Tabla Local, el panel de propiedades se actualiza para incluir las columnas Clave e Incluir Campo para cada campo. Es posible ingresar el nombre de tabla. Es necesario indicar para cada campo si es parte de la tabla y si es parte de su clave. Ver Acerca de Tablas Locales.


Hay varios formatos de fecha disponibles para los campos de fechas. Asegúrese de que el formato de fecha seleccionado se corresponda con el contenido del archivo de texto.

Por ejemplo:

  • DD/MM/YY es Día/Mes/Año
  • DDMMYY es DíaMesAño
  • MM/DD/YYYY es Mes/Día/Año



Sección Input Sets

Propiedad

Descripción

Input Set

Se muestra una lista de Input Sets. Marque la casilla para que los Input Sets incluyan la fuente de datos actual. Ver Definiendo Input Sets



Agregando Campos a una Fuente de Datos de Texto

Después de agregar una fuente de datos de texto, es necesario definir los campos en la fuente.

Para agregar campos a una fuente de datos de texto:

  1. Seleccionar la rama Fuentes del Árbol de Diseño.
  2. Seleccionar la rama Fuente de Datos de Texto.
  3. Seleccionar la pestaña Campos del Panel de Propiedades.
  4. Para completar automáticamente los campos, seleccione el botón Autollenado. Los campos se llenan y es posible editarlos.
    Es necesario en este caso modificar el tipo del campo cargado en forma automática.
  5. Para agregar un campo, presione el botón Nuevo Campo. Una nueva fila se agrega a la tabla. Recordar que es preferible utilizar la opción de Autollenado para minimizar los errores.
  6. Complete los campos de Nombre, Número y Tipo de Campo.

(warning) Use el botón Vista Preliminar para tener una vista previa del contenido de la fuente de texto. Esta función sólo muestra los primeros registros del archivo.