sábado, 20 de junio de 2020

Conjuntos de datos

Hola, ¿que tal?, aqui estoy.

Continuando con las opciones nuevas que nos ofrece Cognos Analytics, hoy quiero hablar sobre los conjuntos de datos, una opción muy interesante que nos puede ayudar mucho a la hora de que nuestros informes se ejecuten en el menor tiempo posible.

¿Qué es un conjunto de datos en Cognos?

En pocas palabras, un conjunto de datos es un tipo de fuente de datos en Cognos Analytics que contiene datos extraídos de una o más fuentes y almacenados dentro del sistema Cognos como un archivo parquet de Apache.

En este link puedes leer todo acerca de este tipo de archivos https://parquet.apache.org/


Los conjuntos de datos nos ofrecen una opción de procesamiento de datos en memoria para Cognos Analytics

El archivo de parquet se carga en la memoria del servidor de aplicaciones en tiempo de ejecución según sea necesario. Esto (generalmente) mejora el rendimiento interactivo para los usuarios finales al tiempo que reduce la carga en las bases de datos de origen. Cuando se combinan
con los módulos de datos,disponemos de capacidades como tiempo relativo automático, preparación fácil de datos y creación de tablas personalizadas que son muy interesantes a la hora de preparar informes de forma simple y rápida


Los conjuntos de datos también son extremadamente fáciles de construir a partir de los paquetes existentes de Framework Manager o Transformer, lo que los convierte en una excelente opción para aprovechar al máximo los modelos heredados de Cognos 10. 

De hecho, este es probablemente el caso de uso n. ° 1 para la tecnología Data Set y es la forma más rápida de modernizar su entorno y convertir a Cognos en una máquina de preparación y visualización de datos rápida.

Cómo construir un conjunto de datos

La creación de un conjunto de datos es simple, especialmente si tiene disponibles los modelos Framework Manager o Transformer en Cognos. Los conjuntos de datos se pueden construir sobre modelos existentes o módulos de datos.. 

Crear un conjunto de datos es un proceso sencillo, Crear un conjunto de datos es tan simple como arrastrar columnas al objeto de la lista, guardar y cargar datos. Por supuesto, hay opciones adicionales que puede aprovechar y que explico a continuación.


1.- Vista de origen: Aqui tenemos las tablas y campos en su fuente de datos

2.- Lista de datos: La tabla de datos muestra una vista en vivo del conjunto de datos a medida que lo construye. Consulta nuevos datos a medida que realiza cambios

3.- Barra de herramientas: La barra de herramientas a pedido aparece cuando hace clic en una columna, lo que le permite filtrar y ordenar.


  • 4.-Filtrado: los filtros ayudan a seleccionar los datos en su conjunto de datos exactamente a lo que necesita. Menos Filas = Mejor Rendimiento.
  • 5.- Clasificación: la clasificación por las columnas más utilizadas en los filtros de informes o dashboards (por ejemplo, datos de tiempo) puede mejorar en gran medida el rendimiento


4.- Definición del elemento de consulta: el elemento de consulta aparece cuando hace doble clic en el encabezado de una columna. Tiene acceso a la funcionalidad del elemento de consulta desde Creación de informes, lo que significa que realmente se pueden realizar muchos cambios con esta ventana emergente.

5.- Vista previa: al desmarcar el botón de vista previa, la tabla de datos cambia al modo de vista previa que desactiva la consulta automática de datos a medida que realiza ajustes en su Conjunto de datos. Esto es interesante para poder realizar el proceso de creación si tenemos muy claro las columnas a añadir, pues cada vez que añadimos datos se realiza la consulta de nuevo y puede resultar molesto esperar cada vez que añadimos columnas.

6.- Resumen y supresión de filas: la función de resumen acumula sus datos al nivel más alto de granularidad, por ejemplo, acumulando datos diarios hasta el mes. La supresión de filas en los conjuntos de datos solo se aplica a las fuentes de datos dimensionales y hace lo mismo que usar la supresión de filas en la creación de informes, es decir elimina aquellas filas que no tienen datos.

Una vez que haya importados los datos, configurados los filtros, establecidas clasificaciones y resúmenes y tal vez agregadando algunos cálculos, es hora de los siguientes pasos guardar, cargar e implementar el conjunto de datos.


Guardar y cargar un conjunto de datos

Los conjuntos de datos deben guardarse y cargarse para que estén disponibles


Cuando se guarda un conjunto de datos, está la opción "Guardar y cargar datos". Esto permite seleccionar un directorio en Cognos para alojar el objeto del conjunto de datos. También genera la consulta para recuperar datos y llenar el archivo parquet. Este archivo se almacena en Cognos y se carga en la memoria a pedido cuando los usuarios acceden al Conjunto de datos. En unas semanas publicaré un artículos detallado para comprender que es lo que sucede durante la creación y consulta del conjunto de datos

Programación y gestión de conjuntos de datos

Los conjuntos de datos solo contienen datos de la última carga; es una buena práctica acostumbrarse a programar y comprobar conjuntos de datos para asegurarse de que contengan datos relevantes y continúen funcionando bien.

Opciones de programación

La pantalla de propiedades Conjunto de datos contiene la información que necesita para mantener de manera efectiva datos actualizados. En la parte superior de la ventana, tenemos la última fecha de carga del conjunto de datos, mientras que al expandir "avanzado" se muestra lo siguiente



Tamaño: el tamaño comprimido del archivo de parquet en el disco

Número de filas: el número de filas en su conjunto de datos. Esto puedo puede afectar al rendimiento si el numero de filtas es de decenas de millones, por ejemplo, en ese caso el rendimiento del conjunto de datos puede no ser excelente.

Número de columnas: el número de columnas del conjunto de datos. Los ficheros parquet son almacenados columnarmente con lo que no hay límite de columnas, simplemente no incluya columnas que no necesita

Tiempo de actualización: el tiempo que tarda el conjunto de datos en cargar

Actualizado por: el nombre de la persona que actualizó por última vez el conjunto de datos

Lo bueno de los conjuntos de datos de Cognos es que al cargar de antemano el procesamiento, puede crear un conjunto de resultados complejo que lleva horas cargar pero ofrece un tiempo de respuesta de menos de un segundo a los usuarios finales.

Resumen

Obviamente, esta tecnología no puede reemplazar todas las tareas de ETL, sin embargo, son una opción para transformaciones de complejidad baja a media. Son sin duda una opción para simplificar rápidamente la presentación o mejorar el rendimiento 

No hay comentarios:

Publicar un comentario

Como visualizar un Funnel en un cuadro de mando y como mejorarlo

Hoy quiero hablar sobre la visualización de un Funnel en un cuadro de mando y como mejorar esta visualización con algunas ideas que he estad...