El pasado día miércoles 25 de mayo, se publicó en versión Preview la posibilidad de crear datamarts en el servicio de Microsoft Power BI.

Por refrescar un poco un datamart es una versión específica del almacén de datos centrados (DWH) en un área de negocio de una empresa u organización. Son subconjuntos de datos con el propósito de ayudar a que un área específica del negocio para el autoservicio de datos y la consiguiente mejora en la toma de decisiones.

Hace unos años, no tantos, los orígenes de datos consolidados eran creados por los equipos de IT de las organizaciones, pudiendo estos tardar meses en entregar al usuario de negocio las modificaciones solicitadas en el dataset. Esto conllevaba y conlleva (lo digo por experiencia propia) a que los usuarios solemos recurrir a la creación de nuestros propios datamarts con bases de datos en Access, ficheros Excel en local o en la nube… Provocando un bonito batiburrillo.

Una vez cargados todos los datos en un datamart, podemos definir relaciones y políticas para la gestión empresarial y el análisis. Al crear un datamart, estamos creando un dataset que lo podemos usar para crear informes y paneles para explotar esa información.

Una vez que he hablado un poco para contextualizar, vamos a meternos en harina con nuestro primer datamart en Power BI.

 

 Creación de un Datamart.

 

Para crear un datamart, lo primero que debemos disponer es de una licencia PPU (Premium Por Usuario) o PPC (Premium por Capacidad) y disponer de un área de trabajo de Power BI Premium Gen 2. Aquí os dejo un link si queréis investigar un poco más que es Power BI Gen2.

En el área de trabajo Premium Gen2, pulsamos sobre el botón “Nuevo” y en el desplegable que se nos abre, podemos ver la opción “Datamart (Versión preliminar).

 

 

 

Pulsamos y esperamos a que se cree el datamart. Según la bibliografía de Microsoft tarda aproximadamente 20 segundos pero en mi caso no han sido más de 10 segundos por lo que no os preocupéis si véis que tardar un poquito.

Obtención y transformación de datos.

En la pantalla que se nos ha abierto, disponemos de 3 conectores de datos y la opción de “Obtener datos de otra fuente”. Para este caso, elijo conectarmente a un archivo Excel con los datos de AdventureWorks.

 

  

 

 

 

A continuación, podemos elegir el origen de este libro Excel, vincularlo desde la nube o bien cargar el archivo desde alguna carpeta de nuestro equipo. ATENCIÓN: Al elegir esta segunda opción, el archivo se carga en nuestra cuenta de OneDrive.

 

 

 

Una vez subido el archivo, iniciamos sesión con nuestra cuenta y a continuación pulsamos en Siguiente.

Después se nos abre la clásica ventana de Power Query para seleccionar las tablas/datos a cargar al datamart. Seleccionamos las tablas y automáticamente visualizamos una previsualización de los datos que contienen las tablas.  Seleccionamos los datos y pulsamos sobre “Transformar datos”.

 

 

 

Y a continuación se nos abre la ventana de Power Query para realizar nuestras transformaciones.

 

 

 

Algo muy importante e interesante que nos permite la creación de los datamarts, es el plegado de consultas, que nos indica si lo mantenemos con nuestras transformaciones o no. El plegado de consultas es la capacidad de una consulta de Power Query de generar una instrucción de consulta única que recupera y transforma los datos de origen. Para más información sobre el plegado de consultas, os dejo aquí la información.

 

 

  

Una vez realizado nuestro proceso de calidad del dato, pulsamos sobre Guardar y esperamos a que se nos carguen los datos al datamart.

¿Os resulta familiar el proceso? Es un proceso prácticamente calcado al Power BI Desktop ¿A qué sí?

En la pantalla que se nos queda, disponemos de lo siguiente:

Una barra de cinta con las siguientes opciones:

 


Grupo Datos:

  • Obtener datos
  • Transformar datos
  •  Especificar datos

Grupo Análisis

  • New Query

Grupo Cálculos

  • Nueva medida

Seguridad

  • Administrar roles
  • Ver como

 

También disponemos de un panel lateral con los objetos del datamart que son las tablas.

 

 

En la parte central, vemos los datos que contienen las tablas y en la parte inferior nos da un feedback del número de columnas, filas y el tiempo que ha tardado en cargarla. Esta opción me parece muy interesante para analizar los tiempos de carga de las tablas.

 

 

Y por último, y no menos importante, tenemos unas opciones en la parte inferior similares y con alguna novedad a Power BI Desktop, que son para el análisis del datamart.

  

Análisis del datamart

El icono de vista Diseño nos permite crear una consulta arrastrando una o varias tablas desde el Explorador hasta el lienzo de manera que nos permite generar una infinidad de posibilidades de cara a consultar y analizar los datos fácilmente. Por ejemplo, realizando JOINs de las tablas que disponemos en el modelo sin disponer de conocimientos de lenguaje SQL.

Por ejemplo, arrastramos la tabla Sales y Reseller al lienzo:

 

 

Y desde la cinta de opciones disponemos de las distintas posibilidades:

 

 

 

Para este caso, vamos a realizar un JOIN entre ambas tablas para que en la tabla Sales este el Business Type en nuestra tabla de hechos. Por lo que seleccionamos la opción “Combinar Consultas como nuevas”

  

 


Hay algunas cosas que hay que tener en cuenta sobre el editor de consultas visuales:

  • Solo puede escribir DQL (no DDL o DML).
  • Actualmente solo se admite un subconjunto de operaciones de Power Query que admiten el plegado de consultas.
  • Actualmente no se puede guardar una consulta ni abrir la consulta visual en Excel
  • SQL Editor de Power Query

Otro punto a favor desde mi punto de vista, el SQL Editor de Power Query nos permite escribir consultas mediante T-SQL que incluye IntelliSense. Esto nos permite realizar un análisis de los datos del dataset sin necesidad de tener el SQL Management Studio instalado para poder realizar las consultas.

Una vez ejecutada la consulta, pulsamos sobre el botón “Ejecutar” para lanzar la consulta. A modo ejemplo, ejecutamos la siguiente consulta:

SELECT *

FROM Customer

WHERE City=’YORK’

Insisto que es a modo de ejemplo, ya que no es una buena práctica realizar un SELECT *. 

  


Hay algunas cosas que hay que tener en cuenta sobre el editor de consultas visuales:

  • Solo puede escribir DQL (no DDL o DML).
  • Actualmente no se admite guardar consultas


Vista Modelo

Esta vista no difiere en nada de la vista de modelo de Power BI. Aquí podemos realizar las relaciones entre nuestras tablas, la clasificación de nuestros datos, generar las disposiciones,… 

  


Una vez comentado brevemente las opciones de los datamarts, está la siguiente pregunta, ¿qué diferencia tenemos con los dataflows? Los dataflows nos aportan procesos de ETL (Extracción, Transformación y Carga). Las tablas no se pueden consultar ni explorar sin un dataset. Los dataflow son óptimos cuando necesitamos datos reutilizables y compartibles para diferentes informes de Power BI

En cambio, los datamarts, son una base de datos que nos permite almacenar y explotar los datos en una base de relacional. Tienen compatibilidad con Azure SQL y SQL Server (en otro post nos adentraremos en la conexión de los datarmart a SQL Server Management). También disponen los datamarts como hemos comentado de un diseñador de consultas visuales son código, RLS y generación automática de datasets.

En definitiva, los datamarts hay que usarlos para:

  • Ordenar, filtrar, realizar una agregación simple visualmente o a través de expresiones definidas en SQL
  • Para las salidas que son resultados, conjuntos, tablas y tablas filtradas de datos
  • Proporcionar datos accesibles a través de un punto de conexión de SQL
  • Habilitar a los usuarios que no tienen acceso a Power BI Desktop

Además, los datamart admiten las canalizaciones de implementación de Power BI Services.

 

Resumiendo... Los datamarts en Power BI, para mi día a día y con escasos dos días de uso, ¡han venido para quedarse!.


¡Nos vemos en los datos!