01_Ingesta de datos con flujos de datos Gen2 en Microsoft Fabric

¿Alguna vez te has encontrado con datos repartidos por todos lados? Un Excel por aquí, una base de datos por allá, una API que nadie sabe muy bien cómo funciona… y tú en medio intentando darle sentido a todo eso. Pues justo ahí es donde entran los flujos de datos Gen2 en Microsoft Fabric.

Porque sí, analizar datos está muy bien, pero antes hay que hacer algo mucho menos glamuroso: traerlos, limpiarlos y dejarlos listos. Y cuando esto se hace de forma manual, ya sabemos lo que pasa… tiempo, errores y procesos difíciles de mantener.

¿Qué son realmente los flujos de datos?

Un flujo de datos no deja de ser un proceso ETL en la nube. Es decir, una forma de extraer datos de distintos orígenes, transformarlos y cargarlos en un destino listo para ser consumido. La diferencia es que aquí todo esto se hace de forma visual, con Power Query Online, sin necesidad de escribir código.

Pero lo realmente interesante no es solo que puedas transformar datos, sino que esa lógica se guarda. No tienes que repetir el proceso una y otra vez. Lo haces una vez, lo reutilizas y lo mantienes centralizado. Y esto, en entornos donde los datos cambian constantemente, marca la diferencia.

Bajándolo a tierra

Imagina una empresa con tiendas en varios países. Cada una trabaja con sus propios sistemas, sus propios formatos y sus propias reglas. Si quisieras consolidar toda esa información para construir un modelo semántico en Power BI, hacerlo manualmente sería inviable.

Aquí es donde los flujos de datos Gen2 encajan perfectamente. Te conectas a todos esos orígenes, limpias los datos, los transformas y los dejas preparados en un destino común, como un Lakehouse. A partir de ahí, ya puedes construir encima con garantías.

Cómo encajan en la arquitectura

Una de las cosas interesantes de los flujos de datos es que no hay una única forma de usarlos. Puedes utilizarlos como un ETL clásico, donde transformas y cargas directamente los datos en el destino. Pero también puedes combinarlos con canalizaciones de datos y trabajar en un enfoque más ELT: primero cargas, luego transformas.

Incluso puedes usarlos como una capa reutilizable. Preparas los datos una vez y diferentes modelos semánticos consumen esa misma base. Menos duplicidad, más control y, sobre todo, más coherencia.

Lo que te vas a encontrar cuando trabajes con ellos

Si has usado Power Query en Power BI, esto te va a resultar muy familiar. Tienes una interfaz donde conectas orígenes, aplicas transformaciones y ves en todo momento qué está pasando con los datos.

Cada transformación queda registrada como un paso. Puedes modificarlo, reordenarlo o eliminarlo. Puedes ver una vista previa de los datos mientras trabajas y, si quieres ir más allá, tienes acceso al código M desde el editor avanzado.

Además, puedes representar visualmente el flujo de transformaciones, ver cómo se conectan las consultas y entender mejor qué está ocurriendo en cada momento. Esto, cuando los procesos crecen, se agradece bastante.

¿Y después qué?

Una vez transformados los datos, puedes cargarlos en distintos destinos dentro del entorno: Lakehouse, almacenes o bases de datos SQL. Pero donde realmente gana fuerza es cuando lo combinas con canalizaciones.

Las canalizaciones te permiten orquestar todo el proceso. Ejecutar el flujo de datos, lanzar otros procesos después, automatizar ejecuciones… en definitiva, convertir algo manual en un proceso controlado y repetible.

Y esto, en entornos empresariales, no es un “nice to have”, es una necesidad.

Ventajas… y también límites

Los flujos de datos Gen2 aportan mucho valor: reutilización, consistencia, simplificación de orígenes y una capa de transformación accesible incluso para perfiles menos técnicos. Pero no son la solución a todo.

No sustituyen a un Data Warehouse, no tienen seguridad a nivel de fila y requieren capacidad de Fabric. Es importante entender qué problema resuelven… y cuál no.

Conclusión

Los flujos de datos Gen2 vienen a cubrir una parte que muchas veces está descuidada: la preparación del dato. Ni es lo más vistoso ni lo más comentado, pero es donde se construye la base de todo.

Te ayudan a ordenar, estandarizar y reutilizar. A quitar fricción en el proceso. A que los datos lleguen en condiciones al modelo.

Pero, como siempre, la herramienta no hace el trabajo por ti.
Si no entiendes los datos, si no defines bien las transformaciones, el problema sigue ahí… solo que ahora con una interfaz más bonita.