Cuando empiezas a trabajar con datos en un Lakehouse, llega un momento en el que guardar información ya no es suficiente. Los datos empiezan a crecer, llegan desde distintos orígenes, con distintas calidades y con necesidades muy diferentes según quién los vaya a consumir.

Y ahí aparece un problema bastante habitual: si todo acaba en el mismo sitio, pero sin orden, al final tienes datos… pero no tienes una arquitectura.

Ahí es donde entra el diseño medallion en Microsoft Fabric. No como una moda ni como una etiqueta bonita, sino como una forma práctica de organizar, refinar y preparar los datos para que puedan usarse de verdad.


Qué es la arquitectura medallion

La arquitectura medallion es un patrón de organización de datos dentro de un Lakehouse que estructura la información en capas según su nivel de refinamiento.

La idea es sencilla: los datos no pasan de origen a informe directamente. Van evolucionando por etapas.

Normalmente esas etapas son tres:

  • Bronce, donde aterrizan los datos en crudo
  • Plata, donde se validan y limpian
  • Oro, donde se preparan para consumo analítico o de negocio

No estamos hablando tanto de un modelo de datos como de un marco de trabajo para ordenar la transformación y mejorar la calidad a medida que los datos avanzan.


Capa Bronce

La capa Bronce es la puerta de entrada.

Aquí llegan los datos tal y como vienen del origen, ya sean estructurados, semiestructurados o no estructurados. Es la zona de aterrizaje, el punto donde guardas la información sin tocarla o tocándola lo mínimo imprescindible para que entre.

El objetivo de esta capa no es embellecer ni modelar. Es conservar el dato original, mantener trazabilidad y disponer de una base fiable desde la que poder rehacer procesos si hace falta.

En otras palabras: aquí no se busca perfección, se busca preservar el origen.


Capa Plata

La capa Plata es donde empieza el trabajo serio de limpieza y validación.

Aquí los datos se transforman para ganar calidad y consistencia. Se eliminan duplicados, se revisan valores nulos, se combinan fuentes, se corrigen estructuras y se dejan preparados para usos posteriores.

Esta capa suele convertirse en un repositorio bastante importante dentro de una organización, porque ya no estás trabajando con el dato en bruto, pero todavía no has llegado a la capa pensada para consumo de negocio.

La lógica aquí debe centrarse en depuración, estandarización y coherencia. No en modelado analítico.


Capa Oro

La capa Oro es la capa de consumo.

Aquí los datos ya están refinados y se preparan específicamente para necesidades de análisis, reporting, ciencia de datos o casos de uso concretos.

En esta fase es donde tiene sentido:

  • agregar a determinados niveles de granularidad
  • enriquecer con otras fuentes
  • construir estructuras pensadas para negocio
  • modelar en estrella para reporting

Es decir, la capa Oro no es simplemente “datos más limpios”. Es datos listos para ser usados.

Y esto es importante, porque aquí ya no se trabaja pensando solo en el dato, sino en quién lo va a consumir y para qué.


Una arquitectura flexible, no una cárcel

Aunque lo habitual es hablar de Bronce, Plata y Oro, la arquitectura medallion no tiene por qué quedarse ahí.

Puede haber más capas si el caso lo necesita. Algunas organizaciones añaden capas intermedias, capas de aterrizaje previas o incluso capas adicionales más refinadas para dominios muy concretos.

Lo importante no es el nombre exacto de las capas, sino la idea que hay detrás: organizar el ciclo de vida del dato para que gane calidad y utilidad a medida que avanza.

Es una arquitectura flexible. Y precisamente por eso funciona tan bien.


Movimiento de datos entre capas

Una vez tienes clara la estructura, la siguiente pregunta es evidente: ¿cómo se mueven los datos entre esas capas?

En Fabric, esto puede hacerse de varias maneras, y aquí conviene distinguir dos conceptos que a veces se mezclan:

  • transformación de datos
  • orquestación de datos

Transformar significa cambiar el dato: limpiarlo, combinarlo, validarlo o adaptarlo.

Orquestar significa coordinar procesos: decidir cuándo se ejecutan, en qué orden y con qué dependencias.

Para transformar, Fabric ofrece principalmente flujos de datos Gen2 y notebooks. Para orquestar, la herramienta clave son las canalizaciones.

Y esa diferencia importa, porque no todo proceso necesita la misma herramienta.


Cómo implementar una arquitectura medallion en Fabric

Llevar esta arquitectura a la práctica en Fabric implica tomar varias decisiones.

Primero, definir la base: si vas a trabajar con un único Lakehouse o con varios. Dependiendo del caso, puede tener sentido separar dominios, capas o incluso workspaces.

Después, diseñar el flujo:

  • cómo entra el dato en Bronce
  • cómo se transforma hacia Plata
  • cómo se construye Oro

La implementación más habitual es bastante clara:

  • Bronce como capa de aterrizaje
  • Plata como capa validada y estandarizada
  • Oro como capa de presentación y análisis

Y aquí hay un matiz importante: la capa Oro debería estar modelada pensando en consumo analítico, normalmente con enfoque dimensional y optimizada para reporting.


Herramientas para construir cada capa

Fabric permite usar distintas herramientas según el perfil del equipo y la complejidad del proceso.

Los flujos de datos Gen2 encajan bien en transformaciones más simples y equipos cómodos con Power Query. Los notebooks son mejor opción cuando el volumen crece o la lógica se complica. Y las canalizaciones son la capa perfecta para automatizar y coordinar todo el flujo.

Esto hace que la arquitectura medallion no sea solo un dibujo bonito. Es algo que puedes bajar a tierra usando herramientas concretas dentro de Fabric.


Consumo de datos en la capa Oro

Una vez que la capa Oro está construida, llega la parte que más suele interesar a negocio: consumir los datos.

En Fabric esto puede hacerse de varias formas. Se puede consultar la capa Oro mediante el punto de conexión SQL Analytics, usar T-SQL para explorar tablas Delta, crear vistas o incluso aplicar seguridad SQL sobre ese consumo.

También se puede trabajar con modelos semánticos de Power BI, incluidos modelos en modo Direct Lake, donde el acceso se hace directamente sobre las tablas Delta del Lakehouse.

Y aquí está una de las grandes ventajas del enfoque: los datos ya están preparados para análisis sin necesidad de volver a transformarlos en la parte final.


Varias capas Oro para distintas necesidades

No tiene por qué existir una única capa Oro.

De hecho, muchas veces lo más sensato es tener varias, adaptadas a diferentes audiencias o dominios. Finanzas puede necesitar una capa Oro distinta a ventas. Ciencia de datos puede necesitar otra más orientada a entrenamiento de modelos. Incluso puede haber una capa Oro pensada para herramientas externas o integraciones concretas.

Esto refuerza una idea importante: la arquitectura medallion no obliga a un único destino. Permite múltiples salidas, siempre que partan de una base ordenada.


Seguridad y gobernanza

Cuando organizas los datos por capas, también puedes organizar mejor la seguridad.

No todo el mundo necesita acceso a todo. Y aquí la separación entre Bronce, Plata y Oro ayuda bastante.

La capa Bronce suele ser más restringida, porque contiene datos crudos y potencialmente sensibles. La capa Plata puede abrirse a más perfiles internos, según el nivel de trabajo colaborativo. Y la capa Oro suele ser la capa más orientada al consumo, pero idealmente con permisos mínimos y controlados.

Fabric permite gestionar esto con permisos a nivel de workspace o de elemento. Además, se puede reforzar con prácticas de gobernanza y políticas alineadas con el equipo de seguridad de la organización.

Porque una arquitectura bien diseñada no solo organiza datos. También organiza quién puede hacer qué con ellos.


CI/CD e integración con Git

Si la arquitectura medallion va a formar parte de una solución seria, la capa técnica no termina en la transformación de datos. También hay que pensar en despliegues, control de versiones y evolución del entorno.

Y aquí entra CI/CD.

Fabric incorpora integración con Git, lo que permite versionar, colaborar, trabajar con ramas y mantener un historial claro de cambios. Esto es especialmente importante en entornos donde la capa Oro alimenta reporting o procesos críticos, porque cualquier cambio debe estar controlado.

Automatizar despliegues, incorporar controles de calidad y mantener trazabilidad en la evolución del proyecto no es un extra. Es parte de una arquitectura madura.


Conclusión

La arquitectura medallion no es solo una forma elegante de hablar de Bronce, Plata y Oro. Es una forma de imponer orden donde, si no se hace nada, acaba apareciendo el caos.

Permite separar responsabilidades, mejorar la calidad del dato por fases y preparar una capa final realmente útil para análisis, reporting o ciencia de datos. Y dentro de Fabric encaja especialmente bien, porque la plataforma ya ofrece las piezas necesarias para implementarla de forma natural.