Protocolo estructurado para equipos de BDS: clasificación MECE, mapeo causal y criterios de calidad accionables.
Qué producirás con este protocolo
Una sesión de trabajo de 90 minutos con analistas, experto de dominio y dueño del proceso genera:
• Un mapa causal () de las reglas de negocio principales del dominio.
• La clasificación MECE de cada variable identificada, con su tipo y jerarquía.
• Un registro de variables descartadas y la razón de descarte.
Resultado: variables que emergen del consenso estructurado, no de la disponibilidad espontánea de ejemplos.
I. Problem actual
Por qué el enfoque no estructurado es costoso
La identificación de variables se realiza de forma no estructurada, basada en la disponibilidad de datos dentro de las historias de usuario y en la memoria reciente del analista.
Este enfoque activa el sesgo de disponibilidad (Kahneman, 2011): se seleccionan variables recordadas fácilmente de casos recientes, omitiendo otras estructuralmente relevantes. Las fallas documentadas son:
Variables duplicadas con distintos nombres en distintas reglas o modelos. Falta de jerarquización: no se distingue lo crítico de lo accesorio. Mezcla de variables técnicas, de negocio y métricas en el mismo nivel conceptual. Omisión estructural de variables de contexto o latentes que no aparecen en historias de usuario.
II: Marco de clasificación de variables
Cómo tipificar cada variable antes de medirla
Clasificar antes de medir evita confundir correlación con palanca de negocio. Usar una variable proxy como si fuera causa directa es el error más frecuente y costoso en modelos de negocio.
Regla clave de aplicación
Nunca usar una variable proxy como palanca de acción directa sin validar su relación causal con la variable latente que representa.
Nunca asumir que una variable de contexto puede convertirse en variable de decisión sin rediseño del sistema.
III. Protocolo de identificación
Los 5 pasos obligatorios — con inputs, outputs y responsables
Cada paso tiene un entregable concreto. Un paso está completo cuando su output puede revisarse independientemente del siguiente.
Ejemplo: dominio de conciliacion bancaria
Variables causales: tipo_operacion → monto_esperado → diferencia_neta Variable latente: riesgo_discrepancia (inferida, no observable directamente) Variable de contexto: banco_origen (externa, no modificable) Variable proxy: similitud_referencia (aproxima identidad de transaccion)
Criterio de prioridad
Alta: Variable que, si se omite o mal clasifica, genera decision incorrecta con consecuencia economica directa (fraude no detectado, conciliacion errada, rechazo incorrecto).
Media: Variable que mejora precision pero su omision no genera error critico.
Baja: Variable con varianza marginal o redundante con otra de mayor prioridad.
V. Criterios de calidad
KPIs del proceso con umbrales y frecuencia de revision
Estas métricas miden si el protocolo se está aplicando correctamente. No son opcionales en proyectos de alta criticidad.
V. Decisiones estratégicas
Trade-offs resueltos con postura por defecto
Cada trade-off incluye la recomendación por defecto del equipo BDS y la condicion para desviarse de ella.
Protocolo completo (recomendado)
Con experto de dominio (recomendado)
VI. Cuando aplicar version ligera
Criterio de escalamiento del protocolo
No todo proyecto requiere los 5 pasos completos. El criterio de escalamiento evita sobre-ingenieria y sub-rigor.
Regla de escalamiento
Si el output del proyecto informara una decision que afecta ingresos, margen, capital de trabajo o riesgo operativo: usar version completa. En caso de duda, usar version completa. La inversion es de 90 minutos; el costo del retrabajo es siempre mayor.
Materiales relacionados:
Referencias
DAMA International. (2017). DAMA-DMBOK: Data Management Body of Knowledge (2nd ed.). Technics Publications.
Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.
Pearl, J., Glymour, M., & Jewell, N. P. (2016). Causal Inference in Statistics: A Primer. Wiley.