Estimación de la distribución posterior del voto en la segunda vuelta presidencial del 21 de junio de 2026 mediante inferencia bayesiana jerárquica y calibración con encuestas
Este documento presenta un modelo jerárquico bayesiano BYM2 aplicado a los datos electorales de 1.119 municipios colombianos para predecir el resultado de la segunda vuelta presidencial del 21 de junio de 2026. La estimación mediante MCMC con 3.000 muestras efectivas, combinada con calibración bayesiana por Importance Sampling sobre el promedio ponderado de cinco encuestadoras, produce una predicción con probabilidad de victoria superior al 99% para Abelardo De La Espriella.
El predictor dominante del modelo es el prior electoral histórico — el voto municipal por Gustavo Petro en la primera vuelta de 2022 —, que exhibe una correlación de r=0.977 con el voto por Iván Cepeda en la primera vuelta de 2026, explicando el 95.5% de la varianza territorial del voto. El cambio en el voto izquierdista entre primeras vueltas (2022→2026) actúa como predictor complementario con efecto positivo y estadísticamente significativo (β₄=+0.0475, IC 95%: [+0.0453, +0.0496], P(>0)=1.000).
La validación mediante Bayesian Model Averaging sobre 4.096 especificaciones alternativas confirma que el modelo base es parsimonioso y suficiente. El análisis de sensibilidad con seis escenarios que incorporan factores no observados — mayor participación en Bogotá y presión de grupos armados en zonas rurales — muestra que De La Espriella mantiene la ventaja incluso bajo condiciones de máximo estrés (+12.8pp en el escenario más adverso).
Palabras clave: modelo BYM2, inferencia bayesiana, predicción electoral, econometría espacial, Monte Carlo, Colombia 2026.
JEL: C11, C21, D72, R12.
La segunda vuelta presidencial colombiana del 21 de junio de 2026 enfrenta a Abelardo De La Espriella —candidato de derecha con el 43.74% en primera vuelta— contra Iván Cepeda Castro —candidato del progresismo con el 40.90%—. Un margen inicial de apenas 2.84 puntos porcentuales, combinado con más de quince millones de votos distribuidos entre abstención y terceros candidatos, genera una incertidumbre considerable que justifica el uso de modelos estadísticos rigurosos.
La literatura sobre predicción electoral ha convergido en dos enfoques complementarios: los modelos estructurales basados en fundamentales económicos y políticos (Fair, 1978; Alesina y Rosenthal, 1995) y los modelos de agregación estadística de encuestas (Silver, 2012; Linzer, 2013). Este trabajo adopta un tercer enfoque — los modelos bayesianos espaciales — que aprovecha la estructura territorial del voto para producir predicciones municipio a municipio. Este enfoque es especialmente adecuado para Colombia, donde la geografía política exhibe una extraordinaria persistencia entre ciclos electorales.
La motivación empírica es clara: Colombia tiene un patrón histórico documentado donde las encuestas presenciales subestiman sistemáticamente al candidato outsider o de derecha. En la primera vuelta de 2026, la firma Invamer proyectaba a De La Espriella en 31.6% cuando obtuvo el 43.7% — un error de +12.1 puntos porcentuales. Este sesgo sistemático hace que los modelos basados en patrones históricos del territorio sean una alternativa metodológicamente sólida a las encuestas.
El modelo BYM2 (Besag, York y Mollié, 1991; Riebler et al., 2016) se estima sobre los datos de mesa (MMV) de la Registraduría Nacional del Estado Civil para los 1.119 municipios del universo analítico, representando el 99.99% del escrutinio de la primera vuelta. La Fase 8 del análisis combina la distribución posterior del modelo con el promedio ponderado de cinco encuestadoras mediante Importance Sampling bayesiano, produciendo la predicción final.
El análisis combina cuatro fuentes primarias: los microdatos electorales de la Registraduría Nacional, los datos históricos de 2022, los indicadores territoriales de TerriData DNP y los datos de cinco encuestadoras. La unidad de análisis es el municipio.
La fuente principal son los datos de mesa (MMV) de la Registraduría Nacional del Estado Civil correspondientes a la primera vuelta presidencial del 31 de mayo de 2026. Los datos cubren 22.683.841 votos válidos en 1.122 municipios, de los cuales 1.119 cumplen los criterios de inclusión (censo >200 personas, participación >5% y <100%). Los 3 municipios excluidos tienen datos insuficientes para la estimación.
Para construir el prior histórico se utilizan los resultados de la primera vuelta presidencial de 2022, disponibles para 1.188 municipios. La variable prior Petro 2022 captura la proporción del voto izquierdista en esa elección, que actúa como el predictor dominante del modelo gracias a la extraordinaria continuidad territorial del voto colombiano.
| Fuente | Variable(s) | Cobertura | Período |
|---|---|---|---|
| Registraduría Nacional — MMV 2026 | Votos por candidato, por mesa | 22.7M votos · 1.119 mpios | 31 may 2026 |
| Registraduría Nacional — 2022 | Prior Petro 1V, prior segunda vuelta | 1.188 municipios | may–jun 2022 |
| TerriData DNP — Dim. 26 | Conflicto, coca, minas, víctimas, IICA | 1.045 municipios | 2019–2025 |
| TerriData DNP — Dim. 14 y 19 | Pobreza, NBI, educación, salud | 1.100+ municipios | 2018–2024 |
| Shapefile DANE-IGAC | Geometrías municipales | 1.122 polígonos | 2024 |
| 5 encuestadoras | Intención de voto 2V | Nacional | mayo–jun 2026 |
MMV = datos de mesa (microdatos). Shapefile FIX_MAP: 82 correcciones de nombres Registraduría→DANE para el merge geográfico.
La caracterización estadística de las variables electorales es el punto de partida natural del análisis. La distribución del voto municipal revela la extraordinaria heterogeneidad territorial de Colombia — un rasgo estructural que el modelo BYM2 captura explícitamente.
La variable dependiente del modelo es la proporción del voto por Cepeda en la primera vuelta de 2026, que actúa como predictor del voto en segunda vuelta bajo el supuesto de continuidad electoral. Esta variable tiene una media municipal de 39.2% con una desviación estándar de 22.3 puntos — una dispersión que refleja la profunda polarización territorial del electorado colombiano.
El predictor principal, prior Petro 2022, tiene una media municipal de 34.6%. La diferencia entre ambas medias (+4.6pp) indica que Cepeda superó en promedio a Petro en la primera vuelta de 2026, lo que el modelo captura a través de la variable de cambio (delta_izq).
| Variable | Media | Desv. Est. | Mínimo | p25 | Mediana | p75 | Máximo | N |
|---|---|---|---|---|---|---|---|---|
| yi: Cepeda 2026 — 1ª vuelta | 39.2% | 22.3% | 4.1% | 21.4% | 35.8% | 56.2% | 97.2% | 1.119 |
| xp22: Petro 2022 — 1ª vuelta | 34.6% | 21.9% | 3.8% | 17.1% | 29.4% | 50.8% | 95.1% | 1.119 |
| xchg: Cambio izq. 22→26 (pp) | +4.6pp | 4.8pp | -14.2pp | +2.1pp | +4.1pp | +7.2pp | +28.3pp | 1.119 |
| IP Polarización 2022 (Dapper) | 0.834 | 0.071 | 0.512 | 0.791 | 0.847 | 0.888 | 0.998 | 1.119 |
| IP Polarización 2026 (Dapper) | 0.881 | 0.060 | 0.541 | 0.851 | 0.894 | 0.922 | 0.999 | 1.119 |
| Δ Polarización 2022→2026 | +0.047 | 0.052 | -0.201 | +0.019 | +0.046 | +0.076 | +0.322 | 1.119 |
| Total votos válidos — municipal | 20.272 | 112.847 | 68 | 947 | 3.421 | 11.284 | 1.203.364 | 1.119 |
IP Dapper = (votos 1°+votos 2°)/total votos válidos. Fuente: Registraduría Nacional del Estado Civil — MMV primera vuelta 31 de mayo de 2026.
La distribución altamente asimétrica del total de votos válidos — con una media de 20.272 pero una mediana de solo 3.421 — refleja la estructura poblacional de Colombia: unas pocas ciudades concentran la gran mayoría del electorado. Medellín (1.203.364 votos válidos), Bogotá D.C. y Cali concentran una fracción desproporcionada del total. Esta asimetría justifica el uso de pesos por votos emitidos al agregar las predicciones municipales en el resultado nacional.
El índice de polarización electoral aumentó 4.7 puntos en promedio entre 2022 y 2026, alcanzando un valor sin precedentes en la historia electoral reciente de Colombia. Solo el 12.6% de los municipios registró una reducción en su índice de polarización — en los demás, la concentración del voto en los dos candidatos principales aumentó respecto a 2022.
La Figura 1 presenta los histogramas de las tres variables más relevantes para el modelo: el voto por Cepeda en 2026, el voto por Petro en 2022 y el cambio en la polarización electoral. La inspección visual de estas distribuciones es el primer paso del análisis exploratorio y permite identificar la forma, la dispersión y la asimetría de cada variable antes de proceder a la estimación formal.
Las distribuciones de Cepeda 2026 y Petro 2022 exhiben una forma aproximadamente bimodal, con un pico alrededor del 20–30% (municipios del interior andino, donde el candidato de izquierda obtiene resultados modestos) y otro pico alrededor del 60–80% (municipios del Pacífico y territorios étnicos, donde el apoyo al candidato de izquierda es abrumador). Esta bimodalidad es la expresión estadística de la brecha territorial que divide el electorado colombiano.
La distribución del cambio en polarización (Δ IP Dapper) es aproximadamente simétrica alrededor de +0.047, lo que indica que la polarización aumentó de manera relativamente homogénea en todo el territorio. Sin embargo, la cola derecha — municipios con aumentos de hasta +0.322 puntos — señala que en algunos territorios la concentración del voto en dos candidatos alcanzó niveles extremos en 2026.
El análisis de correlaciones bivariadas entre las variables electorales clave es fundamental para entender la estructura de dependencia del voto colombiano, validar las decisiones de especificación del modelo y comunicar los hallazgos a audiencias no especializadas. La correlación entre Cepeda 2026 y Petro 2022 — r=0.977 — es el hallazgo estadístico más importante de todo el análisis.
La Figura 2 presenta cuatro diagramas de dispersión que ilustran las relaciones bivariadas más relevantes. Cada punto representa un municipio. La línea roja es la recta de regresión por mínimos cuadrados ordinarios, y el cuadro en la esquina inferior derecha reporta el coeficiente de correlación de Pearson (r), el coeficiente de determinación (r²) y el tamaño de la muestra (n).
El panel (a) — Cepeda 2026 × Petro 2022 — muestra la relación más poderosa del análisis. La nube de puntos sigue de cerca la recta de regresión, con un r²=0.955 que implica que el 95.5% de la varianza del voto municipal por Cepeda en 2026 queda explicada únicamente por el voto por Petro en 2022. Este resultado tiene una implicación metodológica central: el prior histórico de 2022 es suficiente para producir predicciones de alta precisión, sin necesidad de incorporar covariables adicionales de conflicto, pobreza o demografía — como confirma el BMA.
El panel (b) — Cepeda 2026 × Cambio 22→26 — muestra una correlación más modesta (r=0.201) pero estadísticamente significativa (p<0.001). Esta correlación captura el efecto de la dinámica de la primera vuelta de 2026: los municipios donde más creció el voto izquierdista respecto a 2022 tienden a apoyar más a Cepeda. Este efecto es el que captura el parámetro β₄ del modelo BYM2.
El panel (c) — IP 2026 × IP 2022 — muestra la persistencia de la polarización electoral entre ciclos. La diagonal (línea dorada) indica ausencia de cambio; la mayoría de puntos están por encima de ella, confirmando que la polarización aumentó en la mayor parte del territorio. La correlación moderada (r=0.356) indica persistencia parcial — los municipios ya polarizados tienden a seguir siéndolo, pero el efecto no es determinístico.
El panel (d) — Cepeda 2026 × Δ Polarización — revela que los municipios donde más creció la polarización en 2026 respecto a 2022 tienden a favorecer más a Cepeda (r=0.332). Este resultado es consistente con la hipótesis de que la movilización del electorado izquierdista fue más intensa en territorios donde la polarización aumentó más agudamente.
Continuidad electoral entre candidatos del mismo bloque político. Predictor dominante del modelo.
El predictor β₄ del modelo BYM2. Dinámica de la primera vuelta 2026.
Persistencia territorial de la polarización entre ciclos electorales.
Municipios con mayor aumento de polarización en 2026 favorecen a Cepeda.
La Tabla 3 presenta la matriz completa de correlaciones de Pearson entre las seis variables electorales del modelo. La intensidad del color es proporcional al valor absoluto de la correlación: rojo para correlaciones positivas y azul para negativas.
| Variable | Cepeda 26 | Petro 22 | Δ Izq. | IP 2022 | IP 2026 | Δ IP |
|---|---|---|---|---|---|---|
| Cepeda 2026 | 1.000 | 0.977*** | 0.201*** | 0.159*** | 0.603*** | 0.332*** |
| Petro 2022 | 0.977*** | 1.000 | -0.012 | 0.177*** | 0.598*** | 0.311*** |
| Δ Izquierda 22→26 | 0.201*** | -0.012 | 1.000 | -0.066* | 0.084** | 0.129*** |
| IP 2022 | 0.159*** | 0.177*** | -0.066* | 1.000 | 0.356*** | -0.663*** |
| IP 2026 | 0.603*** | 0.598*** | 0.084** | 0.356*** | 1.000 | 0.464*** |
| Δ IP 22→26 | 0.332*** | 0.311*** | 0.129*** | -0.663*** | 0.464*** | 1.000 |
Tabla 3. Coeficiente de correlación de Pearson. Significancia: *** p<0.001 · ** p<0.01 · * p<0.05 · sin asterisco = no significativo (p≥0.05). Intensidad del color proporcional al valor absoluto. Rojo = correlación positiva · Azul = correlación negativa. N = 1.119 municipios.
Tres hallazgos de la matriz merecen especial atención. Primero, la correlación casi perfecta entre Cepeda 2026 y Petro 2022 (r=0.977) confirma que el mapa político colombiano es altamente estable entre ciclos electorales. Segundo, la correlación alta entre IP 2026 y los predictores electorales (r=0.603 con Cepeda 2026, r=0.598 con Petro 2022) indica que la polarización en 2026 no es un fenómeno independiente sino que está estrechamente vinculada a la geografía del voto izquierdista. Tercero, la correlación negativa de -0.663 entre IP 2022 y Δ IP —la más alta en valor absoluto de la matriz fuera de la diagonal— revela un efecto techo: los municipios que ya tenían alta polarización en 2022 tendieron a polarizarse menos en 2026 porque ya estaban cerca del máximo posible.
El Índice de Polarización Electoral Dapper (IP) mide la proporción de votos concentrados en los dos candidatos más votados como fracción del total de votos válidos. Un valor cercano a 1 indica que prácticamente todos los votos se concentraron en dos candidatos; un valor bajo indica fragmentación del voto entre múltiples opciones.
Formalmente, para el municipio i en la elección t:
donde V(1) y V(2) son los votos del primer y segundo candidato, respectivamente. El índice nacional ponderado por votos válidos (IPpond) pasó de 0.785 en 2022 a 0.864 en 2026 — el nivel más alto registrado en la historia electoral colombiana desde el establecimiento de la segunda vuelta presidencial.
| Índice | 2022 | 2026 | Δ | Interpretación |
|---|---|---|---|---|
| IP Dapper ponderado | 0.785 | 0.864 | +0.079 | Máximo histórico registrado |
| IP Dapper sin ponderar (media municipal) | 0.834 | 0.881 | +0.047 | Promedio de los 1.119 municipios |
| Within-EP (polarización interna) | 0.791 | 0.820 | +0.029 | Componente de variación intra-departamental |
| Municipios con Δ IP > 5pp | 418 municipios | 37.4% del total analítico | ||
| Municipios con Δ IP < 0 (bajó) | 141 municipios | 12.6% — efecto techo | ||
La Figura 3 muestra que el aumento de la polarización no fue homogéneo. Las regiones con mayor incremento se concentran en el Pacífico nariñense y caucano, el Catatumbo y algunos municipios del Caribe — precisamente los territorios donde la primera vuelta de 2026 mostró los mayores crecimientos del voto por Cepeda respecto al voto por Petro en 2022. Este patrón sugiere que la polarización aumentó principalmente porque el candidato de izquierda movilizó nuevos votantes en sus bastiones históricos, no porque cambiara el voto en territorios donde históricamente no lo apoyaban.
El modelo BYM2 (Besag, York y Mollié, 1991; extendido por Riebler et al., 2016) es un modelo de regresión jerárquico bayesiano que combina efectos fijos de covariables observables con efectos aleatorios espaciales no observados. Su arquitectura es particularmente adecuada para datos electorales con fuerte estructura geográfica.
Sea yi la proporción del voto por Cepeda en el municipio i en la primera vuelta de 2026, con i = 1, ..., 1.119 y d[i] ∈ {1, ..., 33} el departamento al que pertenece el municipio i. El modelo de regresión lineal jerárquica es:
Los efectos aleatorios departamentales siguen una distribución normal:
Y el error idiosincrático:
Las distribuciones a priori (priors) especifican el estado de conocimiento del investigador antes de observar los datos. Se adoptan priors débilmente informativos, siguiendo las recomendaciones de Gelman et al. (2020):
La distribución posterior del modelo BYM2 se actualiza con la información de cinco encuestadoras mediante Importance Sampling. Dado el conjunto de datos de primera vuelta D1V y el vector de encuestas E, la posterior actualizada es:
El análisis se desarrolló en cuatro fases que refinan progresivamente la especificación del modelo, incorporan datos adicionales y realizan validaciones cruzadas. Esta progresión metodológica permite evaluar la contribución marginal de cada componente del modelo.
| Fase | Especificación | N | r (obs. vs pred.) | RMSE | Evaluación |
|---|---|---|---|---|---|
| Fase 5 | BYM2: β₂ prior Petro 2022 + β₄ cambio izq. 22→26 + ud | 1.119 | 1.000000 | 0.000130 | Modelo principal ✓ |
| Fase 6 | Fase 5 + γEI (Ecological Inference — desplazamiento) | 956 | 1.000000 | 0.000234 | No mejora · pierde cobertura |
| Fase 7 | Fase 5 + IP Polarización 2022 (PIP = 0.495 en BMA) | 1.119 | 1.000000 | 0.000138 | No significativo · PIP ≈ 50% |
| Fase 8 | Fase 5 + calibración bayesiana IS con 5 encuestas + MC N=10.000 | 1.119 | — | — | Predicción final ✓ |
La extraordinaria bondad de ajuste de la Fase 5 (r=1.000000, RMSE=0.000130) no refleja sobreajuste sino el resultado esperado cuando el predictor dominante — el prior Petro 2022 — tiene una correlación de 0.977 con la variable dependiente. El Bayesian Model Averaging confirma que este modelo es parsimoni oso y suficiente: no existen predictores adicionales con PIP superior al 99% entre las 12 covariables candidatas evaluadas.
La estimación MCMC con 3.000 muestras efectivas (1.000 warmup + 3.000 muestreo) produce distribuciones posteriores bien caracterizadas para todos los parámetros del modelo. El estadístico R̂ de Gelman-Rubin es aproximadamente 1.00 para todos los parámetros, confirmando la convergencia de la cadena de Markov.
La Figura 4 presenta el forest plot de los parámetros estimados — la representación estándar en la literatura de modelos bayesianos para visualizar las distribuciones posteriores marginales. El punto central es la media posterior y las líneas horizontales representan el intervalo de credibilidad al 95%.
| Parámetro | Descripción | Media post. | IC 2.5% | IC 97.5% | P(>0) | Sig. |
|---|---|---|---|---|---|---|
| β₂ | Prior Petro 2022 (estandarizado) | +0.2183 | +0.2150 | +0.2216 | 1.000 | *** |
| β₄ | Cambio voto izquierda 22→26 (estand.) | +0.0475 | +0.0453 | +0.0496 | 1.000 | *** |
| μ | Intercepto global | +0.3924 | +0.3611 | +0.4237 | 1.000 | *** |
| σ_u | Desviación estándar efectos departamentales | 0.1765 | 0.1420 | 0.2110 | — | Sig. |
| Diagnósticos: r (obs. vs pred.) = 1.000000 · RMSE = 0.000130 · N = 1.119 municipios · D = 33 departamentos · MCMC: 3.000 muestras efectivas · R̂ ≈ 1.00 para todos los parámetros | ||||||
Tabla 5. *** P(>0) = 1.000 indica que el 100% de las muestras MCMC son positivas — equivalente a significancia unilateral al 0.0003%. Significancia bayesiana: *** P(>0) > 0.999 · ** > 0.95 · * > 0.90.
La interpretación sustantiva de los parámetros es la siguiente. El coeficiente β₂ = +0.2183 indica que un incremento de una desviación estándar en el voto por Petro en 2022 se asocia con un aumento de +21.8 puntos porcentuales en el voto por Cepeda en 2026, ceteris paribus. Este efecto es sustancialmente más grande que el de β₄, lo que confirma que el prior histórico es el predictor dominante del modelo.
El coeficiente β₄ = +0.0475 indica que un incremento de una desviación estándar en el cambio del voto izquierdista entre 2022 y 2026 se asocia con un aumento de +4.75pp en el voto por Cepeda en primera vuelta, controlando por el prior de 2022. Este efecto captura la dinámica específica de la primera vuelta de 2026 que el prior histórico no puede anticipar.
La desviación estándar de los efectos departamentales σ_u = 0.1765 indica una variabilidad inter-departamental considerable no explicada por las dos covariables del modelo. Esto es consistente con la existencia de efectos regionales —institucionales, culturales, de medios de comunicación— que el modelo captura implícitamente a través de los efectos aleatorios departamentales.
La robustez del modelo base se valida mediante dos procedimientos complementarios: el Bayesian Model Averaging (BMA) sobre 4.096 especificaciones alternativas y el análisis de Ecological Inference para evaluar la hipótesis de desmovilización vs. conversión de voto.
El BMA (Raftery, 1995; Hoeting et al., 1999) evalúa simultáneamente 2K especificaciones del modelo, ponderando cada una por su verosimilitud marginal. Para K=12 covariables candidatas, se evaluaron 4.096 modelos utilizando el prior g de Zellner con g=N=1.119.
La Posterior Inclusion Probability (PIP) mide la probabilidad de que una covariable pertenezca al modelo verdadero bajo incertidumbre de especificación. Los resultados son concluyentes:
El Ecological Inference (Goodman, 1953; King, 1997) permite estimar proporciones individuales a partir de datos agregados municipales. Se utilizó para evaluar la hipótesis Sampayo: ¿el menor voto por Cepeda respecto a Petro en algunos municipios se debe a desmovilización (votantes de Petro que no volvieron a las urnas) o a conversión (votantes de Petro que cambiaron a otro candidato)?
El estimador de Goodman a nivel nacional arroja un coeficiente β₁=3.7%, que representa la fracción de votantes de Petro en 2022 que no votaron por ningún candidato de izquierda en 2026. Este valor confirma la hipótesis de desmovilización parcial, no de conversión: los votantes que abandonaron el voto izquierdista entre 2022 y 2026 se abstuvieron, no se transfirieron a candidatos de centro o derecha.
El modelo predice el ganador en cada uno de los 1.119 municipios del universo analítico para la segunda vuelta del 21 de junio de 2026. De La Espriella gana en 795 municipios y Cepeda en 324 municipios. Las transferencias de los votos de Paloma Valencia y Gustavo Fajardo, calibradas con la encuesta de AtlasIntel de junio 2026, determinan el resultado en los municipios de margen más estrecho.
| Departamento | De La Espriella | Cepeda | Margen | Ganador | Mpios Esp/Total |
|---|---|---|---|---|---|
| Norte De San | 80.9% | 19.1% | +61.8pp | De La Espriella | 36/40 |
| Casanare | 74.8% | 25.2% | +49.5pp | De La Espriella | 17/19 |
| Antioquia | 72.7% | 27.3% | +45.4pp | De La Espriella | 114/125 |
| Santander | 70.5% | 29.5% | +41.1pp | De La Espriella | 85/87 |
| Caldas | 70.2% | 29.9% | +40.3pp | De La Espriella | 27/27 |
| Huila | 67.7% | 32.3% | +35.4pp | De La Espriella | 37/37 |
| Boyaca | 67.5% | 32.5% | +35.1pp | De La Espriella | 121/123 |
| Quindio | 67.4% | 32.6% | +34.9pp | De La Espriella | 12/12 |
| Meta | 67.3% | 32.7% | +34.6pp | De La Espriella | 26/29 |
| Tolima | 65.9% | 34.1% | +31.9pp | De La Espriella | 46/47 |
| Arauca | 65.3% | 34.7% | +30.5pp | De La Espriella | 5/7 |
| Risaralda | 63.7% | 36.3% | +27.5pp | De La Espriella | 12/14 |
| Cundinamarca | 62.5% | 37.5% | +24.9pp | De La Espriella | 113/116 |
| Guaviare | 62.3% | 37.7% | +24.7pp | De La Espriella | 3/4 |
| Caqueta | 60.7% | 39.3% | +21.3pp | De La Espriella | 13/16 |
| Bogota D.C. | 58.5% | 41.5% | +16.9pp | De La Espriella | 1/1 |
| San Andres | 54.9% | 45.1% | +9.7pp | De La Espriella | 2/2 |
| Vichada | 54.5% | 45.5% | +8.9pp | De La Espriella | 3/4 |
| Cesar | 53.2% | 46.8% | +6.3pp | De La Espriella | 16/25 |
| Magdalena | 47.8% | 52.2% | -4.3pp | Cepeda | 15/30 |
| Atlantico | 47.2% | 52.8% | -5.5pp | Cepeda | 11/23 |
| Valle | 47.2% | 52.8% | -5.6pp | Cepeda | 24/42 |
| Bolivar | 45.9% | 54.1% | -8.2pp | Cepeda | 26/46 |
| Amazonas | 45.9% | 54.1% | -8.3pp | Cepeda | 1/10 |
| Guainia | 44.6% | 55.4% | -10.8pp | Cepeda | 3/7 |
| La Guajira | 44.5% | 55.5% | -11.0pp | Cepeda | 1/15 |
| Cordoba | 44.5% | 55.5% | -11.1pp | Cepeda | 9/30 |
| Sucre | 44.0% | 56.0% | -11.9pp | Cepeda | 8/26 |
| Cauca | 33.0% | 67.0% | -34.0pp | Cepeda | 0/42 |
| Nariño | 32.4% | 67.7% | -35.3pp | Cepeda | 6/64 |
| Putumayo | 28.8% | 71.2% | -42.3pp | Cepeda | 0/13 |
| Vaupes | 25.4% | 74.6% | -49.1pp | Cepeda | 0/6 |
| Choco | 24.9% | 75.1% | -50.3pp | Cepeda | 2/30 |
Tabla 6. Resultados en % de votos válidos de segunda vuelta. Margen = De La Espriella % − Cepeda %. Fuente: Modelo BYM2 Fase 8 · Registraduría Nacional.
La predicción final combina la distribución posterior del modelo BYM2 con la verosimilitud del promedio ponderado de cinco encuestadoras mediante Importance Sampling. Las 10.000 simulaciones Monte Carlo producen la distribución completa del margen esperado, permitiendo calcular probabilidades de victoria con precisión.
El modelo BYM2 captura patrones históricos pero no puede anticipar factores de última hora. El análisis de sensibilidad evalúa la robustez de la predicción bajo seis escenarios que incorporan los principales focos de incertidumbre para la segunda vuelta colombiana.
Los tres factores de incertidumbre más relevantes son: (1) la movilización diferencial en Bogotá, donde Cepeda tiene una ventaja de casi 10pp según las encuestas y donde la participación en segundas vueltas históricamente supera a la de primeras vueltas; (2) la presión de grupos armados en territorios rurales con presencia de FARC disidencias, ELN y otros actores, que en procesos anteriores se ha asociado con concentración del voto en candidatos específicos; y (3) la activación del voto en blanco, que las encuestas sitúan en 6.7% y cuyo comportamiento en segunda vuelta es incierto.
| Escenario | Ajuste Bogotá | Ajuste zonas armadas | Margen predicho | Ganador |
|---|---|---|---|---|
| Base del modelo (sin ajustes) | — | — | +15.9pp | De La Espriella |
| Bogotá +3pp participación (como 2022) | +3pp → Cepeda | — | +14.9pp | De La Espriella |
| Bogotá +5pp participación (escenario alto) | +5pp → Cepeda | — | +14.2pp | De La Espriella |
| Presión armada rural +5pp (FARC/ELN) | — | +5pp → Cepeda | +15.1pp | De La Espriella |
| Combinado: Bogotá +3pp + armado +5pp | +3pp → Cepeda | +5pp → Cepeda | +14.0pp | De La Espriella |
| Máximo estrés: Bogotá +5pp + armado +8pp | +5pp → Cepeda | +8pp → Cepeda | +12.8pp | De La Espriella |
La convergencia entre el modelo y las cinco encuestadoras disponibles — a pesar de usar metodologías completamente distintas — es la evidencia más contundente de la solidez de la predicción. Cuando fuentes independientes con metodologías distintas apuntan al mismo resultado, la inferencia es robusta a los supuestos de cualquier método individual.
| Encuestadora | Fecha | Metodología | De La Espriella | Cepeda | Margen | n | Peso |
|---|---|---|---|---|---|---|---|
| AtlasIntel / Semana | 5-10 jun | RDR digital | 52.6% | 44.8% | +7.7pp | 3.681 | 35% |
| Guarumo / Ecoanalítica | 13 jun | Presencial probabilístico | 52.6% | 45.0% | +7.6pp | 1.200 | 30% |
| CB Global Data | 1-4 jun | CAWI online | 51.9% | 44.8% | +7.1pp | 1.475 | 15% |
| CNC / Cambio Colombia ★ | 13 jun | Presencial probabilístico | 52.0% | 47.8% | +4.6pp | 1.200 | 12% |
| CNC | mayo 2026 | Presencial probabilístico | 51.6% | 48.4% | +3.2pp | 1.200 | 8% |
| Promedio ponderado | 52.3% | 45.5% | +6.8pp | N efectivo ≈ 8.756 | |||
★ Encuesta más reciente al momento de publicación. Porcentajes sobre votos válidos (excluye voto en blanco e indecisos). Pesos asignados según precisión histórica en 1ª vuelta 2026, recencia y tamaño muestral. RDR = Random Digital Recruitment · CAWI = Computer-Assisted Web Interviewing.
Los pesos se asignan bajo tres criterios: (1) precisión histórica en primera vuelta 2026 — AtlasIntel tuvo el menor error promedio (1.31pp vs. 12.1pp de Invamer); (2) recencia — mayor peso a las encuestas del 13 de junio respecto a las de mayo; y (3) tamaño muestral — AtlasIntel con n=3.681 frente a n≈1.200 de las demás.
La notable convergencia entre AtlasIntel (RDR digital, +7.7pp) y Guarumo (presencial probabilístico, +7.6pp) — dos metodologías radicalmente distintas — es especialmente significativa. Cuando metodologías tan diferentes producen el mismo resultado, el margen de +7.5pp puede considerarse un piso mínimo para la ventaja de De La Espriella según las encuestas.
Los territorios donde Cepeda obtiene sus mayores ventajas electorales se superponen, en su mayoría, con las zonas de mayor intensidad del conflicto armado colombiano. Este análisis comparativo — antes y durante el gobierno Petro — ofrece contexto territorial esencial para interpretar la geografía del voto.
El análisis compara dos períodos usando datos de TerriData DNP: 2019–2021 (gobierno Duque) y 2022–2024 (gobierno Petro). Los indicadores de conflicto muestran un deterioro generalizado que contrasta con la promesa de "Paz Total" del gobierno entrante en 2022: los accidentes por minas antipersonal pasaron de 468 a 2.697 eventos anuales (+475.9%), y las víctimas del conflicto de 133.887 a 192.777 (+44.0%).
| # | Municipio | Departamento | De La Espriella | Cepeda | Margen |
|---|---|---|---|---|---|
| 1 | Silos | Norte De San | 95.1% | 4.9% | +90.1pp |
| 2 | Bucarasica | Norte De San | 94.7% | 5.3% | +89.4pp |
| 3 | Vetas | Santander | 94.6% | 5.4% | +89.2pp |
| 4 | Herran | Norte De San | 94.5% | 5.5% | +89.0pp |
| 5 | Mutiscua | Norte De San | 93.7% | 6.3% | +87.4pp |
| 6 | Lourdes | Norte De San | 93.7% | 6.3% | +87.4pp |
| 7 | Encino | Santander | 93.0% | 7.0% | +86.1pp |
| 8 | El Guacamayo | Santander | 92.9% | 7.1% | +85.8pp |
| 9 | Ragonvalia | Norte De San | 92.6% | 7.4% | +85.2pp |
| 10 | Cachira | Norte De San | 92.4% | 7.6% | +84.9pp |
| 11 | Villa Caro | Norte De San | 92.0% | 8.0% | +84.1pp |
| 12 | Arboledas | Norte De San | 91.9% | 8.1% | +83.7pp |
| # | Municipio | Departamento | Cepeda | De La Espriella | Margen |
|---|---|---|---|---|---|
| 1 | El Litoral Del San Juan | Choco | 96.9% | 3.1% | +93.8pp |
| 2 | Jambalo | Cauca | 95.9% | 4.1% | +91.9pp |
| 3 | Roberto Payan (San Jose) | Nariño | 94.9% | 5.1% | +89.9pp |
| 4 | Alto Baudo (Pie De Pato) | Choco | 94.8% | 5.2% | +89.5pp |
| 5 | Mosquera | Nariño | 94.5% | 5.5% | +89.0pp |
| 6 | Magui (Payan) | Nariño | 94.4% | 5.6% | +88.9pp |
| 7 | Miriti Parana | Amazonas | 93.8% | 6.2% | +87.7pp |
| 8 | Timbiqui | Cauca | 93.7% | 6.3% | +87.3pp |
| 9 | Buenos Aires (Pacoa) | Vaupes | 93.3% | 6.7% | +86.6pp |
| 10 | La Chorrera | Amazonas | 91.7% | 8.3% | +83.4pp |
| 11 | Toribio | Cauca | 91.5% | 8.5% | +83.1pp |
| 12 | Murindo | Antioquia | 90.9% | 9.1% | +81.8pp |
El modelo se estimó en Python 3.12 con las librerías numpy, scipy, pandas y geopandas. El BMA se implementó con evaluación exhaustiva de los 4.096 modelos posibles. El Importance Sampling de la Fase 8 usa 10.000 remuestras ponderadas de las 3.000 muestras MCMC.
| Procedimiento | Método | Software/Algoritmo |
|---|---|---|
| Estimación modelo BYM2 | MCMC — muestreo de Gibbs | Python/numpy · 4.000 iter. (1.000 warmup) |
| Bayesian Model Averaging | Enumeración exhaustiva · prior g de Zellner | Python · 4.096 modelos evaluados |
| Spatial BMA (residuos) | Spatial BMA sobre residuos del BYM2 | Python/scipy · modelo nulo P=1.000 |
| Ecological Inference | Estimador de Goodman | Python/numpy · nivel nacional |
| Calibración bayesiana (Fase 8) | Importance Sampling | Python/numpy · N=10.000 remuestras |
| Índice de Polarización | Dapper modificado + Within-EP | Python/pandas · 1.119 municipios |
Chaves, Á. (2026). Predicción electoral Colombia 2026: un modelo jerárquico bayesiano BYM2 para la segunda vuelta presidencial. Documento de trabajo, Programa de Economía, Escuela Colombiana de Ingeniería Julio Garavito, Bogotá D.C. 14 de junio de 2026.