Matemáticas de Juegos de Mesa: Probabilidad y Valor Esperado

Toda mecánica de juego de mesa tiene una identidad matemática. Una tirada de dados tiene un valor esperado y una varianza. Robar una carta tiene una distribución de probabilidad. Un intercambio de recursos tiene una tasa de cambio que puede expresarse como una razón. Los diseñadores que entienden esta matemática toman mejores decisiones que los que trabajan por intuición — no porque la matemática reemplace a la intuición, sino porque la intuición discrepa de la realidad con frecuencia de formas que las pruebas de juego solas tardan en corregir.

Este artículo cubre los conceptos matemáticos que más importan para el diseño y el juego de juegos de mesa: distribuciones de probabilidad, valor esperado, varianza y la brecha psicológica entre lo que dice la matemática y lo que experimentan los jugadores. Tanto si estás diseñando un juego como si simplemente intentas entender por qué tus sesiones de dados se sienten tan desastrosamente de mala suerte, este marco cambiará tu forma de pensar sobre la aleatoriedad en los juegos.

Por qué importa la matemática en el diseño de juegos

Un diseñador de juegos que no ha calculado el valor esperado de la economía de acciones central de su juego no sabe si su juego funciona. Esto suena duro, pero es funcionalmente cierto. Si el ingreso esperado de la mejor acción disponible es de 4 recursos por ronda y el coste de la acción de condición de victoria es de 30 recursos, el diseñador necesita saber si esa tasa de ingreso es alcanzable en la duración típica del juego — antes de las pruebas de juego, no después de seis sesiones preguntándose por qué nadie gana nunca.

La matemática y las pruebas de juego son herramientas complementarias, no alternativas. La matemática te dice lo que predice la teoría. Las pruebas de juego te dicen si el comportamiento humano coincide con la teoría. La mayoría de las veces divergen — no porque la matemática sea incorrecta, sino porque los jugadores no siempre eligen la acción teóricamente óptima. La brecha entre el juego óptimo teórico y el juego humano real es en sí misma una variable de diseño: un juego donde solo el juego óptimo produce decisiones interesantes es un juego peor que aquel donde el juego subóptimo también crea situaciones interesantes.

Toda mecánica tiene un valor esperado, y los diseñadores deben conocerlo. Cuando un jugador de Neutronium: Parallel Wars obtiene ingresos de los Puertos Nucleares, está recibiendo un valor esperado calculado con precisión por puerto por ronda. Cuando decide atacar en lugar de construir, está tomando una decisión que tiene resultados calculables bajo diferentes escenarios. El diseñador que conoce estos números puede tomar decisiones de equilibrio significativas; el que no los conoce está adivinando.

La asimetría crítica es que la aleatoriedad se percibe injusta incluso cuando está equilibrada. Una moneda al aire al 50/50 produce cara seis veces seguidas aproximadamente el 1,6% del tiempo — con poca frecuencia, pero no imposiblemente. Cuando eso le ocurre a un jugador en un juego, lo experimenta como si el juego estuviera roto, no como un evento estadístico normal. Entender por qué ocurre esto — y cómo los diseñadores pueden estructurar la aleatoriedad para que se sienta menos punitiva manteniendo las mismas probabilidades subyacentes — es la aplicación prácticamente más valiosa de la matemática del diseño de juegos.

Probabilidad de dados 101

El d6 simple es la herramienta de aleatoriedad más común en los juegos de mesa y también una de las más incomprendidas. Un d6 estándar produce una distribución uniforme: cada cara (del 1 al 6) tiene una probabilidad de 1/6, y el valor esperado es 3,5. Los jugadores entienden esto intuitivamente, pero a menudo no comprenden lo que significa para tiradas repetidas durante una sesión.

La distinción entre un d6 simple y 2d6 es fundamental para entender por qué diferentes mecánicas de dados se sienten distintas. Un d6 simple tiene una distribución de probabilidad plana — cada resultado del 1 al 6 es igualmente probable. Dos d6 sumados producen una curva de campana: 7 es el resultado más probable (probabilidad 6/36 = 16,7%), mientras que 2 y 12 tienen una probabilidad de 1/36 = 2,8% cada uno. La distribución de 2d6 concentra los resultados cerca del centro y hace que los extremos sean poco frecuentes. Por eso Catan, que usa 2d6 para la producción de recursos, se siente menos punitivo en tiradas individuales que los sistemas de un solo dado — la distribución naturalmente limita los resultados extremos.

Distribución de probabilidad de 2d6 Suma: 2 → 1/36 = 2,8% Suma: 3 → 2/36 = 5,6% Suma: 4 → 3/36 = 8,3% Suma: 5 → 4/36 = 11,1% Suma: 6 → 5/36 = 13,9% Suma: 7 → 6/36 = 16,7% ← más probable Suma: 8 → 5/36 = 13,9% Suma: 9 → 4/36 = 11,1% Suma: 10 → 3/36 = 8,3% Suma: 11 → 2/36 = 5,6% Suma: 12 → 1/36 = 2,8%

Los dados personalizados con distribuciones de caras no estándar dan a los diseñadores un control preciso sobre perfiles de probabilidad que los dados estándar no pueden proporcionar. Un dado con las caras [0, 0, 0, 1, 1, 2] tiene un carácter muy diferente al de un d6: produce cero el 50% del tiempo, uno el 33% del tiempo y dos el 17% del tiempo, con un valor esperado de 0,67. Neutronium: Parallel Wars usa dados D6 personalizados con caras codificadas por colores: las caras azules representan resultados de combate estándar, las rojas representan resultados críticos y las verdes representan activaciones de habilidades especiales. La distribución de los tipos de caras — no solo el número de caras — determina la probabilidad de cada resultado. Un dado con tres caras azules, dos rojas y una verde produce resultados azules el 50% del tiempo, rojos el 33% y verdes el 17%. El diseñador puede ajustar estas proporciones cambiando el recuento de caras en lugar de crear sistemas de resolución matemáticamente complejos.

Los dados explosivos son dados que, al sacar el valor máximo, se vuelven a tirar y se suman los resultados. Un d6 que explota en 6 tiene un valor esperado de (1+2+3+4+5+6)/6 + (1/6 × valor esperado de un d6) = 3,5 + (1/6 × 3,5) = 3,5 + 0,583 = 4,083. La naturaleza abierta crea resultados teóricamente ilimitados — una secuencia de explosiones afortunadas puede producir totales muy altos — lo que produce los momentos de «me siento con suerte» que algunos juegos cultivan deliberadamente. La contrapartida es una alta varianza y la ocasional tirada de suerte que define la partida.

Los dados acotados son la filosofía opuesta: limitan el resultado máximo para restringir la varianza. Los sistemas de conjunto de dados en los que se tiran varios dados y se toman solo los N mejores resultados (sistemas de ventaja como la mecánica de ventaja de D&D 5E, o los múltiples dados con el mayor resultado de Gumshoe) reducen matemáticamente la varianza manteniendo la sensación probabilística. Tomar el mayor de dos tiradas de d6 desplaza el valor esperado de 3,5 a 4,47 — una mejora del 28% — mientras que reduce significativamente la probabilidad de resultados bajos.

El valor esperado en los juegos de recursos

Los juegos de acumulación de recursos — euros, constructores de motores, estrategias económicas — se construyen sobre cálculos de valor esperado que el diseñador debe entender con precisión aunque nunca aparezcan explícitamente en el reglamento. Cuando un jugador elige entre dos acciones, está comparando (consciente o inconscientemente) el valor esperado de esas acciones en el horizonte temporal relevante.

El sistema de ingresos de los Puertos Nucleares de Neutronium: Parallel Wars es un ejemplo explícito de valor esperado diseñado. La fórmula de ingresos establece que un jugador con N Puertos Nucleares recibe ingresos a una tasa que escala de forma no lineal con N. La fórmula específica — 1 puerto genera 2 unidades de Neutronium por ronda; 10 puertos generan 220 Nn por ronda — no es accidental. Es la declaración explícita del diseñador de que la acumulación de puertos debe producir rendimientos exponenciales en lugar de lineales, porque los rendimientos exponenciales crean el umbral de coalición que impulsa la dinámica competitiva del juego.

Escala de ingresos de Puertos Nucleares (Neutronium: Parallel Wars) 1 puerto → 2 Nn/ronda (base) 2 puertos → 5 Nn/ronda 3 puertos → 9 Nn/ronda 5 puertos → 20 Nn/ronda 7 puertos → 42 Nn/ronda ← umbral de coalición 10 puertos → 220 Nn/ronda (potencial desbocado)

Esta fórmula es diseño de juego intencional expresado como matemática. La brecha entre los ingresos de 7 puertos (42 Nn/ronda) y los de 10 puertos (220 Nn/ronda) es el argumento económico de por qué las coaliciones se forman en el umbral de 7 puertos en lugar de esperar a 9 o 10. Con 7 puertos, el jugador tiene suficientes ingresos para ser amenazante — pero la acción de la coalición todavía puede ser decisiva antes de que la ventaja de ingresos se vuelva matemáticamente insuperable. Un diseñador que llegara a estos números solo a través de pruebas de juego podría aproximarse; un diseñador que entendiera la función exponencial desde el principio podría especificar el umbral con precisión.

El principio más amplio: cuando la escala exponencial es un diseño de juego intencional, el diseñador debe documentar la función de escala y verificar que los umbrales que crea están donde los quiere. Si el umbral de coalición debería estar en 6 puertos en lugar de 7, la fórmula de ingresos necesita ajustarse — lo que requiere saber cuál es la fórmula, no solo observar que «el juego se siente equilibrado».

Varianza y percepción del jugador

La varianza es la medida de cuánto se distribuyen los resultados reales alrededor del valor esperado. Una varianza alta significa que los resultados individuales pueden diferir drásticamente de la expectativa; una varianza baja significa que los resultados se agrupan estrechamente en torno a la media. Para los diseñadores de juegos, la varianza es un control ajustable que afecta tanto a la equidad matemática del juego como a la experiencia subjetiva de jugarlo.

La clave del conocimiento psicológico: la varianza alta se siente mal incluso cuando está matemáticamente equilibrada. Una moneda al aire es perfectamente justa — 50/50, valor esperado exactamente igual para ambos jugadores — pero jugar un juego donde cada decisión se resuelve con una moneda al aire se siente arbitrario y poco gratificante. Los jugadores necesitan sentir que sus decisiones importan, lo que significa que necesitan percibir la conexión causal entre buenas decisiones y buenos resultados dentro de la sesión de juego. La varianza alta rompe esa conexión.

El problema del hexágono de 7 frente al de 2 en Catan ilustra esto claramente. En Catan, el número 7 aparece en la mayoría de los hexágonos porque tiene la mayor probabilidad con 2d6 (16,7%). El número 2 aparece en los menos hexágonos (2,8%). Los jugadores experimentados saben priorizar los recursos en los hexágonos de 6, 8, 5 y 9 — hexágonos de alta probabilidad. Pero en cualquier sesión dada, un jugador que coloca correctamente sus asentamientos iniciales en estos hexágonos puede seguir siendo superado significativamente por un jugador con ubicaciones de menor probabilidad si las tiradas de dados reales se desvían de los valores esperados. Esto no es injusto — es una variación estadística normal. Pero se siente injusto porque la relación entre la decisión (buena ubicación) y el resultado (ingresos de recursos frecuentes) queda oscurecida por la varianza.

Las soluciones de diseño para gestionar la percepción de injusticia por varianza incluyen: mecánicas de mitigación (retiradas, bancos de recursos, mecanismos de recuperación que se activan en rachas de mala suerte), puntos de decisión que siguen siendo significativos incluso después de la mala suerte (para que un jugador que tira mal aún tenga elecciones interesantes) y varianza que favorece a los jugadores rezagados (recuperación mediante varianza: el jugador líder quiere ingresos estables y predecibles; los jugadores rezagados se benefician de enfoques de alta varianza que pueden cerrar la brecha rápidamente, aunque el valor esperado sea el mismo).

Los momentos donde los dados deciden el rey — en los que una tirada aleatoria determina qué jugador gana o pierde en la última ronda — son los resultados de varianza más dañinos para la satisfacción del jugador. La solución no es eliminar los dados, sino estructurar el juego final de modo que los resultados de los dados afecten al camino hacia la victoria en lugar de determinarlo completamente. Cuando varios jugadores tienen posiciones de victoria viables al entrar en la última ronda, una tirada afortunada es satisfactoria para el ganador pero no se percibe como ilegítima para los perdedores — porque los perdedores también tenían un camino hacia la victoria que podría haberse habilitado con sus propias tiradas afortunadas.

Pruebas de equilibrio con matemática

El marco MEQA (Medibilidad, Compromiso, Calidad, Accesibilidad) proporciona un enfoque estructurado para las pruebas de equilibrio del juego. El pilar de Medibilidad — la M en MEQA — es donde la matemática entra formalmente en el proceso de diseño: antes de que comiencen las pruebas de juego, el diseñador define qué significa «equilibrado» en términos medibles.

Para un juego con facciones asimétricas como Neutronium: Parallel Wars, el equilibrio medible significa: cada facción debería alcanzar una tasa de victorias dentro de una banda de tolerancia definida en una muestra suficiente de partidas con niveles de habilidad comparables. Si el objetivo es una tasa de victorias del 50% (equilibrio puro) con un rango aceptable de ±10%, entonces una facción que gana el 42% de los juegos está dentro de la tolerancia y una que gana el 63% no lo está. Pero alcanzar este estándar requiere conocer el objetivo antes de las pruebas — no declarar a posteriori que las tasas de victorias observadas son «suficientemente cercanas».

Definir métricas antes de las pruebas de juego cambia lo que se observa. Si sabes que estás midiendo la tasa de victorias por facción, registras las asignaciones de facción y los resultados en todas las sesiones. Si sabes que estás midiendo la duración media de la partida, anotas las marcas de tiempo. Estas decisiones deben tomarse antes de la primera sesión de prueba, porque las métricas retrospectivas son poco fiables — la memoria es selectiva y los humanos naturalmente recuerdan las sesiones que apoyan sus creencias actuales.

Los requisitos de tamaño de muestra para las conclusiones de equilibrio suelen ser más grandes de lo que esperan los diseñadores. Para un juego de 2 jugadores con 2 facciones, 30 partidas proporcionan datos de referencia para detectar desequilibrios mayores del 15% con una confianza del 80%. Para juegos de 4 jugadores con 6 facciones, el espacio de combinación es mucho mayor: 30 partidas dan aproximadamente 5 partidas por par de facciones — apenas suficiente para detectar desequilibrios extremos, e insuficiente para detectar ventajas sutiles. Los editores independientes rara vez tienen los recursos para una validación estadística rigurosa; el enfoque práctico es usar la matemática para verificar los valores esperados, las pruebas de juego para detectar valores atípicos y los comentarios de la comunidad tras el lanzamiento para identificar los problemas que sobreviven a ambas etapas.

Para el marco completo — incluido cómo la Medibilidad se integra con los otros pilares de MEQA — consulta la guía del marco de equilibrio de juego MEQA, que cubre el enfoque completo para definir, medir y lograr el equilibrio en todos los sistemas del juego.

La fórmula de escala de ingresos en Neutronium se conecta directamente con los detalles de mecánicas en /mechanics/nuclear-port-scaling, donde la función exponencial está documentada junto con el razonamiento de diseño para cada valor umbral.

Herramientas de probabilidad para diseñadores

Varias herramientas hacen que la matemática del diseño de juegos sea accesible sin necesitar formación estadística avanzada. Estas son las que funcionan en la práctica.

AnyDice (anydice.com) es la calculadora estándar de probabilidad de dados para diseñadores de juegos. Acepta notación de dados en lenguaje natural (2d6, d4+d8, 3d6 keep highest 2) y devuelve distribuciones de probabilidad, valores esperados y probabilidades acumuladas. Para cualquier mecánica que involucre dados, AnyDice debe ser la primera herramienta consultada. Sus gráficos de salida hacen que las distribuciones sean inmediatamente legibles y comparables — pega dos expresiones de dados diferentes una al lado de la otra para ver de inmediato cómo difieren sus distribuciones.

Las simulaciones en hojas de cálculo (Google Sheets, Excel) manejan cálculos que AnyDice no puede: acumulación de recursos durante múltiples rondas, ingresos con múltiples fuentes, duración esperada del juego bajo diferentes supuestos estratégicos. Un modelo básico en hoja de cálculo de la economía de un juego — con columnas para cada turno, filas para cada tipo de recurso y fórmulas que representan las mecánicas centrales de ingresos y gastos del juego — tarda entre 2 y 3 horas en construirse y revela problemas de equilibrio que llevaría 20 o más pruebas de juego descubrir empíricamente.

La simulación de Monte Carlo es la herramienta de mayor precisión: ejecutar las mecánicas de un juego miles de veces computacionalmente para producir distribuciones estadísticas de todos los resultados posibles. Para diseñadores con experiencia en programación, Python con NumPy es suficiente para la mayoría de las necesidades de simulación de juegos. Para diseñadores sin experiencia en programación, existen herramientas visuales de Monte Carlo e incluso simulaciones basadas en hojas de cálculo que producen resultados significativos con conocimiento técnico limitado. Monte Carlo es más valioso para juegos con interdependencias complejas donde el cálculo analítico es difícil — cuando múltiples eventos aleatorios interactúan, la simulación produce estimaciones de distribución más fiables que el cálculo manual.

Cuándo confiar en la matemática frente a cuándo hacer pruebas de juego: usa la matemática para verificar el equilibrio teórico y detectar errores de diseño obvios antes de invertir en pruebas de juego. Usa las pruebas de juego para descubrir cómo la psicología humana interactúa con la matemática — los lugares donde la estrategia óptima difiere de lo que los jugadores realmente hacen, y los lugares donde la matemática predice equilibrio pero la experiencia se siente injusta. Ambos son necesarios. Ninguno es suficiente por sí solo.

Preguntas frecuentes

¿Por qué los dados se sienten injustos en los juegos de mesa aunque la probabilidad esté equilibrada?
Los dados se sienten injustos porque la memoria humana está sesgada hacia los resultados negativos. Las investigaciones psicológicas sobre la aversión a las pérdidas muestran que una tirada mala se recuerda y pondera aproximadamente el doble que una tirada igualmente buena. Cuando tiras mal tres veces y bien tres veces en una sesión, te vas de la mesa sintiéndote con mala suerte — porque las pérdidas fueron más emocionalmente significativas que las victorias. Además, la varianza alta significa que las sesiones individuales pueden divergir significativamente de la media esperada: un sistema de dados «justo» puede producir una racha de seis tiradas bajas seguidas por puro azar, lo que se siente manipulado aunque esté dentro de la variación estadística normal.
¿Qué es el valor esperado en los juegos de mesa?
El valor esperado (VE) en los juegos de mesa es el resultado medio de un evento probabilístico calculado a través de todos los resultados posibles, ponderados por su probabilidad. Para un d6 estándar, el valor esperado es (1+2+3+4+5+6)/6 = 3,5. Los diseñadores usan el valor esperado para garantizar que las diferentes opciones estratégicas ofrezcan un retorno de la inversión comparable — si una acción tiene un valor esperado mucho mayor que las alternativas, los jugadores racionales siempre la elegirán, eliminando los puntos de decisión significativos. Un buen diseño de juego significa dar a los jugadores opciones donde los valores esperados sean lo suficientemente cercanos como para que otros factores (tolerancia al riesgo, estado actual del juego, comportamiento del oponente) determinen la elección óptima.
¿Cómo controlan los diseñadores de juegos de mesa la aleatoriedad?
Los diseñadores de juegos de mesa controlan la aleatoriedad mediante varias técnicas: mecánicas de conjunto de dados que reducen la varianza (tirar varios dados y elegir el mejor resultado), dados personalizados con distribuciones de caras no estándar para un control preciso de la probabilidad, robo de cartas de mazos barajados para una pseudoaleatoriedad que tiende hacia los resultados esperados con el tiempo, y mecánicas de mitigación (retiradas, bancos de recursos) que permiten a los jugadores hábiles reducir el impacto de la mala suerte sin eliminar la aleatoriedad. El objetivo del diseñador no es eliminar la aleatoriedad sino hacer que se perciba como algo sensible a la habilidad.
¿Cuántas pruebas de juego se necesitan para validar estadísticamente el equilibrio de un juego de mesa?
Para un juego de 2 jugadores con 2 facciones asimétricas, 30 partidas proporcionan una referencia para detectar desequilibrios en la tasa de victorias superiores al 15% con una confianza del 80%. Para un juego de 4 jugadores con 6 facciones, el espacio de combinación requiere más de 150 partidas para obtener datos significativos sobre cada par de facciones. En la práctica, la mayoría de los editores independientes usan la matemática para verificar los valores esperados y detectar la dominancia obvia, las pruebas de juego para encontrar valores atípicos y casos extremos, y los comentarios de la comunidad tras el lanzamiento para identificar los problemas de equilibrio que sobrevivieron a ambas etapas. La combinación de los tres produce un equilibrio más fiable que cualquier enfoque único.

Un juego donde la matemática está diseñada para ser visible

La escala de ingresos, los umbrales de coalición y el sistema de dados de Neutronium: Parallel Wars están construidos sobre una matemática probabilística explícita. Únete a la lista de espera para las actualizaciones del lanzamiento.

Unirse a la lista de espera →