fbpx
Wikipedia

Forma normal de un juego

En teoría de juegos, la forma normal es una forma de describir un juego. A diferencia de la forma extensiva, las representaciones en forma normal no son grafos, sino matrices. Esto puede ser de gran utilidad a la hora de identificar estrategias estrictamente dominantes y equilibrios de Nash. Por otra parte se pierde algo de información si la comparamos con la forma extensiva, pues ésta incluye todas las estrategias de cada jugador junto con sus recompensas.

En juegos estáticos de información completa y perfecta, una forma normal de representación de un juego es una especificación de los espacios de estrategia de los jugadores y las funciones de recompensa. Un espacio de estrategia de un jugador es el conjunto de estrategias disponibles para ese jugador, mientras que una estrategia es un plan completo de acción para cada situación del juego, sin tener en cuenta si esa situación se da realmente en el juego. Una función de recompensa de un jugador es una correspondencia entre el producto cruzado de los espacios de estrategia de los jugadores y el conjunto de recompensas del jugador (normalmente, el conjunto de los números reales, donde el número representa una utilidad ordinal o cardinal - a menudo cardinal) de un jugador, por ejemplo la función de recompensa de un jugador toma como entrada un perfil de estrategia (es decir, la especificación de las estrategias de cada jugador) y da lugar a una representación de la recompensa a su salida.

Ejemplo

Un juego en forma normal
Jugador 2 elige izquierda Jugador 2 elige derecha
Jugador 1 elige arriba 4, 3 -1, -1
Jugador 1 elige abajo 0, 0 3, 4

La matriz de la derecha es una representación en forma normal de un juego en el que los jugadores mueven simultáneamente (o, al menos, no conocen el movimiento del otro jugador) y reciben las recompensas tal y como se especifica para la combinación jugada. Por ejemplo, si el jugador 1 elige arriba y el jugador 2 elige izquierda, el jugador 1 recibe 4 y el jugador 2 recibe 3. En cada celda, el primer número representa la recompensa del jugador de las filas (en este caso el jugador 1), y el segundo número representa la recompensa del jugador de las columnas (en este caso el jugador 2).


Otras representaciones

A menudo, los juegos simétricos (donde las recompensas no dependen de qué jugador realice cada acción) se representan por una sola recompensa. Esta es la recompensa del jugador de las filas. Por ejemplo, las matrices de recompensa de la derecha y la izquierda representan el mismo juego.

Ambos jugadores
Ciervo Liebre
Ciervo 3, 3 0, 2
Liebre 2, 0 2, 2
Sólo filas
Ciervo Liebre
Ciervo 3 0
Liebre 2 2

Usos de la forma normal

Estrategias dominadas

El dilema del prisionero
Cooperar Traicionar
Cooperar 2, 2 0, 3
Traicionar 3, 0 1, 1

La matriz de recompensas facilita la eliminación de estrategias dominadas, y se usa habitualmente para ilustrar este concepto. Por ejemplo, en el dilema del prisionero (a la derecha), se puede determinar que Cooperar está estrictamente dominado por Traicionar. Se deben comparar los primeros números de cada columna, en este caso 3>2 y 1>0. Esto muestra que no importa lo que haga el jugador de las columnas, el jugador de las filas hará mejor escogiendo Traicionar. Similarmente, se compara la segunda recompensa de cada fila; otra vez 3>2 y 1>0. Esto muestra que no importa lo que haga el jugador de las columnas, el de las filas hará mejor escogiendo Traicionar. Esto demuestra que el único equilibrio de Nash de este juego es (Traicionar, Traicionar).

Juegos secuenciales en forma normal

Un juego secuencial
Izquierda, Izquierda Izquierda, Derecha Derecha, Izquierda Derecha, Derecha
Arriba 4, 3 4, 3 -1, -1 -1, -1
Abajo 0, 0 3, 4 0, 0 3, 4

Estas matrices sólo representan juegos en el que los movimientos son simultáneos (o, de forma más general, la información es imperfecta). La matriz de arriba no representa el juego en el que el jugador 1 mueve primero, es observado por el jugador 2 y entonces 2 mueve porque no especifica todas las estrategias de 2 en este caso. Para representar este juego secuencial debemos especificar todas las acciones del jugador 2, incluso en estrategias de situaciones que nunca pueden darse en el curso del juego. En este juego, el jugador 2 tiene dos acciones posibles, como antes, Izquierda y Derecha. Al contrario que antes, tiene cuatro estrategias, dependientes de las acciones del jugador 1. Estas estrategias son:

  1. Izquierda si 1 elige Arriba e Izquierda si no lo hace.
  2. Izquierda si 1 elige Arriba y Derecha si no lo hace.
  3. Derecha si 1 elige Arriba e Izquierda si no lo hace.
  4. Derecha si 1 elige Arriba y Derecha si no lo hace.

A la derecha está la representación en forma normal de este juego.

Formulación general

Para que un juego esté representado en forma normal, tienen que cumplirse los siguientes requisitos:

  • Hay un conjunto finito P de jugadores {1, 2,..., m}
 

Un perfil de estrategia pura es una asociación de estrategias con jugadores, que es una m-tupla

 

tal que

 

Llamamos al conjunto de perfiles de estrategia Σ

Una función de recompensa es una función

 

cuya interpretación es el premio que recibe cada jugador al final del juego. De acuerdo con esto, para especificar por completo un juego, la función de recompensa tiene que especificarse para cada jugador del conjunto de jugadores P={1, 2,..., m}. El juego es entonces una función

 

Definición: Un juego en forma normal es una estructura

 

donde P = {1,2,...,m} es un conjunto de jugadores,

 

es una m-tupla de conjuntos de estrategias puras, una para cada jugador, y

 

es una m-tupla de funciones de recompensa.

No hay ninguna razón para excluir juegos que tienen un número infinito de jugadores o un número infinito de estrategias por jugador. Sin embargo, el estudio de los juegos infinitos es más difícil, pues requiere usar técnicas de análisis funcional.

Una generalización adicional puede ser lograda dividiendo el juego en dos funciones: la "forma normal del juego", que describe la manera en que las estrategias definen eventos, y una segunda función, que ilustra las preferencias del jugador sobre el conjunto de eventos. Así:

 

donde   es el conjunto de eventos del juego. Y para cada jugador   hay una función de preferencia

 .

Referencias

  • J. Weibull, Evolutionary Game Theory, MIT Press, 1996

Enlaces externos

  •   Datos: Q1069099

forma, normal, juego, teoría, juegos, forma, normal, forma, describir, juego, diferencia, forma, extensiva, representaciones, forma, normal, grafos, sino, matrices, esto, puede, gran, utilidad, hora, identificar, estrategias, estrictamente, dominantes, equilib. En teoria de juegos la forma normal es una forma de describir un juego A diferencia de la forma extensiva las representaciones en forma normal no son grafos sino matrices Esto puede ser de gran utilidad a la hora de identificar estrategias estrictamente dominantes y equilibrios de Nash Por otra parte se pierde algo de informacion si la comparamos con la forma extensiva pues esta incluye todas las estrategias de cada jugador junto con sus recompensas En juegos estaticos de informacion completa y perfecta una forma normal de representacion de un juego es una especificacion de los espacios de estrategia de los jugadores y las funciones de recompensa Un espacio de estrategia de un jugador es el conjunto de estrategias disponibles para ese jugador mientras que una estrategia es un plan completo de accion para cada situacion del juego sin tener en cuenta si esa situacion se da realmente en el juego Una funcion de recompensa de un jugador es una correspondencia entre el producto cruzado de los espacios de estrategia de los jugadores y el conjunto de recompensas del jugador normalmente el conjunto de los numeros reales donde el numero representa una utilidad ordinal o cardinal a menudo cardinal de un jugador por ejemplo la funcion de recompensa de un jugador toma como entrada un perfil de estrategia es decir la especificacion de las estrategias de cada jugador y da lugar a una representacion de la recompensa a su salida Indice 1 Ejemplo 1 1 Otras representaciones 2 Usos de la forma normal 2 1 Estrategias dominadas 2 2 Juegos secuenciales en forma normal 3 Formulacion general 4 Referencias 5 Enlaces externosEjemplo EditarUn juego en forma normal Jugador 2 elige izquierda Jugador 2 elige derechaJugador 1 elige arriba 4 3 1 1Jugador 1 elige abajo 0 0 3 4La matriz de la derecha es una representacion en forma normal de un juego en el que los jugadores mueven simultaneamente o al menos no conocen el movimiento del otro jugador y reciben las recompensas tal y como se especifica para la combinacion jugada Por ejemplo si el jugador 1 elige arriba y el jugador 2 elige izquierda el jugador 1 recibe 4 y el jugador 2 recibe 3 En cada celda el primer numero representa la recompensa del jugador de las filas en este caso el jugador 1 y el segundo numero representa la recompensa del jugador de las columnas en este caso el jugador 2 Otras representaciones Editar A menudo los juegos simetricos donde las recompensas no dependen de que jugador realice cada accion se representan por una sola recompensa Esta es la recompensa del jugador de las filas Por ejemplo las matrices de recompensa de la derecha y la izquierda representan el mismo juego Ambos jugadores Ciervo LiebreCiervo 3 3 0 2Liebre 2 0 2 2 Solo filas Ciervo LiebreCiervo 3 0Liebre 2 2Usos de la forma normal EditarEstrategias dominadas Editar El dilema del prisionero Cooperar TraicionarCooperar 2 2 0 3Traicionar 3 0 1 1La matriz de recompensas facilita la eliminacion de estrategias dominadas y se usa habitualmente para ilustrar este concepto Por ejemplo en el dilema del prisionero a la derecha se puede determinar que Cooperar esta estrictamente dominado por Traicionar Se deben comparar los primeros numeros de cada columna en este caso 3 gt 2 y 1 gt 0 Esto muestra que no importa lo que haga el jugador de las columnas el jugador de las filas hara mejor escogiendo Traicionar Similarmente se compara la segunda recompensa de cada fila otra vez 3 gt 2 y 1 gt 0 Esto muestra que no importa lo que haga el jugador de las columnas el de las filas hara mejor escogiendo Traicionar Esto demuestra que el unico equilibrio de Nash de este juego es Traicionar Traicionar Juegos secuenciales en forma normal Editar Un juego secuencial Izquierda Izquierda Izquierda Derecha Derecha Izquierda Derecha DerechaArriba 4 3 4 3 1 1 1 1Abajo 0 0 3 4 0 0 3 4Estas matrices solo representan juegos en el que los movimientos son simultaneos o de forma mas general la informacion es imperfecta La matriz de arriba no representa el juego en el que el jugador 1 mueve primero es observado por el jugador 2 y entonces 2 mueve porque no especifica todas las estrategias de 2 en este caso Para representar este juego secuencial debemos especificar todas las acciones del jugador 2 incluso en estrategias de situaciones que nunca pueden darse en el curso del juego En este juego el jugador 2 tiene dos acciones posibles como antes Izquierda y Derecha Al contrario que antes tiene cuatro estrategias dependientes de las acciones del jugador 1 Estas estrategias son Izquierda si 1 elige Arriba e Izquierda si no lo hace Izquierda si 1 elige Arriba y Derecha si no lo hace Derecha si 1 elige Arriba e Izquierda si no lo hace Derecha si 1 elige Arriba y Derecha si no lo hace A la derecha esta la representacion en forma normal de este juego Formulacion general EditarPara que un juego este representado en forma normal tienen que cumplirse los siguientes requisitos Hay un conjunto finito P de jugadores 1 2 m Cada jugador k de P tiene un numero finito de estrategias puras S k 1 2 n k displaystyle S k 1 2 ldots n k dd Un perfil de estrategia pura es una asociacion de estrategias con jugadores que es una m tupla s s 1 s 2 s m displaystyle vec sigma sigma 1 sigma 2 ldots sigma m tal que s 1 S 1 s 2 S 2 s m S m displaystyle sigma 1 in S 1 sigma 2 in S 2 ldots sigma m in S m Llamamos al conjunto de perfiles de estrategia SUna funcion de recompensa es una funcion F S R displaystyle F Sigma rightarrow mathbb R cuya interpretacion es el premio que recibe cada jugador al final del juego De acuerdo con esto para especificar por completo un juego la funcion de recompensa tiene que especificarse para cada jugador del conjunto de jugadores P 1 2 m El juego es entonces una funcion p i N S i R N displaystyle pi prod i in mathrm N Sigma i to mathbb R mathrm N Definicion Un juego en forma normal es una estructura P S F displaystyle P mathbf S mathbf F donde P 1 2 m es un conjunto de jugadores S S 1 S 2 S m displaystyle mathbf S S 1 S 2 ldots S m es una m tupla de conjuntos de estrategias puras una para cada jugador y F F 1 F 2 F m displaystyle mathbf F F 1 F 2 ldots F m es una m tupla de funciones de recompensa No hay ninguna razon para excluir juegos que tienen un numero infinito de jugadores o un numero infinito de estrategias por jugador Sin embargo el estudio de los juegos infinitos es mas dificil pues requiere usar tecnicas de analisis funcional Una generalizacion adicional puede ser lograda dividiendo el juego en dos funciones la forma normal del juego que describe la manera en que las estrategias definen eventos y una segunda funcion que ilustra las preferencias del jugador sobre el conjunto de eventos Asi p i N S i G displaystyle pi prod i in mathrm N Sigma i to Gamma donde G displaystyle Gamma es el conjunto de eventos del juego Y para cada jugador i N displaystyle i in mathrm N hay una funcion de preferencia n i G R displaystyle nu i Gamma to mathbb R Referencias EditarR D Luce y H Raiffa Games and Decisions Dover Publications 1989 J Weibull Evolutionary Game Theory MIT Press 1996J von Neumann y O Morgenstern Theory of Games and Economic Behavior John Wiley Science Editions 1964 Publicado inicialmente por Princeton University Press en 1948 Enlaces externos Editarhttp www whalens org Sofia choice matrix htm Datos Q1069099 Obtenido de https es wikipedia org w index php title Forma normal de un juego amp oldid 142407462, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos