fbpx
Wikipedia

Matriz de pagos

En teoría de juegos, la matriz de pagos (a veces también llamada matriz de recompensas) es una matriz que resume la información dada por las funciones de pago en un juego rectangular o en un juego extensivo en su forma normal.

Matriz de pagos para juegos bipersonales de suma cero.

Sea (N, Dj,φj) un juego rectangular, bipersonal y de suma cero (es decir, aquel en que la ganancia de un jugador es igual a la pérdida del otro). Si n y m denotan la cantidad de estrategias del jugador 1 y 2 respectivamente, entonces la matriz de pagos del juego, de tamaño nxm se define entrada a entrada como:

 

Esto es, la entrada i,j representará el pago que resulta para el jugador 1 cuando éste siguió su estrategia i y el jugador 2 por su parte usó la estrategia j. Para este tipo de juegos conocer los pagos del jugador 1 es suficiente para conocer los pagos del jugador 2, de modo que la matriz resume toda la información necesaria para calcular dichos pagos.


Ejemplo.

Consideremos el juego piedra, papel o tijera, donde el perdedor debe pagar una unidad monetaria al ganador y en caso de empate no hay pago para ninguno. La siguiente tabla puede considerarse una matriz de pagos para el juego:

Piedra Papel Tijera
Piedra 0 -1 +1
Papel +1 0 -1
Tijera -1 +1 0

Si numeramos las estrategias piedra, papel y tijera como 1, 2 y 3 respectivamente, la matriz de pagos será por definición:

 

Matriz de pagos para juegos bipersonales.

En general no es posible saber cuál es el pago para el jugador 2 conociendo solamente los pagos del jugador 1. Cuando el juego no es de suma cero una matriz con entradas unidimensionales no puede mostrar toda la información sobre los pagos; para lograrlo es necesario introducir un vector bidimensional (que representará el pago para el jugador 1 y 2 respectivamente) en cada entrada de la matriz. En fórmulas, esto quiere decir que la matriz de pagos para un juego bipersonal en general está dada por:

 

Esto es, la entrada i,j será el vector (a,b), donde a es el pago para el jugador 1 y b es el pago para el jugador 2 cuando el jugador 1 elige la estrategia i y el jugador 2 por su parte elige la estrategia j.

Ejemplo.

En el juego de piedra papel o tijera se pueden cambiar los pagos para hacerlo un juego de suma distinta de cero. Supongamos que una persona externa al juego paga una unidad monetaria al ganador, mientras que el perdedor no paga nada. En caso de empate, ninguno de los dos gana nada. Si volvemos a numerar las estrategias piedra, papel y tijera con 1, 2 y 3 respectivamente entonces la matriz de pagos del juego está dada por:

 

Desde luego, la matriz de pagos de cualquier juego de suma cero puede expresarse del mismo modo, pero en esos casos habrá información duplicada. En el primer ejemplo la matriz de pago general para juegos bipersonales resultaría:

 

Nótese que al ser de suma cero la segunda entrada de cada vector es justamente el inverso aditivo de la primera entrada. De ahí que para juegos de suma cero sea suficiente conocer una sola de las componentes y que se elimine la otra.

Matriz de pagos para juegos n-personales.

Es posible generalizar el concepto de matriz de pagos a varios jugadores. Sea   un juego rectangular, donde N es el número de jugadores. Sea   el número de estrategias del jugador k. Entonces la matriz de pagos del juego será una matriz N-dimensional de tamaño   y con entradas en ℝ  dadas por:

 

En este caso el significado intuitivo de la fórmula es el mismo que en el caso bidimensional. Al ser la matriz de múltiples dimensiones, es imposible ejemplificarlo gráficamente.


Matriz de pagos para juegos en forma extensiva.

Muchos de los modelos de la teoría de juegos no se pueden expresar como un juego rectangular y es necesario plantearlos como juegos extensivos. En estos casos también existe una matriz de pagos asociada al juego y resulta ser la matriz de pagos del juego en su forma normal.


Matrices de pagos y equilibrios de Nash.

En muchas ocasiones la matriz de pagos de un juego es muy útil para calcular sus equilibrios de Nash en estrategias puras. En los juegos bipersonales de suma cero los equilibrios de Nash (si existen) se encuentran buscando entradas que sean puntos silla de la matriz de pagos. Intuitivamente, un punto silla de una matriz es aquella entrada que sea al mismo tiempo la menor de su renglón y la mayor de su columna.

Para el caso de juegos rectangulares bipersonales de suma distinta de cero, los equilibrios de Nash se suelen encontrar por simple inspección de la matriz recordando la definición de equilibrio de Nash.

Ejemplos.

Piedra, papel o tijera.

Consideremos nuevamente el juego de piedra, papel o tijera en su forma de suma cero. En este caso el juego no tiene equilibrios de Nash en estrategias puras, pues su matriz de pagos no tiene una entrada que sea simultáneamente la menor de su renglón y la mayor de su columna.


Dilema del prisionero.

Consideremos el dilema del prisionero, con dos estrategias cada uno (confesar (1) y no confesar (2) en ambos casos) y pagos dados por la matriz de pagos:

 

Las entradas representan el número de años de cárcel que recibirá cada preso de acuerdo a la estrategia que hayan elegido por separado. Es claro que cada preso busca quedarse el menor tiempo en la cárcel y por lo tanto su objetivo es minimizar los pagos dados por la matriz. Notemos que el pago por la estrategia (confesar, confesar) (representado por la entrada 2,2 en la matriz) es un equilibrio de Nash, pues ningún jugador puede mejorar su pago cambiando su estrategia mientras el otro mantenga la suya.

Referencias

  1. H.S. Bierman, L. Fernández, "Game Theory with Economic Applications", Addison-Wesley, 1993.
  2. K. Binmore, "Teoría de Juegos", McGraw-Hill, 1994.
  3. R. Gibbons, "Un Primer Curso de Teoría de Juegos", Antoni Bosh, 1996.
  4. Zapata L. Paloma, "Economía, Política y Otros Juegos: Una Introducción a los Juegos No Cooperativos", las prensas de ciencias, 2007.
  •   Datos: Q9030573

matriz, pagos, teoría, juegos, matriz, pagos, veces, también, llamada, matriz, recompensas, matriz, resume, información, dada, funciones, pago, juego, rectangular, juego, extensivo, forma, normal, Índice, para, juegos, bipersonales, suma, cero, ejemplo, para, . En teoria de juegos la matriz de pagos a veces tambien llamada matriz de recompensas es una matriz que resume la informacion dada por las funciones de pago en un juego rectangular o en un juego extensivo en su forma normal Indice 1 Matriz de pagos para juegos bipersonales de suma cero 1 1 Ejemplo 2 Matriz de pagos para juegos bipersonales 2 1 Ejemplo 3 Matriz de pagos para juegos n personales 4 Matriz de pagos para juegos en forma extensiva 5 Matrices de pagos y equilibrios de Nash 5 1 Ejemplos 6 ReferenciasMatriz de pagos para juegos bipersonales de suma cero EditarSea N Dj fj un juego rectangular bipersonal y de suma cero es decir aquel en que la ganancia de un jugador es igual a la perdida del otro Si n y m denotan la cantidad de estrategias del jugador 1 y 2 respectivamente entonces la matriz de pagos del juego de tamano nxm se define entrada a entrada como a i j f 1 i j displaystyle a ij varphi 1 i j Esto es la entrada i j representara el pago que resulta para el jugador 1 cuando este siguio su estrategia i y el jugador 2 por su parte uso la estrategia j Para este tipo de juegos conocer los pagos del jugador 1 es suficiente para conocer los pagos del jugador 2 de modo que la matriz resume toda la informacion necesaria para calcular dichos pagos Ejemplo Editar Consideremos el juego piedra papel o tijera donde el perdedor debe pagar una unidad monetaria al ganador y en caso de empate no hay pago para ninguno La siguiente tabla puede considerarse una matriz de pagos para el juego Piedra Papel TijeraPiedra 0 1 1Papel 1 0 1Tijera 1 1 0Si numeramos las estrategias piedra papel y tijera como 1 2 y 3 respectivamente la matriz de pagos sera por definicion A 0 1 1 1 0 1 1 1 0 displaystyle mathbb A begin pmatrix 0 amp 1 amp 1 1 amp 0 amp 1 1 amp 1 amp 0 end pmatrix Matriz de pagos para juegos bipersonales EditarEn general no es posible saber cual es el pago para el jugador 2 conociendo solamente los pagos del jugador 1 Cuando el juego no es de suma cero una matriz con entradas unidimensionales no puede mostrar toda la informacion sobre los pagos para lograrlo es necesario introducir un vector bidimensional que representara el pago para el jugador 1 y 2 respectivamente en cada entrada de la matriz En formulas esto quiere decir que la matriz de pagos para un juego bipersonal en general esta dada por a i j f 1 i j f 2 i j displaystyle a ij varphi 1 i j varphi 2 i j Esto es la entrada i j sera el vector a b donde a es el pago para el jugador 1 y b es el pago para el jugador 2 cuando el jugador 1 elige la estrategia i y el jugador 2 por su parte elige la estrategia j Ejemplo Editar En el juego de piedra papel o tijera se pueden cambiar los pagos para hacerlo un juego de suma distinta de cero Supongamos que una persona externa al juego paga una unidad monetaria al ganador mientras que el perdedor no paga nada En caso de empate ninguno de los dos gana nada Si volvemos a numerar las estrategias piedra papel y tijera con 1 2 y 3 respectivamente entonces la matriz de pagos del juego esta dada por A 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 0 0 displaystyle mathbb A begin pmatrix 0 0 amp 0 1 amp 1 0 1 0 amp 0 0 amp 0 1 0 1 amp 1 0 amp 0 0 end pmatrix Desde luego la matriz de pagos de cualquier juego de suma cero puede expresarse del mismo modo pero en esos casos habra informacion duplicada En el primer ejemplo la matriz de pago general para juegos bipersonales resultaria A 0 0 1 1 1 1 1 1 0 0 1 1 1 1 1 1 0 0 displaystyle mathbb A begin pmatrix 0 0 amp 1 1 amp 1 1 1 1 amp 0 0 amp 1 1 1 1 amp 1 1 amp 0 0 end pmatrix Notese que al ser de suma cero la segunda entrada de cada vector es justamente el inverso aditivo de la primera entrada De ahi que para juegos de suma cero sea suficiente conocer una sola de las componentes y que se elimine la otra Matriz de pagos para juegos n personales EditarEs posible generalizar el concepto de matriz de pagos a varios jugadores Sea N D j f j displaystyle N D j varphi j un juego rectangular donde N es el numero de jugadores Sea n k displaystyle n k el numero de estrategias del jugador k Entonces la matriz de pagos del juego sera una matriz N dimensional de tamano n 1 x n 2 x x n N displaystyle n 1 xn 2 x xn N y con entradas en ℝN displaystyle N dadas por a i 1 i 2 i N f 1 i 1 i 2 i N f 2 i 1 i 2 i N f N i 1 i 2 i N displaystyle a i 1 i 2 i N varphi 1 i 1 i 2 i N varphi 2 i 1 i 2 i N varphi N i 1 i 2 i N En este caso el significado intuitivo de la formula es el mismo que en el caso bidimensional Al ser la matriz de multiples dimensiones es imposible ejemplificarlo graficamente Matriz de pagos para juegos en forma extensiva EditarMuchos de los modelos de la teoria de juegos no se pueden expresar como un juego rectangular y es necesario plantearlos como juegos extensivos En estos casos tambien existe una matriz de pagos asociada al juego y resulta ser la matriz de pagos del juego en su forma normal Matrices de pagos y equilibrios de Nash EditarEn muchas ocasiones la matriz de pagos de un juego es muy util para calcular sus equilibrios de Nash en estrategias puras En los juegos bipersonales de suma cero los equilibrios de Nash si existen se encuentran buscando entradas que sean puntos silla de la matriz de pagos Intuitivamente un punto silla de una matriz es aquella entrada que sea al mismo tiempo la menor de su renglon y la mayor de su columna Para el caso de juegos rectangulares bipersonales de suma distinta de cero los equilibrios de Nash se suelen encontrar por simple inspeccion de la matriz recordando la definicion de equilibrio de Nash Ejemplos Editar Piedra papel o tijera Consideremos nuevamente el juego de piedra papel o tijera en su forma de suma cero En este caso el juego no tiene equilibrios de Nash en estrategias puras pues su matriz de pagos no tiene una entrada que sea simultaneamente la menor de su renglon y la mayor de su columna Dilema del prisionero Consideremos el dilema del prisionero con dos estrategias cada uno confesar 1 y no confesar 2 en ambos casos y pagos dados por la matriz de pagos A 6 6 0 10 10 0 2 2 displaystyle mathbb A begin pmatrix 6 6 amp 0 10 10 0 amp 2 2 end pmatrix Las entradas representan el numero de anos de carcel que recibira cada preso de acuerdo a la estrategia que hayan elegido por separado Es claro que cada preso busca quedarse el menor tiempo en la carcel y por lo tanto su objetivo es minimizar los pagos dados por la matriz Notemos que el pago por la estrategia confesar confesar representado por la entrada 2 2 en la matriz es un equilibrio de Nash pues ningun jugador puede mejorar su pago cambiando su estrategia mientras el otro mantenga la suya Referencias EditarH S Bierman L Fernandez Game Theory with Economic Applications Addison Wesley 1993 K Binmore Teoria de Juegos McGraw Hill 1994 R Gibbons Un Primer Curso de Teoria de Juegos Antoni Bosh 1996 Zapata L Paloma Economia Politica y Otros Juegos Una Introduccion a los Juegos No Cooperativos las prensas de ciencias 2007 Datos Q9030573 Obtenido de https es wikipedia org w index php title Matriz de pagos amp oldid 125269933, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos