fbpx
Wikipedia

AlphaZero

AlphaZero es un programa informático desarrollado por DeepMind, que utiliza un enfoque generalizado de AlphaGo Zero. El 5 de diciembre de 2017, el equipo de DeepMind lanzó una preimpresión presentando AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en ajedrez, shogi y Go al derrotar a los campeones del mundo, Stockfish, Elmo y la versión de 3 días de AlphaGo Zero en cada caso. AlphaZero dominó a Stockfish después de solo 4 horas de autoaprendizaje, sin acceso a libros de apertura o base de datos de tablas de finales.[1][2][3]

Relación con AlphaGo Zero

AlphaZero (AZ) es una variante más generalizada del algoritmo AlphaGo Zero (AGZ), y es capaz de jugar shogi y ajedrez, así como Go. Las diferencias entre AZ y AGZ incluyen:

  • AZ tiene reglas codificadas para establecer hiperparámetros de búsqueda.
  • La red neuronal ahora se actualiza continuamente.
  • Go (a diferencia del ajedrez) es simétrico bajo ciertas reflexiones y rotaciones; AGZ fue programado para aprovechar estas simetrías. AZ no es.
  • El ajedrez (a diferencia de Go) puede terminar empatado. por lo tanto, AZ puede tener en cuenta la posibilidad de las tablas.

AlphaZero vs Stockfish y Elmo

Al comparar las búsquedas de árbol de búsqueda Monte Carlo, AlphaZero busca solo 80,000 posiciones por segundo en ajedrez y 40,000 en shogi,[4]​ en comparación con 70 millones para Stockfish y 35 millones para Elmo. AlphaZero compensa el menor número de evaluaciones mediante el uso de su red neuronal profunda para centrarse mucho más selectivamente en la variación más prometedora.[1]

Resultados

En las partidas de ajedrez de AlphaZero contra Stockfish, a cada programa se le dio un minuto de tiempo de reflexión por jugada. AlphaZero ganó 25 partidas con las blancas, ganó 3 con las negras y empató las 72 restantes.[1][5]​ En 2017, StockFish 8 era el campeón vigente del campeonato organizado por chess.com de ajedrez por computadora, con un Elo de 3400 puntos.[6]

En cien partidas de shogi contra Elmo, AlphaZero ganó noventa y perdió ocho.[1]

Después de 8 horas de autoaprendizaje de Go teniendo como contrincante a una versión previa de AlphaZero, AlphaZero ganó sesenta partidas y perdió cuarenta.[1]

En una versión actualizada de AlphaZero este venció a Stockfish 8 en un match de 1000 partidas, obteniendo un resultado de +155 -6 = 839.[7]​Calculando este resultado en Elo, AlphaZero sería superior a Stockfish 8 en 53 puntos Elo. La diferencia de Elo es mucho menor de lo que parece y se explica por la gran cantidad de tablas en el match. (Alphazero obtuvo el 57.45% de los puntos vs 42.55% que obtuvo StockFish 8[8]​).

Referencias

  1. Silver, David; Hubert, Thomas; Schrittwieser, Julian (5 de diciembre de 2017). Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (en inglés). pp. 4-5. Consultado el 7 de diciembre de 2017. 
  2. «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (en inglés británico). Telegraph.co.uk. 6 de diciembre de 2017. Consultado el 6 de diciembre de 2017. 
  3. «DeepMind’s AI became a superhuman chess player in a few hours, just for fun». The Verge. 6 de diciembre de 2017. Consultado el 6 de diciembre de 2017. 
  4. Alphazero, un avance muy significativo en la Inteligencia Artificial
  5. «'Superhuman' Google AI claims chess crown». BBC News. 6 de diciembre de 2017. Consultado el 7 de diciembre de 2017. 
  6. «Stockfish gana el Campeonato de módulos de ajedrez». chess.com. 18 de noviembre de 2017. Consultado el 7 de diciembre de 2017. 
  7. https://www.chess.com/es/news/view/alphazero-stockfish-ajedrez
  8. https://chess24.com/es/informate/noticias/la-impresionante-fuerza-de-alphazero

Enlaces externos

  • AlphaZero: Shedding new light on the grand games of chess, shogi and Go
  •   Datos: Q44860007

alphazero, programa, informático, desarrollado, deepmind, utiliza, enfoque, generalizado, alphago, zero, diciembre, 2017, equipo, deepmind, lanzó, preimpresión, presentando, logró, horas, nivel, juego, sobrehumano, ajedrez, shogi, derrotar, campeones, mundo, s. AlphaZero es un programa informatico desarrollado por DeepMind que utiliza un enfoque generalizado de AlphaGo Zero El 5 de diciembre de 2017 el equipo de DeepMind lanzo una preimpresion presentando AlphaZero que logro en 24 horas un nivel de juego sobrehumano en ajedrez shogi y Go al derrotar a los campeones del mundo Stockfish Elmo y la version de 3 dias de AlphaGo Zero en cada caso AlphaZero domino a Stockfish despues de solo 4 horas de autoaprendizaje sin acceso a libros de apertura o base de datos de tablas de finales 1 2 3 Indice 1 Relacion con AlphaGo Zero 2 AlphaZero vs Stockfish y Elmo 3 Resultados 4 Referencias 5 Enlaces externosRelacion con AlphaGo Zero EditarAlphaZero AZ es una variante mas generalizada del algoritmo AlphaGo Zero AGZ y es capaz de jugar shogi y ajedrez asi como Go Las diferencias entre AZ y AGZ incluyen AZ tiene reglas codificadas para establecer hiperparametros de busqueda La red neuronal ahora se actualiza continuamente Go a diferencia del ajedrez es simetrico bajo ciertas reflexiones y rotaciones AGZ fue programado para aprovechar estas simetrias AZ no es El ajedrez a diferencia de Go puede terminar empatado por lo tanto AZ puede tener en cuenta la posibilidad de las tablas AlphaZero vs Stockfish y Elmo EditarAl comparar las busquedas de arbol de busqueda Monte Carlo AlphaZero busca solo 80 000 posiciones por segundo en ajedrez y 40 000 en shogi 4 en comparacion con 70 millones para Stockfish y 35 millones para Elmo AlphaZero compensa el menor numero de evaluaciones mediante el uso de su red neuronal profunda para centrarse mucho mas selectivamente en la variacion mas prometedora 1 Resultados EditarEn las partidas de ajedrez de AlphaZero contra Stockfish a cada programa se le dio un minuto de tiempo de reflexion por jugada AlphaZero gano 25 partidas con las blancas gano 3 con las negras y empato las 72 restantes 1 5 En 2017 StockFish 8 era el campeon vigente del campeonato organizado por chess com de ajedrez por computadora con un Elo de 3400 puntos 6 En cien partidas de shogi contra Elmo AlphaZero gano noventa y perdio ocho 1 Despues de 8 horas de autoaprendizaje de Go teniendo como contrincante a una version previa de AlphaZero AlphaZero gano sesenta partidas y perdio cuarenta 1 En una version actualizada de AlphaZero este vencio a Stockfish 8 en un match de 1000 partidas obteniendo un resultado de 155 6 839 7 Calculando este resultado en Elo AlphaZero seria superior a Stockfish 8 en 53 puntos Elo La diferencia de Elo es mucho menor de lo que parece y se explica por la gran cantidad de tablas en el match Alphazero obtuvo el 57 45 de los puntos vs 42 55 que obtuvo StockFish 8 8 Referencias Editar a b c d e Silver David Hubert Thomas Schrittwieser Julian 5 de diciembre de 2017 Mastering Chess and Shogi by Self Play with a General Reinforcement Learning Algorithm en ingles pp 4 5 Consultado el 7 de diciembre de 2017 Entire human chess knowledge learned and surpassed by DeepMind s AlphaZero in four hours en ingles britanico Telegraph co uk 6 de diciembre de 2017 Consultado el 6 de diciembre de 2017 DeepMind s AI became a superhuman chess player in a few hours just for fun The Verge 6 de diciembre de 2017 Consultado el 6 de diciembre de 2017 Alphazero un avance muy significativo en la Inteligencia Artificial Superhuman Google AI claims chess crown BBC News 6 de diciembre de 2017 Consultado el 7 de diciembre de 2017 Stockfish gana el Campeonato de modulos de ajedrez chess com 18 de noviembre de 2017 Consultado el 7 de diciembre de 2017 https www chess com es news view alphazero stockfish ajedrez https chess24 com es informate noticias la impresionante fuerza de alphazeroEnlaces externos EditarAlphaZero Shedding new light on the grand games of chess shogi and Go Datos Q44860007 Obtenido de https es wikipedia org w index php title AlphaZero amp oldid 138267141, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos