¿Qué tipo de tecnología de inteligencia artificial utiliza AlphaGo?
Aprendizaje profundo.
AlphaGo es el primer robot de inteligencia artificial que derrota a un jugador humano de Go profesional y el primero en derrotar a un campeón mundial de Go. Está dirigido por Demis Hassabis de DeepMind, una filial del equipo de desarrollo de Google. Su principal principio de funcionamiento es el "aprendizaje profundo".
En marzo de 2016, Alpha Go compitió contra el campeón mundial de Go y jugador profesional de 9-dan Go Lee Sedol en una batalla entre humanos y máquinas de Go y ganó con una puntuación total de 4 a 1 a finales de 2016; y a principios de 2017, el programa se convirtió en el más popular en los juegos de ajedrez chinos. Usando la cuenta registrada "Master" en el sitio web, compitió en partidas rápidas de ajedrez con docenas de maestros de Go de China, Japón y Corea del Sur, sin perder un solo jugador. juego único durante 60 juegos consecutivos.
En mayo de 2017, en la Cumbre de Go de Wuzhen en China, jugó contra el campeón mundial de Go número uno del mundo, Ke Jie, y ganó con un marcador total de 3-0. En la comunidad de Go se reconoce que la destreza ajedrecística de Alpha Go ha superado el nivel más alto del Go profesional humano. En el ranking mundial de Go profesional publicado por el sitio web GoRatings, su puntuación ha superado la de Ke Jie, el jugador humano número uno.
Aprendizaje profundo
AlphaGo es un programa de inteligencia artificial de Go. Su principal principio de funcionamiento es el "aprendizaje profundo". El "aprendizaje profundo" se refiere a redes neuronales artificiales de múltiples capas y métodos para entrenarlas. Una capa de red neuronal toma una gran cantidad de números de matriz como entrada, selecciona pesos mediante métodos de activación no lineal y luego produce otro conjunto de datos como salida.
Esto es similar al mecanismo de funcionamiento del cerebro neuronal biológico. A través del número apropiado de matrices, múltiples capas de organizaciones se unen para formar un "cerebro" de red neuronal para un procesamiento preciso y complejo, tal como. cómo las personas reconocen objetos y anotan imágenes.
Alpha Go utiliza muchas tecnologías nuevas, como redes neuronales, aprendizaje profundo, métodos de búsqueda de árboles de Monte Carlo, etc., lo que ha dado un salto sustancial en su fuerza. Tian Yuandong, el desarrollador del software Go "Dark Forest" de Facebook en los Estados Unidos, publicó un artículo de análisis en línea diciendo que el sistema Alpha Go consta principalmente de varias partes:
1. , dada la situación actual Posicione, prediga y muestree el próximo movimiento.
2. El despliegue rápido tiene el mismo objetivo que la red de políticas, pero con el sacrificio apropiado de la calidad del movimiento, la velocidad es 1000 veces más rápida que la red de políticas.
3. Value Network Dada la situación actual, se estima si las blancas tienen una mayor probabilidad de ganar o las negras tienen una mayor probabilidad de ganar.
4. Monte Carlo Tree Search conecta las cuatro partes anteriores para formar un sistema completo.