Red de conocimiento informático - Consumibles informáticos - ¿Por qué AlphaGo puede derrotar a Go?

¿Por qué AlphaGo puede derrotar a Go?

Demis Hassabis, el padre de phaGo, pronunció recientemente un discurso titulado "Más allá de los límites de la cognición humana" en su alma mater, la Universidad de Cambridge, Inglaterra, respondiendo las preguntas del mundo sobre la inteligencia artificial. Muchas preguntas sobre Alpha Dog: ¿Qué área del juego de ajedrez ha subestimado la importancia de los humanos en los últimos 3000 años? ¿Qué trucos únicos utilizó AlphaGo para ganar al noveno dan profesional coreano Lee Sedol el año pasado? ¿Es Master, el misterioso jugador de ajedrez que ganó varios Masters internacionales a principios de este año, un perro alfa? ¿Por qué Go es un misterio difícil para la inteligencia artificial?

Jamis Hassabis, fundador de Deep Mind y padre de AlphaGo, empezó a jugar al ajedrez a los 4 años. Su éxito en el tablero cuando tenía 8 años le impulsó a empezar a pensar en dos cosas que lo que ha hecho hasta ahora. Preguntas que le preocupaban: primero, ¿cómo aprende el cerebro humano a completar tareas complejas? En segundo lugar, ¿puede una computadora hacer esto? A la edad de 17 años, Hassabis fue responsable del desarrollo del clásico juego de simulación Theme Park, lanzado en 1994.

Posteriormente completó una licenciatura en informática en la Universidad de Cambridge y entró en el University College London en 2005 para realizar un doctorado en neurociencia, con la esperanza de comprender cómo funciona el cerebro real para promover el desarrollo de la inteligencia artificial. . Fundó la empresa Deep Mind en 2014. El producto AlphaGo de la empresa se hizo famoso en 2016 cuando derrotó al campeón de Go Lee Sedol.

El padre de AlphaGo pronunció un discurso de 45 minutos en la Universidad de Cambridge:

Muchas gracias por estar aquí hoy. Hoy hablaré sobre inteligencia artificial y lo reciente de DeepMind. Logros. Para hacer algo, llamé a este informe "Más allá de los límites de la cognición humana". Espero que al final del informe, todos comprendan claramente las ideas que quiero transmitir.

1. ¿Sabes realmente qué es la inteligencia artificial?

Para aquellos que no conocen DeepMind, permítanme darles una breve introducción. Establecimos esta empresa en Londres en 2010. En 2014, fuimos adquiridas por Google con la esperanza de acelerar nuestros pasos en la tecnología de inteligencia artificial. . ¿Cuál es nuestra misión? Nuestra primera misión es resolver el problema de la inteligencia artificial; una vez solucionado este problema, en teoría se puede solucionar cualquier problema. Estas son nuestras dos misiones principales. Puede parecer un poco astuto, pero realmente creemos que si se resuelven los problemas más básicos de la inteligencia artificial, ningún problema será difícil.

Entonces, ¿cómo vamos a lograr este objetivo? DeepMind ahora está trabajando arduamente para construir la primera máquina de aprendizaje de propósito general del mundo. En términos generales, el aprendizaje se puede dividir en dos categorías: una es aprender directamente de los aportes y la experiencia. aprender de los datos originales en sí; el segundo tipo de sistema de aprendizaje es un sistema de aprendizaje general, que se refiere a un algoritmo que se puede utilizar en diferentes tareas y campos, incluso en algunos campos nuevos que nunca antes se han visto. Seguramente todo el mundo se preguntará: ¿cómo logra esto el sistema?

De hecho, el cerebro humano es un ejemplo muy obvio. Esto es posible. La clave está en cómo encontrar las soluciones y algoritmos más adecuados a través de una gran cantidad de recursos de datos. A este tipo de sistema lo llamamos inteligencia artificial general para distinguirlo de la inteligencia artificial restringida que la mayoría de nosotros usamos hoy en día y que solo ejerce su experiencia en un campo determinado. Este tipo de inteligencia artificial restringida ha sido muy popular en los últimos 40-50 años. años.

El sistema Deep Blue inventado por IBM es un buen ejemplo de inteligencia artificial limitada (derrotó al campeón de ajedrez Gary Kasporov a finales de los años 1990). Hoy hemos alcanzado un nuevo punto de inflexión en la inteligencia artificial y contamos con tecnologías más avanzadas y más compatibles.

En mayo de 1997, IBM se enfrentó al campeón mundial de ajedrez Garry Kasparov.

2. ¿Cómo hacer que las máquinas obedezcan órdenes humanas?

Quizás quieras preguntar cómo una máquina obedece las órdenes humanas. De hecho, no es la máquina o el algoritmo en sí, sino la cristalización de la sabiduría de un grupo de programadores inteligentes. Hablaron con cada maestro de ajedrez, aprendieron de su experiencia, la transformaron en códigos y reglas y formaron el equipo de maestros de ajedrez más fuerte de la humanidad. Pero un sistema así se limita al ajedrez y no puede utilizarse para otros juegos. Para juegos nuevos, debes comenzar a programar nuevamente. Hasta cierto punto, estas tecnologías todavía no son perfectas y no son inteligencia artificial completa en el sentido tradicional. Lo que falta es universalidad y aprendizaje. Queremos resolver este problema mediante el "aprendizaje por refuerzo". Aquí explico el aprendizaje por refuerzo. Creo que mucha gente conoce este algoritmo.

En primer lugar, imaginemos que hay un sujeto en el campo de la IA, llamamos sujeto a nuestro sistema de inteligencia artificial. Necesita comprender el entorno en el que se encuentra y hacer todo lo posible para descubrirlo. quiere lograr. El entorno aquí puede referirse a eventos reales, puede ser un robot o puede ser un mundo virtual, como un entorno de juego; el sujeto entra en contacto con el entorno circundante de dos maneras: primero se familiariza con el entorno; observación, primero usamos la visión, pero también a través del oído y el tacto. Espera, también estamos desarrollando un sistema multisensorial;

La segunda tarea es modelar y encontrar la mejor opción en base a esto. Esto puede implicar anticipar el futuro, imaginarlo y probar hipótesis. Este tema suele estar en un entorno real. Cuando llega el nodo de tiempo, el sistema necesita generar la mejor solución encontrada actualmente. Esta solución puede cambiar el entorno en mayor o menor medida, impulsando así aún más los resultados observados y transmitiéndolos al sujeto.

En pocas palabras, este es el principio del aprendizaje por refuerzo. Aunque el diagrama esquemático es simple, implica algoritmos y principios extremadamente complejos. Si podemos resolver la mayoría de estos problemas, podremos construir una inteligencia artificial ubicua. Esto se debe a dos razones principales: en primer lugar, desde un punto de vista matemático, mi socio, un doctorado, construyó un sistema llamado 'AI-XI'. Utilizando este modelo, demostró que, en condiciones y tiempo de hardware de computadora. información necesaria para construir una inteligencia artificial universal en circunstancias ilimitadas. Además, desde una perspectiva biológica, tanto de animales como de humanos, el cerebro humano está controlado por la dopamina, que realiza conductas que mejoran el aprendizaje. Por tanto, ya sea desde una perspectiva matemática o biológica, el aprendizaje por refuerzo es una herramienta eficaz para resolver problemas de inteligencia artificial.

3. ¿Por qué Go es un misterio difícil para la inteligencia artificial?

A continuación, hablaré principalmente sobre nuestra última tecnología, que es Alpha Dog, que nació el año pasado. Espero que todos aquí entiendan este juego y traten de jugarlo. El go se juega en un tablero de ajedrez con forma de cuadrícula cuadrada y piezas de ajedrez redondas en blanco y negro. Hay 19 líneas rectas verticales y horizontales en el tablero de ajedrez, que dividen el tablero en 361 intersecciones. Las piezas de ajedrez se mueven en las intersecciones y los dos lados. juega al ajedrez alternativamente. Gana el jugador con más áreas rodeadas. Las reglas del Go no son muy complicadas y te las puedo enseñar en cinco minutos. Lo que muestra esta imagen es que un juego ha terminado y todo el tablero está básicamente cubierto de piezas de ajedrez. Luego cuenta los espacios rodeados por tus piezas de ajedrez y los espacios rodeados por las piezas de ajedrez del oponente, ganará. En la partida reñida que se muestra en la imagen, las blancas ganan por un estrecho margen de una casilla.

Las blancas ganaron por poco por una casilla.

De hecho, es muy difícil entender el objetivo final de este juego, porque no tiene un objetivo directo y claro como el ajedrez en Go, es completamente intuitivo, e incluso cómo decidir el. El final del juego es muy importante para los principiantes, pero para los eruditos es difícil. El Go es un juego con una larga historia, con una historia de más de 3.000 años. Se originó en China. En Asia, el Go tiene un profundo significado cultural. Confucio también señaló que el Go es una de las cuatro habilidades principales que todo verdadero erudito debe dominar (jugar ajedrez, caligrafía y pintura), por lo que el Go es un arte en Asia y lo practican expertos.

Hoy en día, este juego es aún más popular, con 40 millones de personas jugando al Go y más de 2000 jugadores de primer nivel. Si demuestras talento en el Go cuando tienes entre 4 y 5 años, estos niños serán seleccionados y. Ingresó a una escuela profesional especial de Go, donde los estudiantes, a partir de los 6 años, pasan 12 horas al día aprendiendo Go, los siete días de la semana, todos los días. No abandones la escuela y te gradúes hasta convertirte en un experto en el campo. Estos expertos básicamente dedican toda la energía de su vida a aprender y dominar esta habilidad. Creo que Go puede ser el juego más elegante.

Como dije, este juego tiene solo dos reglas muy simples, pero su complejidad es inimaginable. Hay 10170 (10 elevado a 170) posibilidades en un ***. de átomos en todo el universo, 1080 (10 elevado a 80). No hay forma de enumerar exhaustivamente todos los resultados posibles de Go. Necesitamos un enfoque más inteligente. Quizás se pregunte por qué a las computadoras les resulta tan difícil jugar al Go. En 1997, la inteligencia artificial de IBM, DeepBlue, derrotó al entonces campeón mundial de ajedrez, Garry Kasparov. El Go siempre ha sido un misterio difícil en el campo de la inteligencia artificial. ¿Podemos crear un algoritmo que pueda competir con el campeón mundial de Go? Para lograrlo, existen dos grandes desafíos:

Primero, el espacio de búsqueda es enorme (el factor de rama es 200. Un buen ejemplo es que en Go, en promedio, cada pieza de ajedrez tiene dos cientos de). posiciones posibles, en comparación con sólo 20 en el ajedrez. El factor de ramificación del Go es mucho mayor que el del ajedrez.

En segundo lugar, lo que es más difícil que esto es que casi no existe una función de evaluación adecuada para definir quién es el ganador y cuánto ha ganado; esta función de evaluación es crucial para el sistema; Para el ajedrez, escribir una función de evaluación es muy simple, porque el ajedrez no es solo un juego relativamente simple, sino también un juego físico. Puedes sacar una conclusión fácilmente con solo contar las piezas de ambos lados. También puedes evaluar el ajedrez a través de otros indicadores, como la movilidad de las piezas de ajedrez.

Todo esto es imposible en Go. No todas las partes son iguales. Incluso un pequeño cambio en una pequeña parte cambiará completamente el patrón. Por lo tanto, cada pequeña pieza de ajedrez tiene su propia influencia en el juego. . impacto crucial. La parte más difícil es que yo llamo al ajedrez un juego de destrucción. Cuando el juego comienza, todas las piezas de ajedrez están en el tablero. A medida que avanza el juego, las piezas de ajedrez son tomadas por el oponente, el número de piezas de ajedrez sigue disminuyendo. y el juego se vuelve cada vez más sencillo. Por el contrario, el Go es un juego constructivo. Al principio, el tablero está vacío y poco a poco los dos jugadores lo van llenando.

Por lo tanto, si vas a juzgar la situación actual en el mediocampo, en el ajedrez, sólo necesitas mirar el tablero actual para que te diga la situación general en el Go, debes evaluar lo que puede pasar en el; el futuro. ¿Qué podemos hacer para evaluar la situación actual? En comparación, Go es mucho más difícil. Mucha gente también ha intentado aplicar la tecnología de DeepBlue al Go, pero los resultados no son los ideales. Estas tecnologías ni siquiera pueden vencer a un jugador profesional de Go, y mucho menos a un campeón mundial.

Así que todos tenemos que preguntarnos, incluso si es tan difícil operar una computadora, ¿cómo resuelven los humanos este problema? De hecho, los humanos dependen de la intuición y Go es un juego que se basa en la intuición en lugar del cálculo desde el principio. Por lo tanto, si le preguntas a un jugador de ajedrez por qué hizo este movimiento así, te dirá que después de este movimiento, cuál será el siguiente movimiento y el siguiente movimiento, y qué propósito se puede lograr. Un plan así puede que a veces no sea satisfactorio, pero al menos los jugadores tienen una razón.

Sin embargo, el Go es diferente. Si le preguntas a un maestro de clase mundial por qué hizo este movimiento, a menudo te responderá que tu intuición le dice que haga este movimiento. Esto es cierto y no pueden describirlo. razón de. Esperamos resolver este problema utilizando el aprendizaje por refuerzo para mejorar el algoritmo de la red neuronal artificial.

Intentamos imitar este comportamiento intuitivo de los humanos a través de redes neuronales profundas. Aquí, necesitamos entrenar dos redes neuronales, una es la red de toma de decisiones. Descargamos millones de juegos de Go de aficionados de Internet. El perro simula el comportamiento de los humanos jugando Go; seleccionamos aleatoriamente una posición en el tablero de ajedrez y entrenamos al sistema para predecir la próxima decisión que tomarán los humanos. La entrada al sistema son las cinco o diez primeras posiciones que tienen más probabilidades de ocurrir; en esa posición particular, muévete; de ​​esta manera, solo tienes que mirar esas 5-10 posibilidades en lugar de analizar las 200 posibilidades.

Una vez que tenemos esto, entrenamos el sistema millones de veces, potenciando el aprendizaje a través de errores, y para las situaciones ganadoras, el sistema es consciente de que será mejor la próxima vez que ocurra una situación similar. decisiones similares. Por el contrario, si el sistema pierde, no elegirá este movimiento la próxima vez que ocurra una situación similar. Establecimos nuestra propia base de datos de juegos, entrenamos el sistema a través de millones de juegos y obtuvimos la segunda red neuronal. Elija diferentes puntos de ubicación, aprenda a través del intervalo de confianza y seleccione la situación en la que puede ganar. La probabilidad está entre 0 y 1. 0 significa que es imposible ganar y 1 significa que ganará el 100%.

Al combinar estas dos redes neuronales (red de decisión y red numérica), podemos estimar aproximadamente la situación actual. Estos dos árboles de redes neuronales, a través del algoritmo de Monte Carlo, hacen que este problema originalmente irresoluble tenga solución. Recopilamos la mayoría de los métodos de Go y luego competimos con el campeón europeo de Go. El resultado fue que AlphaGo ganó. Ese fue nuestro primer avance, y el algoritmo relacionado también se publicó en la revista científica "Nature".

A continuación, creamos un premio de 1 millón de dólares en Corea del Sur y, en marzo de 2016, tuvimos un duelo con el campeón mundial de Go Lee Sedol. El Sr. Lee Sedol es una leyenda en el mundo del Go y ha sido considerado el principal experto en Go en los últimos 10 años. Jugamos contra él y descubrimos que tenía muchas formas innovadoras de jugar y, a veces, AlphaGo era difícil de controlar. Antes de que comenzara el juego, todos en el mundo (incluido él mismo) pensaron que ganaría estos cinco juegos fácilmente, pero el resultado real fue que nuestro Alpha Dog ganó 4:1. Tanto los expertos en Go como los expertos en el campo de la inteligencia artificial dicen que esto tiene una importancia trascendental. Para aquellos en la industria, esto nunca antes se había pensado.

4. ¿Qué área clave del juego de ajedrez ha sido ignorada por los humanos?

Este también es un evento casual único para nosotros. Este juego es visto por 2.800 millones de personas en todo el mundo y hay más de 35.000 informes al respecto. Toda Corea estuvo entusiasmada con el tema esa semana. Es algo realmente maravilloso. Para nosotros lo importante no es que AlphaGo haya ganado este juego, sino entender y analizar cómo ganó y qué tan innovador es este sistema. AlphaGo no sólo imita los movimientos de otros jugadores humanos, sino que innova constantemente. Aquí hay un ejemplo, esta es una situación en el segundo juego, movimiento 37, este movimiento es mi movimiento favorito en todo el juego. Aquí, el negro representa a Alpha Dog, quien coloca la pieza en la posición marcada por el triángulo en el diagrama. ¿Por qué este paso es tan crítico? ¿Por qué todos están tan conmocionados?

Imagen de la izquierda: En la segunda partida, paso 37, posición de las negras. Imagen de la derecha: Dos piezas de ajedrez que antes parecían estar en problemas.

De hecho, hay dos líneas divisorias cruciales en Go, la tercera línea desde la derecha. Si mueves una pieza en la tercera línea, significa que ocuparás el campo a la derecha de esta línea. Y si colocas la piedra en la cuarta línea, significa que quieres marchar hacia el centro del tablero. Potencialmente, el área que ocuparás en otras partes del tablero en el futuro puede ser equivalente al área que obtengas en el tablero. tercera línea.

Durante los últimos 3.000 años, la gente ha creído que realizar un movimiento en la tercera línea tiene la misma importancia que realizar un movimiento en la cuarta línea. Pero en este juego se puede ver que en el paso 37, Alpha Dog se instaló en la quinta línea y entró en la zona central del juego de ajedrez. Esta línea está más cerca del área central que la cuarta línea. Esto puede significar que, durante miles de años, la gente ha subestimado la importancia de la zona central del juego.

Lo interesante es que el Go es un arte, un arte objetivo. Cada uno de los que estamos sentados aquí puede tener cientos de ideas nuevas debido al buen o mal humor, pero eso no significa que cada idea sea buena. Alpha Dog, por otro lado, es objetivo y su objetivo es ganar el juego.

5. ¿En qué trucos únicos se basó AlphaGo para derrotar a Lee Sedol?

Todos pueden ver que en el juego de ajedrez actual, las dos piezas de ajedrez marcadas con triángulos en la esquina inferior izquierda parecen estar en dificultad, y después de 15 movimientos, el poder de estas dos piezas de ajedrez se extendió al centro del juego de ajedrez continúa hacia el lado derecho del tablero, realizando el movimiento 37 exactamente aquí, convirtiéndose en un factor decisivo para ganar. AlphaGo es muy innovador en este sentido. Yo también soy un jugador de ajedrez aficionado, así que veamos qué tiene que decir un experto de talla mundial, Michael Redmond, sobre este movimiento. Michael es un jugador de noveno Dan (el nivel más alto en Go), al igual que el Dan negro en Kung Fu. Dijo: "Este es un movimiento muy impactante, como una decisión equivocada, Michael realmente colocó el ajedrez". pieza en otro lugar al principio, sin esperar que Alpha Dog hiciera este movimiento. Hay muchas más innovaciones como esta en esta competición. En este sentido, estoy particularmente agradecido al Sr. Li Shishi. De hecho, cayó cuando ganamos los primeros tres juegos.

En marzo de 2016, AlphaGo luchó contra el campeón mundial de Go Lee Sedol y derrotó a los humanos con una puntuación total de 4:1.

Fueron tres partidos muy difíciles, sobre todo el primero. Debido a que necesitamos entrenar constantemente nuestro algoritmo, AlphaGo derrotó al campeón europeo antes. Después de este juego, conocemos la diferencia entre el campeón europeo y el campeón mundial. En teoría, nuestro sistema también ha mejorado. Pero cuando entrenas el sistema, no sabemos cuánto está sobreajustado, por lo que el sistema no conoce sus estadísticas hasta que termina el primer juego. Entonces, de hecho, estábamos muy nerviosos en el primer juego, porque si perdíamos el primer juego, era muy probable que hubiera una gran laguna en nuestro algoritmo y podríamos perder cinco juegos seguidos. Pero si ganamos el primer juego, demostraremos que nuestro sistema de ponderación es correcto.

Sin embargo, el Sr. Lee Sedol regresó en el cuarto juego y quizás la presión se alivió mucho. Hizo un movimiento muy innovador, que creo que es un movimiento innovador en la historia. Este paso confundió a AlphaGo y provocó que su árbol de decisiones cometiera errores de cálculo. Algunos expertos chinos incluso lo llamaron "la mano de Dios". A través de este ejemplo, podemos ver cuánta filosofía contiene Go. Estos grandes expertos gastaron toda su energía para encontrar este tipo de mano divina. De hecho, en este movimiento, AlphaGo sabía que se trataba de un movimiento muy inusual. En ese momento, estimó que la probabilidad de que Lee Sedol ganara con este movimiento era de 0,007. AlphaGo nunca antes había visto un movimiento así. Es necesario investigar los cálculos de decisión. Acabo de mencionar el impacto de este juego: 2.800 millones de personas lo vieron, 35.000 artículos en los medios sobre él, entradas agotadas en Internet en Occidente, escucho al MIT (Instituto Tecnológico de Massachusetts, EE. UU.) y muchos otros en colegios y universidades. , muchas personas se han unido recientemente al club Go.

En el cuarto juego, el movimiento innovador número 78 de Lee Sedol.

Acabo de hablar de intuición e innovación. La intuición es una expresión implícita. Es una forma de pensamiento basada en la experiencia y el instinto humanos y no requiere cálculos precisos. La exactitud de esta decisión se puede juzgar a través del comportamiento. En Go, es muy simple. Ingresamos la posición de la pieza de ajedrez en el sistema para evaluar su importancia. AlphaGo simula este comportamiento intuitivo de los humanos. Creo que la innovación es generar una perspectiva original e innovadora basada en el conocimiento y la experiencia existentes. Alpha Dog demuestra claramente ambas habilidades.

6. El Maestro derrotó a Ke Jie en el medio juego. ¿Ke Jie todavía tiene esperanzas?

Así que nuestro tema de hoy es “Más allá de los límites de la cognición humana”. Desde marzo del año pasado, hemos estado mejorando y mejorando continuamente Alpha Dog. Quizás te preguntes, ahora que somos campeones del mundo, ¿qué más podemos mejorar? De hecho, creemos que Alpha Dog aún no es perfecto y es necesario realizar más investigaciones.

En primer lugar, queremos continuar estudiando el cuarto juego contra Lee Sedol que acabamos de mencionar para llenar los vacíos de conocimiento; este problema realmente se resolvió y hemos establecido una nueva puntuación de Alpha Dog. sistema, a diferencia del sistema principal, este sistema derivado se utiliza para confundir el sistema principal. También hemos optimizado el comportamiento del sistema. Antes nos llevaba al menos 3 meses entrenar el sistema, pero ahora solo lleva una semana.

En segundo lugar, debemos comprender la decisión tomada por Alpha Dog y explicarla; por qué Alpha Dog hizo esto, si está en línea con los pensamientos humanos, etc., comparamos la respuesta del cerebro humano a diferentes tipos. La reacción de la posición de la pieza de ajedrez y la reacción de Alpha Dog a la posición de la pieza de ajedrez, para encontrar algún conocimiento nuevo, esencialmente es hacer que el sistema sea más profesional; Competimos contra los mejores expertos del mundo en Internet. Usamos un seudónimo (Master) al principio y, después de una racha ganadora, todos adivinaron que era Alpha Dog. Estos son los mejores expertos y hasta ahora hemos ganado 60 maestrías. Si realiza un análisis bayesiano simple, encontrará que la dificultad de AlphaGo para ganar contra diferentes oponentes es diferente. Además, AlphaGo también se innova constantemente. Por ejemplo, la pieza de ajedrez en la esquina inferior derecha de la imagen (marcada con un círculo) cae en la segunda línea. En el pasado, no pensábamos que esta fuera una posición válida. De hecho, algunos equipos de Corea del Sur se han reservado estos juegos y quieren estudiar nuevos significados y mensajes.

Alpha Dog se innova y cae en la bandera de la segunda línea de la parrilla.

Ke Jie es a la vez el campeón chino de Go y el actual campeón mundial de Go. Tiene sólo 19 años. También compitió contra AlphaGo en línea. Después del juego, dijo que los humanos hemos estado estudiando Go durante miles de años, pero la inteligencia artificial nos dice que ni siquiera hemos arañado la superficie. También dijo que la combinación de humanos e inteligencia artificial marcará el comienzo de una nueva era y descubrirán juntos el verdadero significado de Go. De manera similar, Ke Jie mencionó la verdad del Go. De lo que estamos hablando aquí es de una verdad científica.

Master, el misterioso jugador de ajedrez popular en Internet, derrotó a Ke Jie en la plataforma de juego Tencent Go el 3 de enero de 2017.

Master derrotó a Ke Jie en el medio juego. Master es una versión mejorada de AlphaGo.

¿Ha llegado realmente una nueva era del Go? Estos acontecimientos trascendentales han ocurrido dos veces en la historia del Go. La primera vez ocurrió en Japón alrededor de 1600. En Japón, en las décadas de 1930 y 1940, Wu Qingyuan, un maestro de Go muy destacado en Japón en ese momento, propuso un nuevo. teoría sobre Go. La teoría ha llevado a Go a un nivel completamente nuevo. Se dice que AlphaGo ha provocado la tercera revolución en el mundo del Go.

El 23 de mayo, Ke Jie jugó ajedrez con Alphago. ¿Todavía hay esperanza para Ke Jie?

7. ¿Por qué la inteligencia artificial es mejor para "jugar al Go" que para "jugar al ajedrez"?

Me gustaría explicar por qué la inteligencia artificial ha hecho una contribución mucho mayor al mundo del Go que al mundo del ajedrez. Si miramos al actual campeón mundial de ajedrez, Magnus Carlsen, en realidad no es muy diferente de los campeones mundiales anteriores. Todos son buenos e inteligentes. Pero, ¿por qué cuando surja la inteligencia artificial, podrán superar con creces a los humanos? Creo que la razón de esto es que el ajedrez tiene más que ver con táctica, mientras que AlphaGo tiene más que ver con estrategia. Los mejores programas de ajedrez del mundo actual ya no cometen errores técnicos y es imposible que los humanos no cometan errores.

En segundo lugar, el ajedrez tiene una enorme base de datos. Si hay menos de 9 piezas en el tablero, se pueden utilizar algoritmos matemáticos para calcular quién gana y quién pierde. La computadora puede calcularlo mediante miles de algoritmos iterativos.

Por lo tanto, no hay forma de que los humanos ganen jugando al ajedrez cuando hay menos de nueve piezas en el tablero.

Por lo tanto, el algoritmo de ajedrez ya es casi perfecto y no tenemos forma de mejorarlo. Sin embargo, Alpha Dog en Go crea constantemente nuevas ideas. Cuando juega contra personas reales, los mejores jugadores pueden tener en cuenta estas nuevas ideas y mejorarse constantemente.

Como dijo el campeón europeo de Go Fan Hui (el primer jugador profesional humano en jugar contra AlphaGo), en el proceso de duelo con AlphaGo, los métodos de juego constantemente innovadores del robot también permiten que los seres humanos sigan saltando de sus propias limitaciones de pensamiento y mejorarse constantemente. Todo el mundo sabe que después de más de 30 años de formación en escuelas profesionales de Go, muchas de sus ideas se han solidificado y las ideas innovadoras de los robots pueden brindarles una inspiración inesperada. Realmente creo que si los humanos y los robots nos unimos, podemos crear muchas cosas increíbles. Nuestra verdadera naturaleza y nuestro verdadero potencial están realmente desatados.

8. ¿Cuál es el propósito de Alpha Dog si no es ganar el juego?

Al igual que los astrónomos usan el Telescopio Hubble para observar el universo, usando Alpha Dog, los expertos en Go pueden explorar su mundo desconocido y explorar los misterios del mundo Go. Inventamos AlphaGo no para ganar el juego de Go, sino para construir una plataforma eficaz para probar nuestros propios algoritmos de inteligencia artificial. Nuestro objetivo final es aplicar estos algoritmos al mundo real y servir a la sociedad.

Un gran desafío al que se enfrenta el mundo hoy es el exceso de información y sistemas complejos. ¿Cómo podemos encontrar las leyes y estructuras entre ellos, desde las enfermedades hasta el clima, que necesitamos para resolver problemas en diferentes campos? Estas áreas son tan complejas que ni siquiera los humanos más inteligentes pueden resolverlas.

Creo que la inteligencia artificial es una forma potencial de resolver estos problemas. En la era actual de nuevas tecnologías, la inteligencia artificial debe desarrollarse y utilizarse dentro del alcance de la ética humana. Originalmente, la tecnología es neutral, pero el propósito de su uso y el alcance de su uso determinan en gran medida su función y naturaleza. Debe ser una tecnología que beneficie a todos.

Mi propio ideal es hacer posible que los científicos de inteligencia artificial o asistentes de inteligencia artificial y asistentes médicos a través de mis propios esfuerzos, a través de esta tecnología, podamos realmente acelerar la actualización y el progreso de la tecnología.