Red de conocimiento informático - Material del sitio web - ¿Cómo entender el aprendizaje automático?

¿Cómo entender el aprendizaje automático?

Lee estas historias y artículos todos los días. Habla con todos. Aprendizaje automático, aprendizaje automático, el aprendizaje automático de Baidu también está funcionando.

Machine Learning (Aprendizaje Automático), en mi opinión, es el proceso de dejar que las máquinas aprendan el pensamiento humano. El propósito del aprendizaje automático es permitir que las máquinas aprendan "la forma en que las personas entienden las cosas". Esperamos que lo que las personas aprenden de las cosas y las máquinas sean lo mismo. Hay un problema clásico en el aprendizaje automático:

"Supongamos que hay una pintura colorida en la que hay un bosque denso y un mono está sentado en un árbol de cuello torcido a lo lejos del bosque comiendo. Si le pedimos a una persona que localice al mono, generalmente le toma menos de un segundo señalar la ubicación del mono, y algunas personas incluso pueden verlo a primera vista".

Entonces la pregunta es, ¿cómo puede una persona reconocer a un mono de un vistazo en una imagen que es una mezcla de miles de colores? En nuestras vidas podemos ver todo tipo de cosas en todas partes, ¿cómo podemos identificar su diversidad? Quizás ya lo hayas pensado: experimentar. Así es, es experiencia. La teoría de la experiencia nos dice que todo lo que sabemos se adquiere mediante el aprendizaje. Por ejemplo, cuando mencionamos monos, nuestro cerebro pensará inmediatamente en varios monos que hemos visto. Siempre que las características de los monos en la pintura sean similares a las características de los monos en nuestra conciencia, podemos identificar la pintura como una. mono. . En casos extremos, cuando las características del mono en la pintura son exactamente las mismas que las de cierto tipo de mono que conocemos, juzgaremos a qué tipo pertenece el mono en la pintura.

Otra situación es cuando reconocemos algo incorrecto. De hecho, la tasa de error de las personas al identificar cosas es a veces muy alta. Por ejemplo, cuando encontramos una palabra que no reconocemos, inconscientemente pronunciamos la parte de la palabra que reconocemos. Por ejemplo, ¿tienes algún amigo que esté acostumbrado a pronunciar la palabra "como el fuego, como el té (chá)" como yo? Cometemos errores porque inconscientemente utilizamos la experiencia para explicar algo que no sabemos cuando no hemos visto la palabra antes.

En la actualidad, la tecnología está tan avanzada que algunas personas talentosas ya están considerando si las máquinas pueden imitar los métodos de reconocimiento humano para lograr el efecto del reconocimiento automático, y así surgió el aprendizaje automático.

---------------------

La unidad de la plataforma big data. Debido a la función Spark, los equipos de análisis se inclinan cada vez más a utilizar Spark como una plataforma de big data, y el aprendizaje automático/aprendizaje profundo es inseparable de big data.

-----------------------

Fundamentalmente, el reconocimiento es el resultado de la clasificación. Cuando vemos una criatura de cuatro patas, podemos clasificarla inmediatamente como un animal, porque más del 90% de las criaturas de cuatro patas que vemos a menudo son animales. Aquí viene la cuestión de la probabilidad. La razón por la que nuestra tasa de reconocimiento de las cosas que nos rodean es alta es que la mente subconsciente humana registra casi todas las características de las cosas que se ven a simple vista. Por ejemplo, cuando ingresamos a un grupo nuevo, al principio no todos se conocen y, a veces, los nombres de las personas no coinciden. La razón principal es que no comprendemos suficientemente las características de las cosas y no podemos identificarlas. Clasifiquelos en función de las características existentes. En este momento, a menudo tenemos este sentimiento: Oye, ¿parece que tu nombre es Zhang San? Oh, no, tu nombre parece ser John Doe. Este es el problema de la probabilidad en la clasificación. Puede haber un resultado de A, un resultado de B o incluso más resultados. La razón principal es que nuestro cerebro no ha recopilado suficientes características para clasificar con precisión. Cuando nos conocemos, podemos reconocer quién es quién de un vistazo, e incluso en casos extremos, solo podemos reconocer la voz sin ver a la persona, lo que demuestra que hemos captado las características de la cosa con bastante precisión.

Por lo tanto, creo que hay cuatro pasos básicos para que las personas identifiquen cosas: aprendizaje, extracción de características, reconocimiento y clasificación.

Entonces, ¿puede una máquina imitar este proceso de identificación? La respuesta es sí, pero no es fácil.

Hay tres dificultades: en primer lugar, el cerebro humano tiene innumerables neuronas para el intercambio y procesamiento de datos, y las mismas condiciones de procesamiento no se pueden lograr en las máquinas actuales. En segundo lugar, las personas extraen las características de las cosas de manera inconsciente y, en situaciones inconscientes, el error es muy grande; Al extraer información, en tercer lugar, y lo más importante, la experiencia humana proviene de cada momento de la vida humana. Es decir, los humanos están en el proceso de aprender cómo hacer que las máquinas realicen diversas tareas. Por lo tanto, el campo actual de la inteligencia artificial nunca ha alcanzado niveles humanos. Creo que la razón principal es que las máquinas no tienen mentes subconscientes. De hecho, el subconsciente humano no está completamente controlado por la conciencia humana, pero puede aumentar la probabilidad de que los seres humanos comprendan las cosas. No podemos cargar la mente subconsciente en la máquina, porque la conciencia cargada activamente es conciencia subjetiva y no puede realizar la función de la mente subconsciente humana en la máquina. Por lo tanto, a juzgar por el desarrollo actual, tomará muy poco tiempo alcanzar el nivel de ser completamente humano. Pero aun así, máquinas que son muy diferentes del pensamiento humano aún pueden ayudarnos en la vida. Por ejemplo, nuestra traducción en línea, sistemas de búsqueda, sistemas expertos, etc. de uso común son todos productos del aprendizaje automático.

Entonces, ¿cómo se implementa el aprendizaje automático?

En general, el aprendizaje automático consiste en imitar el proceso de reconocimiento humano de las cosas, es decir: aprender, extraer características, identificar y clasificar. Debido a que es imposible que una máquina elija naturalmente un método de clasificación basado en las características de cosas como un ser humano, la selección de métodos de aprendizaje automático aún requiere una selección manual. Actualmente, existen tres métodos principales de aprendizaje automático: aprendizaje supervisado, aprendizaje semisupervisado y aprendizaje no supervisado. El aprendizaje supervisado se refiere al uso de un conjunto de muestras de categorías conocidas para ajustar los parámetros de un clasificador para lograr el rendimiento deseado. En términos sencillos, significa inferir lo desconocido basándose en lo conocido. Los métodos representativos incluyen Nave Bayes, SVM, árbol de decisión, KNN, redes neuronales y análisis lógico, etc. Los métodos semisupervisados ​​consideran principalmente cómo utilizar una pequeña cantidad de muestras etiquetadas y una gran cantidad de muestras no etiquetadas para el entrenamiento y la clasificación, es decir, clasificar en función de una pequeña cantidad de contenido conocido y una gran cantidad de contenido desconocido. Los métodos representativos incluyen: método de expectativa máxima, método de modelo generativo y algoritmo gráfico. El aprendizaje no supervisado se refiere al uso de un conjunto de muestras de categorías conocidas para ajustar los parámetros del clasificador para lograr el rendimiento requerido. Es decir, autoestudio. Los métodos representativos provienen de estos tres aspectos: el aprendizaje no supervisado es el más inteligente y tiene el potencial de realizar la conciencia activa de la máquina, pero su desarrollo aún es relativamente lento; el aprendizaje supervisado es menos confiable y se infiere de lo desconocido significa aprender todas las posibilidades. todas las cosas. Esto es imposible en la realidad, y las personas también tienen la capacidad de aprender. En realidad, esto es imposible y los humanos no pueden hacerlo; el aprendizaje semisupervisado es "la única salida entre todos los caminos". Dado que el aprendizaje no supervisado es difícil y el aprendizaje supervisado no es confiable, se debe adoptar un enfoque de compromiso para aprovecharlo. cada uno. A juzgar por el desarrollo actual, la tecnología de aprendizaje supervisado ha madurado, mientras que el aprendizaje no supervisado aún está en su infancia. Por lo tanto, modificar los métodos de aprendizaje supervisado para lograr un aprendizaje semisupervisado es la corriente principal actual. Pero estos métodos básicamente solo pueden extraer información y no pueden hacer predicciones efectivas (la gente piensa que como no se puede obtener más, basta con mirar lo que se tiene, por lo que surgió la minería de datos).

El aprendizaje automático de Baidu también está trabajando duro. ¿Espero que 2017 pueda ser aún mejor ~~~~~~~?