Cómo aprender mejor el aprendizaje automático
Cómo dominar mejor el aprendizaje automático
Colorado es candidato a doctorado en la Universidad de Berkeley y fundador de Metacademy. Metacademy es una excelente plataforma de código abierto en la que muchos profesionales escriben artículos wiki. Actualmente, estos artículos giran principalmente en torno a los dos temas de aprendizaje automático e inteligencia artificial.
Según la sugerencia de Colorado, la forma de aprender mejor el aprendizaje automático es seguir aprendiendo a través de libros. Él cree que el propósito de la lectura es tener libros en mente.
No es sorprendente que un estudiante de doctorado dé tales consejos. Este sitio puede haber recomendado consejos similares antes. Este consejo está bien, pero no creo que funcione para todos. Si eres desarrollador y quieres implementar algoritmos de aprendizaje automático. Los libros que se enumeran a continuación son una buena referencia para aprender paso a paso.
Hoja de ruta del aprendizaje automático
Su hoja de ruta sobre el aprendizaje automático se divide en 5 niveles, y cada nivel corresponde a un libro que se debe dominar. Los 5 niveles son los siguientes:
Nivel 0 (principiante): lea "Data Smart: uso de la ciencia de datos para transformar la información en conocimiento". Se requieren conocimientos avanzados de flujo de datos, hojas de cálculo y algunos algoritmos.
Nivel 1 (Aprendiz): Leer "Aprendizaje automático con R". Aprenda a aplicar diferentes algoritmos de aprendizaje automático en R en diferentes situaciones. Requiere un poco de conocimientos básicos de programación, álgebra lineal, cálculo y teoría de probabilidades.
Nivel 2 (trabajador cualificado): Leer "Reconocimiento de patrones y aprendizaje automático". Comprender matemáticamente cómo funcionan los algoritmos de aprendizaje automático. Comprenda y depure el resultado de los métodos de aprendizaje automático mientras desarrolla una comprensión más profunda de los conceptos de aprendizaje automático. Requiere algoritmos, buena álgebra lineal, cierta integración de vectores y cierta experiencia en implementación de algoritmos.
Nivel 3 (Maestría): Leer "Modelos Gráficos Probabilísticos: Principios y Técnicas". Obtenga información sobre temas avanzados como optimización convexa, optimización combinatoria, teoría de probabilidad, geometría diferencial y otros conocimientos matemáticos. Obtenga más información sobre los modelos gráficos probabilísticos, cuándo deben usarse y cómo interpretar su resultado.
Nivel 4 (Gran Maestro): Siéntete libre de aprenderlo y recuerda dar tu opinión a la comunidad.
Colorado ofrece sugerencias de lectura para los capítulos de los libros enumerados en cada nivel y sugiere proyectos principales relacionados para aprender.
Colorado volvió a publicar una publicación de blog con ligeras modificaciones en la hoja de ruta. Eliminó el último nivel y definió los nuevos de la siguiente manera: Curioso, Novato, Aprendiz, Oficial, Maestro. Dijo que aquellos que sientan curiosidad por el aprendizaje automático en el Nivel 0 no deberían leer libros relevantes, sino buscar y ver los mejores videos relacionados con el aprendizaje automático.
El tema olvidado en el aprendizaje automático
Scott Locklin también leyó el blog de Colorado y se inspiró en él para escribir un artículo correspondiente llamado "Machine Neglected Ideas in Learning" (bellamente ilustrado por Boris Artzybasheff).
Scott cree que las sugerencias dadas por Colorado no introducen completamente el campo del aprendizaje automático. Él cree que pocos libros pueden hacer esto, pero todavía le gusta el libro "Aprendizaje automático: el arte y la ciencia de los algoritmos que dan sentido a los datos" de Peter Flach porque también aborda algunos conceptos oscuros de la tecnología.
Scott enumera las cosas que se ignoran demasiado en el libro. Como sigue:
Aprendizaje en tiempo real: importante para la transmisión de datos y big data, consulte Vowpal Wabbit.
Aprendizaje por refuerzo: discutido en robótica, pero rara vez en aprendizaje automático.
Tecnología de predicción de secuencias "comprimidas": descubrimiento de patrones de aprendizaje a partir de datos comprimidos. Consulte CompLearn.
Tecnología orientada a series temporales.
Predicción consistente: Modelos de estimación precisos para el aprendizaje en tiempo real.
Aprendizaje automático en el contexto del ruido: como PNL y CV.
Ingeniería de características: la clave para el éxito del aprendizaje automático.
Aprendizaje no supervisado y semisupervisado.
Esta lista hace un buen trabajo al señalar áreas desapercibidas en el aprendizaje automático.
Finalmente, también tengo una hoja de ruta para el aprendizaje automático. Al igual que con Colorado, mi hoja de ruta se limita al aprendizaje automático supervisado de tipo clasificación/regresión, pero es un trabajo en progreso que requiere más investigación y agregar todos los temas de interés. A diferencia del anterior "simplemente lea estos libros", esta hoja de ruta brindará pasos detallados.