Cómo evaluar el marco de aprendizaje profundo LiFT
1. El archivo parece completo. Qué hace cada capa y qué parámetros se escriben, pero muchas personas no pueden entender su uso específico en la documentación sin mirar el código. Esto se puede ver en la discusión de este número. De manera similar, parece que hay muchos ejemplos, todos los cuales se pueden ejecutar directamente, y todos son conjuntos de datos del mundo real, que se ven muy bien, pero de hecho, para principiantes, si el modelo requerido no es exactamente el mismo que el del ejemplo, entonces no es fácil entender en qué formato se deben formatear los datos de entrada y salida. Por ejemplo, los ejemplos están clasificados, pero no hay ejemplos con anotación de secuencia. Si lo quieres como etiqueta pos, no sé cómo organizar los datos. Por supuesto, estos problemas se pueden resolver leyendo el código o leyendo la discusión durante un día, pero creo que muchas personas no leerán el código ni la discusión en serio, sino que cambiarán directamente las herramientas. Siento que el documento actual solo puede ser entendido por personas que entienden el código, y es inútil sin leer el documento.
El proyecto es muy sencillo, por lo que no hay muchos desarrolladores, pero es muy activo y cada día se añaden cosas nuevas. Hoy se lanzó una nueva rama backend, que puede usar theano o tensorflow, pero parece que debido a que no admite el escaneo, el backend usa la capa recursiva de tensorflow, que no está implementada. También son conscientes de los problemas de documentación y creen que es necesario agregar más tutoriales para usuarios novatos en lugar de simplemente mostrárselos a los desarrolladores.
Nunca he usado otros frameworks, solo keras.
Es beneficioso aprender el uso básico de theano.
El código de la biblioteca en sí es relativamente simple y fácil de leer, e incluso un novato en Python como yo puede entenderlo. Actualmente existen dos modelos: modelo secuencial y modelo gráfico. El primero no se refiere a la recursividad, sino al hecho de que la red es jerárquica (incluida la recursividad). Otros conceptos importantes incluyen capas, regularización, optimización y objetivos. La capa se utiliza para construir la función de salida de cada capa. El modelo utilizará la salida de la última capa para determinar el costo final en función del objetivo y el regularizador de cada capa, y luego usará el optimizador para actualizar los parámetros durante el proceso de actualización. Al observar estos cuatro, agregar la función de ajuste al modelo usará theano.
Se pueden cubrir muchos modelos, incluido seq2seq. Le sugiero que no solo mire los ejemplos, sino que mire la discusión en github. Si no lo encuentras, pregunta.
En términos de eficiencia, no sé cómo optimizar theano. Siento que este paquete de keras no tiene costo, al igual que yo mismo uso theano nativo. Por supuesto, Theano en sí es muy lento. . Supongo que no sé cómo usarlo.