Errores comunes cometidos por estudiantes de Python
9 errores comunes cometidos por principiantes en Python, una guía para que los principiantes eviten trampas
1. No usar un entorno virtual
Esto no es un problema de codificación en en sí, pero sigo pensando que es una muy buena práctica aislar el entorno para cada tipo de proyecto.
¿Por qué utilizar un entorno dedicado para cada proyecto?
La primera razón es el problema de la gestión de paquetes propia de Python. Queremos minimizar los conflictos entre paquetes y versiones.
Otra razón es que nuestro código y nuestras dependencias se pueden implementar fácilmente en cualquier ubicación.
El uso de un entorno virtual puede comenzar desde Anaconda o Pipe nv. Si desea profundizar más, Docker es la mejor opción.
2. Uso excesivo de Jup y ter Notebook
Los portátiles son excelentes para fines educativos y para realizar algunos trabajos de análisis rápidos y complejos, pero no pueden usarse como un buen IDE.
Un buen IDE es un arma real a la hora de abordar tareas de ciencia de datos y puede mejorar enormemente la eficiencia de tu trabajo.
Los cuadernos son fantásticos para realizar experimentos y puedes mostrar fácilmente los resultados a otras personas. Pero es propenso a errores, y cuando se trata de ejecutar proyectos colaborativos y desplegables a largo plazo, es mejor usar un IDE, como código VS, Py charm, Spyder, etc.
3. Utilice rutas absolutas en lugar de relativas.
El mayor problema con las rutas absolutas es que no se pueden implementar de manera conveniente. La forma principal de resolver este problema es configurar el directorio de trabajo. el directorio raíz del proyecto, y No incluya archivos fuera del directorio del proyecto en su proyecto y use rutas relativas para todas las rutas en su código.
4. No manejar advertencias
Cuando nuestro código se ejecuta pero produce mensajes de advertencia extraños, estamos felices de que finalmente el código se ejecute y reciba resultados significativos. Pero, ¿debemos ocuparnos de estas advertencias?
En primer lugar, las advertencias no son errores en sí mismas, sino recordatorios de errores o problemas potenciales. Las advertencias aparecen cuando algo en su código funciona correctamente
pero tal vez no de la forma prevista.
Las advertencias más comunes que encuentro son la configuración de Pandas con advertencia de copia y advertencia de desaprobación.
La razón principal para configurar con advertencia de copia es la advertencia que ocurre cuando Pandas detecta una asignación encadenada (Asignación encadenada). Deberíamos evitar asignar valores a los resultados de índices encadenados, porque esta operación puede informar advertencias. o Probablemente no lo reporte.
DeprecationWarning generalmente indica que Pandas ha dejado de usar algunas funciones y que su código se romperá al usar una versión posterior.
El consejo aquí es no ocuparse de todas las advertencias, pero debe comprender las causas de todas las advertencias, saber qué advertencias se pueden ignorar en un proyecto específico y qué advertencias tienen un impacto en los resultados allí. Habrá consecuencias y se debe evitar.
5. Las listas por comprensión no se utilizan (rara vez se utilizan)
Las listas por comprensión son una característica muy poderosa de Python. Muchos bucles for se pueden reemplazar con listas por comprensión que son más legibles, más pitónicas y más rápidas.
Puedes ver a continuación un código de muestra diseñado para leer un archivo CSV en un directorio. Como puede ver, Tim es fácil de mantener cuando utiliza listas por comprensión.
6. Las anotaciones de tipo no son aplicables
Las anotaciones de tipo (o sugerencias de tipo) son métodos para asignar tipos a variables. Cuando el IDE solicita IntelliSense, puede proporcionarnos el tipo de variable/parámetro del indicador.
Esto no solo puede mejorar la velocidad de nuestro desarrollo, sino que también puede ser de gran ayuda a la hora de leer el código.
Si lo escribimos así, no sabemos los tipos de a, b y tiempos en absoluto.
Pero con la adición de anotaciones de tipo, sabemos que a y b son cadenas y los tiempos son números enteros.
Cabe señalar que Python introdujo anotaciones de tipo en la versión 3.5, y Python No verifique el tipo durante la ejecución. Tenga en cuenta que solo proporciona una conveniente herramienta de verificación de tipo estático para que LDE realice una verificación de tipo estático en lenguajes dinámicos para evitar algunos errores potenciales.
7. El código de Pandas no está estandarizado
El encadenamiento de métodos es una gran característica de Pandas, pero si hay muchas operaciones incluidas en una línea, el código puede volverse ilegible.
Un truco que hace que este enfoque sea aún más fácil es poner la expresión entre paréntesis, de modo que puedas usar una línea para cada componente de la expresión.
8. No cumplir con las convenciones de PEP
Cuando comienzas a programar en Python, el código puede ser tosco e ilegible. Esto se debe a que no tenemos nuestras propias reglas de diseño. nosotros El código se ve mejor. Sería laborioso y laborioso diseñar tales reglas nosotros mismos y requeriría mucha práctica. Afortunadamente, Python tiene reglas oficiales que se han especificado: PEP, que es la guía de estilo oficial de Python.
Aunque las reglas de PEP son muchas y engorrosas, podemos ignorar algunas reglas de PEP pero usarlas en el 90% del código.