Resumen de las consideraciones sobre el procesamiento de archivos Python
Resumen de las precauciones de procesamiento de archivos de Python
El procesamiento de archivos es una operación común en la programación. Es muy fácil de abrir, cerrar, renombrar, eliminar, agregar, copiar y leer y leer aleatoriamente. Escribir archivos. Lo que hay que tener en cuenta es el cierre seguro del archivo. Es fácil y conveniente utilizar la instrucción with:
1.Procesamiento de archivos CSV
El módulo csv puede manejar archivos csv. Bueno, aunque el módulo Pandas puede manejar mejor archivos csv grandes y también puede manejar HTML, etc., y proporciona procesamiento de bloques.
2.Procesamiento de archivos XML
Para archivos xml más pequeños, es mejor usar cElementTree, o al menos ElementTree. Para archivos grandes, es mejor usar lxml para el procesamiento.
3. Serialización y serialización del contenido del archivo
Usar pickle para lograr la serialización y deserialización es muy simple, pero tenga cuidado. operaciones, la fuente de datos es confidencial y existen riesgos de seguridad. Otra forma de serialización es json. Lo mismo ocurre con dumps () y load (), que tienen buena escalabilidad y pueden especificar un decodificador. El rendimiento es peor que el de pickle.
4. Procesamiento de archivos de registro
Cuando utilice el módulo de registro para registrar archivos de registro, debe prestar atención al hecho de que el registro es seguro para subprocesos para evitar que varios procesos escriban el mismo registro. al mismo tiempo.
5. Procesamiento de archivos de imágenes
Para el procesamiento de imágenes de archivos normales, el módulo PIL es suficiente. En el entorno Linux, preste atención a la instalación de bibliotecas de imágenes relacionadas. Generalmente, la biblioteca ImageMagick es la primera opción. Si se trata de un procesamiento profundo de imágenes, como el reconocimiento de imágenes, debe buscar ayuda de OpenCV