Cómo utilizar el análisis y la visualización de características de datos de Python
Cómo evaluar el uso de Python para crear interfaces de recopilación, cálculo y visualización de datos
1. Por qué utilizar Python para el análisis de datos
En primer lugar, porque Python puede integrar fácilmente código C, C++, Fortran y algunos algoritmos subyacentes escritos en C son muy eficientes cuando se encapsulan en paquetes de Python. Y tanto Python como Ruby tienen una gran cantidad de marcos web, por lo que se utilizan para la construcción de sitios web. Por otro lado, personalmente creo que debido a que Python, como lenguaje interpretado, es más simple que un lenguaje compilado, puede procesar grandes cantidades. de datos a través de scripts simples. Un lenguaje unificado utilizado dentro de la organización mejorará enormemente la eficiencia del trabajo.
2. ¿Por qué utilizar R para el análisis de datos?
La ventaja de R es que tiene funciones estadísticas integrales que se pueden llamar, especialmente en el análisis de series de tiempo (utilizado principalmente en finanzas). análisis y predicción de tendencias) ) Tanto los métodos clásicos como los de vanguardia tienen paquetes correspondientes para uso directo en comparación con Python, que es mucho más pobre en este sentido; Además, el lenguaje R tiene potentes funciones de visualización. Se puede crear un diagrama de caja de diagrama de dispersión, que es más simple que Excel.
En términos de entorno de uso, SAS se usa ampliamente en empresas, gobiernos e instituciones militares debido a su certificación autorizada; SPSS y R se usan principalmente en instituciones de investigación científica, y existe una gran cantidad de R comerciales; software para aplicaciones de nivel empresarial y se puede combinar con Hadoop para la extracción de datos (el método específico de combinación aún no está claro).