Red de conocimiento informático - Problemas con los teléfonos móviles - Paquetes de software para análisis de datos en Python

Paquetes de software para análisis de datos en Python

IPython

IPython es un shell de línea de comandos para computación interactiva entre múltiples lenguajes de programación. Desarrollado originalmente en Python, proporciona capacidades de introspección mejoradas, medios enriquecidos y shell extendido.

p>

Gramática. , finalización de pestañas, historial enriquecido y más. ipython proporciona las siguientes características:

Un shell interactivo más potente (terminal basado en Qt)

Bloc de notas basado en navegador que admite código, texto sin formato, fórmulas matemáticas, gráficos integrados y Otros medios enriquecidos

Admite visualización interactiva de datos y herramientas GUI

Flexible, integrado en el intérprete y cargable en cualquiera de sus propios proyectos

Fácil de usar. Herramientas de alto rendimiento para computación paralela

Contribuido por el experto en Galvanize, Nir Kaldero, director de análisis de datos.

GraphLab Greate es una biblioteca de Python impulsada por un motor C++ que puede crear rápidamente productos de datos de alto rendimiento y a gran escala.

Estas son algunas de las características de GraphLab Greate:

Capacidad para analizar terabytes de datos en su computadora a velocidades interactivas.

Analiza datos tabulares, curvas, texto e imágenes en una única plataforma.

Los últimos algoritmos de aprendizaje automático incluyen aprendizaje profundo, árboles evolutivos y teoría de máquinas de factorización.

El mismo código se puede ejecutar en una computadora portátil o en un sistema distribuido usando Hadoop Yarn o un clúster EC2.

Aproveche las capacidades flexibles de API para centrarse en tareas o aprendizaje automático.

Aproveche los servicios predictivos para ofrecer cómodamente productos de datos en la nube.

Crea visualizaciones para el descubrimiento y seguimiento de productos.

Contribuido por Benjamin Skrainka, científico de datos de Galvanize.

Pandas

Pandas es un software de código abierto que utiliza la licencia de código abierto BSD que proporciona estructuras de datos y análisis de datos de alto rendimiento y fáciles de usar para Python

herramienta de programación. En términos de manipulación y preprocesamiento de datos, Python se ha hecho famoso, pero en términos de análisis y modelado de datos, Python

parece ser inadecuado. pandas llena este vacío, permitiéndole realizar toda la manipulación de datos en Python sin tener que cambiar a un lenguaje especializado más convencional como R.