Red de conocimiento informático - Material del sitio web - ¿Qué lenguaje se utiliza para big data?

¿Qué lenguaje se utiliza para big data?

1. Lenguaje Python

Python a menudo es compatible con marcos de procesamiento de big data, pero al mismo tiempo, a menudo no es un "ciudadano de primera clase". Por ejemplo, las nuevas funciones en Spark casi siempre aparecen primero en los enlaces de Scala/Java, y puede ser necesario escribir varias versiones menores de esas actualizaciones en PySpark (esto es especialmente cierto para las herramientas de desarrollo en Spark Streaming/MLLib).

A diferencia de R, Python es un lenguaje tradicional orientado a objetos, por lo que la mayoría de los desarrolladores se sentirán bastante cómodos usándolo, mientras que el primer contacto con R o Scala puede resultar intimidante. Un pequeño problema es que necesitas dejar el espacio en blanco correcto en tu código. Esto divide a la gente en dos bandos: los que piensan que esto es muy útil para garantizar la legibilidad y los que piensan que no deberíamos forzar al intérprete a hacer que el programa se lea solo porque un carácter en una línea de código no es el correcto. lugar. Ponte en marcha.

2. Lenguaje R

El lenguaje R tiene un atractivo simple y obvio. Con R, con solo unas pocas líneas de código, puede examinar conjuntos de datos complejos, procesar datos con funciones de modelado avanzadas y crear gráficos planos para representar números. Se ha comparado con una versión hiperactiva de Excel.

El mayor activo del lenguaje R es el vibrante ecosistema que se ha desarrollado a su alrededor: la comunidad del lenguaje R siempre está agregando nuevos paquetes y características a su ya rico conjunto de características. Se estima que más de 2 millones de personas usan R, y una encuesta reciente mostró que R es, con diferencia, el lenguaje más popular para datos científicos, utilizado por el 61% de los encuestados (seguido de Python, 39).

3. JAVA

Se ha descubierto que Java y los marcos basados ​​en Java se han convertido en el esqueleto de las empresas de alta tecnología más grandes de Silicon Valley. "Si nos fijamos en Twitter, LinkedIn y Facebook, Java es el lenguaje subyacente de toda su infraestructura de ingeniería de datos", dijo Driscoll.