Red de conocimiento informático - Aprendizaje de código fuente - ¿Qué idiomas debería aprender en ciencia de datos?

¿Qué idiomas debería aprender en ciencia de datos?

En términos generales, la ciencia de datos a menudo implica el procesamiento de grandes cantidades de datos, y la optimización del código es crucial en este momento. Con estos principios básicos en mente, echemos un vistazo a qué lenguajes se deben dominar en la ciencia de datos: Lenguaje R

R se lanzó en 1995. Es una rama del lenguaje S y es código abierto. Actualmente impulsado por la Fundación R para Computación Estadística. Ventajas: Gratis y de código abierto, con una amplia gama de funciones y funciones. Un lenguaje especialmente desarrollado para estadísticas y análisis de datos. Incluso la instalación básica contiene funciones y métodos estadísticos completos. No es muy eficiente. R funciona muy bien en estadística, pero no es adecuado para programación general. Resumen de los problemas de confiabilidad del paquete: El lenguaje R es muy poderoso en estadística y visualización de datos, y su código abierto le ha permitido hacerlo. Reúna un grupo de contribuyentes activos. Sin embargo, debido al desarrollo, hay una mezcla de buenos y malos, lo que genera algunos problemas en la confiabilidad del paquete.

Guido van Rossum lanzó Python. 1991 como código abierto. Python se usa ampliamente en el campo de la ciencia de datos y las versiones principales actuales son 3.6 y 2.7. Ventajas: Python es un lenguaje de programación convencional con amplio soporte en línea. Es fácil de aprender y tiene paquetes excelentes como pandas, scikit-learn y Tensorflow. Desventajas: Python, como lenguaje dinámico, es más lento que Java. y propenso a errores de tipografía, para estadísticas específicas o análisis de datos, el empaquetado de R será más fácil que Python y, en términos de versatilidad, existen mejores alternativas que Python. Resumen: Python es una buena opción para la ciencia de datos y TensorFlow de Google es la solución. Los marcos de aprendizaje automático tienden a ser PythonSQL