Red de conocimiento informático - Material del sitio web - ¿Dónde se pueden utilizar las presentaciones de visualización de big data?

¿Dónde se pueden utilizar las presentaciones de visualización de big data?

1. Utilice el software con el que esté más familiarizado

Aprender a crear visualizaciones de datos mediante programación no significa renunciar a las herramientas con las que ya está familiarizado. Normalmente uso la herramienta que resuelve el problema más rápido, que podría ser Excel, GoogleSheets o Python.

No necesitas usar solo R o JavaScript para hacer todo, y puede ser beneficioso incluir diferentes herramientas para una tarea. Su objetivo final es crear una visualización, y los resultados de cada paso lo llevarán al siguiente, así que no se obsesione demasiado con hacer las cosas de la manera "correcta".

2. Comience con lo básico

No espere que su primer intento produzca visualizaciones sorprendentes y muy avanzadas. Especialmente en las primeras etapas de aprendizaje, todavía te queda un largo camino por recorrer, así que comienza con lo básico y avanza hacia técnicas más avanzadas. De esta manera, no te desanimarás al principio ni perderás la esperanza de aprender.

En R, hay muchos conjuntos de herramientas que pueden ayudarte a hacer algo y, a veces, solo necesitas usar una función. Pero si eres nuevo en la sintaxis de programación de R, te recomiendo comenzar con lo básico, aunque pueda resultar un poco difícil.

Al igual que la biblioteca JavaScript d3.js que mencioné anteriormente, si eres nuevo en JavaScript o si recién estás comenzando a aprender programación, muchas de estas cosas pueden parecer difíciles. Te recomiendo que comiences con el tutorial básico de MikeBostock y poco a poco entiendas lo que estás haciendo.

3. Encuentra un proyecto para hacer

No creas que necesitas aprender todo antes de comenzar un proyecto, ya que esto te hará perder el tiempo. Puede comenzar aprendiendo algunos conceptos básicos. Esto al menos garantizará que cuando encuentre un problema y busque en línea, podrá leer sobre la solución.

Selecciona algunos datos y empieza a intentar visualizarlos. El progreso será muy lento al principio y te sentirás confundido, eso es normal. Hasta el día de hoy, algunas de las preguntas todavía me confunden, pero hay que perseverar.

Lo bueno de realizar un proyecto es que te obliga a aprender lo que necesitas saber. Cada vez que completas un proyecto, el siguiente se vuelve más fácil.

Los proyectos de visualización de datos suelen dividirse en los siguientes pasos.

Procesamiento y formato de datos

Python

Cuando tengo un archivo delimitado no rectangular o los datos están desordenados, escribo algunos scripts especiales de Python. Si tengo suerte, encontraré y reutilizaré un script existente del pasado. A veces uso Beautiful Soup para podar, a veces uso csvkit.

R

Solo uso R cuando necesito cargar tablas en formato csv, generalmente solo para agregar datos, fusionar o procesar partes derivadas de los datos originales.

Tabula

Se utiliza principalmente para datos públicos del gobierno, incluidos datos en archivos PDF. Sin Tabula, este proceso habría sido insoportable.

Microsoft Excel

Úselo sólo cuando sea necesario. Los datos se leen en Excel y luego se importan a herramientas como Numbers u OpenOffice.

Google Sheets

A veces, usar una hoja de cálculo es más rápido que escribir un guión y me encanta la simplicidad del proceso.

Análisis de los datos

Antes de dibujar el gráfico final, es necesario comprender el conjunto de datos.

R

Aquí pienso en R, porque como lenguaje de computación estadística de código abierto, R tiene una comunidad muy rica, infinitos paquetes de extensión y una gran cantidad de preguntas sobre Stack Overflow. respuesta.

Hacer gráficos estáticos

Para mí esto suele implicar dos etapas: (i) visualización en R (ii) pulido en Illustrator;

R

Hay algunas herramientas de visualización en R, como ggplot2, pero yo uso casi exclusivamente las que vienen con R, que es la base R.

Adobe Illustrator

Si la figura se va a publicar para que otros la vean, guardo la figura generada en R como PDF y luego la edito en Illustrator. Esto es un poco excesivo, pero funciona bien. También quiero probar Sketch.

Crea gráficos interactivos

Flash ya está disponible, JavaScript es el nuevo favorito.

d3.js

Utilizo documentos basados ​​en datos para la visualización interactiva de datos (todavía estoy aprendiendo). Hay muchos ejemplos que puedo probar. Pero si quiero completar un diagrama rápidamente, a veces intento usar Vega-Lite.

4. Lee atentamente la guía de programación y los ejemplos.

La guía de programación es muy útil. Puede que al principio te cueste un poco, pero hay que acostumbrarse. Si hay un problema con su programa, probablemente se deba a que lo escribió incorrectamente, no a que haya un problema con la implementación del código. Por lo tanto, en este punto es necesario leer atentamente la guía para asegurarse de que está utilizando la función correctamente.

En R, las guías para todas las funciones están escritas en el mismo formato, que le indica qué parámetros toma la función, cuál es el valor de retorno y luego brinda ejemplos de cómo usarlo, lo cual es muy clásico.

Mike Bostock, el creador de la biblioteca d3.js, ha escrito una guía excelente y hay muchas otras en línea. Bostock incluye muchos ejemplos en la guía, lo cual es muy útil, y cada vez que tengo un problema y busco una solución en la web, generalmente lo pongo con "mbostock".

5. Cómo empezar

A veces dudo en empezar porque pienso demasiado en las cosas, pero empezar y seguir los consejos anteriores puede ahorrar mucho tiempo. Generalmente existe una mejor manera de utilizar herramientas para la visualización de datos, pero no es necesario buscarla en primer lugar. Pruebe primero varias formas y colores en la pantalla, luego recopile los datos para que en general se vea bien. Si algo no le parece bien (especialmente para proyectos de visualización que incluyen interoperabilidad y animación), busque un enfoque más ideal. A menudo, su diagrama es correcto incluso si no es el mejor enfoque.