¿Cuáles son las limitaciones del big data?
1. Los macrodatos no entienden el trasfondo
La toma de decisiones humanas no es un evento discreto, sino que tiene sus raíces en series temporales y en el entorno. A lo largo de millones de años de evolución, el cerebro humano se ha adaptado a esta realidad. Hay muchas razones por las que a la gente se le da bien contar historias y muchas situaciones. El análisis de datos no sabe cómo contar historias ni cómo surgen las ideas. Incluso en una novela corriente, esta idea no puede explicarse mediante el análisis de datos.
2. Los macrodatos crearán pajares más grandes
Esta idea fue propuesta por el famoso pensador empresarial Nassim Taleb, autor de "Cisne negro: cómo afrontar el futuro desconocido" Autor de un libro. Cuantos más datos tengamos, más correlaciones estadísticas significativas podremos encontrar. Muchas de estas relaciones no tienen sentido y desvían a las personas a la hora de resolver problemas. A medida que hay más datos disponibles, las trampas aumentan exponencialmente. En el proceso de buscar una aguja en un pajar, la aguja que buscamos está enterrada cada vez más profundamente. Una característica de la era del big data es que el número de descubrimientos "significativos" queda ahogado por el ruido de la expansión de los datos.
3. Los macrodatos no pueden resolver grandes problemas
Si solo quieres analizar qué correos electrónicos generan la mayor cantidad de donaciones de campaña, puedes hacer una prueba controlada aleatoria. Pero si el objetivo es estimular la economía durante una recesión, no encontrará una sociedad mundial paralela como grupo de control. ¿Cuál es el mejor paquete de estímulo? Hay mucho debate sobre esta cuestión y, a pesar de la avalancha de datos, hasta donde yo sé, ni uno solo de los principales participantes en este debate ha cambiado su posición basándose en el análisis estadístico.
4. Los macrodatos suelen ser una tendencia, no una obra maestra.
Cuando un gran número de personas se interesan rápidamente por un producto cultural, el análisis de datos puede ser sensible a esta tendencia. Pero algunos productos importantes (y rentables) se eliminan de los datos en primer lugar simplemente porque se desconocen sus peculiaridades.
5. Los macrodatos ocultan valor
La importancia de los datos sin procesar es que nunca pueden ser "sin procesar", siempre se construyen de acuerdo con las tendencias y valores de una persona. Los resultados del análisis de datos parecen objetivos y justos, pero de hecho, la selección de valores recorre todo el proceso, desde la construcción hasta la interpretación.
En cuanto a las limitaciones del big data, el editor Qingteng las compartirá con usted aquí. Si tiene un gran interés en la ingeniería de big data, espero que este artículo pueda ayudarle. Si desea saber más sobre las habilidades y materiales de los analistas de datos y los ingenieros de big data, puede hacer clic en otros artículos de este sitio para obtener más información.