Cómo aliviar la vergüenza causada por el big data
Cómo aliviar la vergüenza causada por el big data
Un chiste reciente sobre el big data: en una reunión interna de la industria cinematográfica, un gigante cinematográfico Un portavoz de la industria dijo: A través de la minería de datos, descubrimos las preferencias de productos relevantes de diferentes audiencias. Por ejemplo, los espectadores de "Youth" consumieron más bebidas calientes que los espectadores de "Wolf Warrior". Estas son cosas que no sabíamos antes y que no podíamos predecir.
La conclusión anterior basada en el análisis de los datos de visualización de dos películas parece objetiva y correcta, pero en realidad es una broma debido a la imperfección del modelo (falta de consideración de la temporada de visualización ) y otras razones.
Recientemente, cuando hacíamos un balance de la tecnología financiera, descubrimos que el big data en sí mismo es una "vergüenza". Buscamos en las noticias y no encontramos nada particularmente destacable sobre esta palabra. Sólo puedo basarme en un poco de información de actualidad para hacer un inventario de esta palabra clave.
En 2017, el big data es muy importante, pero también muy impredecible.
El modelo de big data no es perfecto debido a su base débil. El big data siempre ha sido tibio, lo que tiene mucho que ver con sus fallas de desarrollo. Aunque todos se mostraron muy optimistas al respecto, no logró marcar el comienzo de la explosión de la industria.
Cuando conversan con algunos amigos que hacen big data, incluso se quejarán sin rodeos de sus propios modelos de datos.
“Esos llamados modelos de datos y similares pueden causarte dolor de cabeza todo el día con solo echarles un vistazo. Los datos del modelo son enormes y la lógica de las pistas es muy complicada. Los datos parecen muy complicados pero extremadamente aburridos, no tiene sentido juzgar los resultados, es una lástima descartarlos si no tienen sabor y son como alimentos inútiles."
"Ser. Sinceramente, la razón fundamental no es el atraso de la tecnología, sino el fracaso de toda la industria. La base del desarrollo es demasiado superficial para corregir, resumir y explicar razonablemente la validez de los datos."
"En términos generales. , una arquitectura de big data razonable tiene un modelo de datos completo y puede tomar decisiones integrales basadas en campos específicos, racionalizar los datos, eliminar datos irrelevantes y datos que interfieren, clasificar sugerencias razonables y objetivas y luego resumir conclusiones razonables basadas en juicios subjetivos. y correcciones de los analistas de datos para hacer predicciones precisas sobre las industrias relevantes. "
“¿Y ahora qué? Originalmente, el modelo de datos tenía lagunas de un tipo u otro, pero aún queríamos automatizar completamente el procesamiento de datos”.
“Y confiar completamente en datos objetivos para completar los llamados cálculos de inteligencia artificial es una tontería".
"El chiste sobre "Juventud" y "Guerrero Lobo" que acabo de mencionar es en realidad, una conclusión analítica que parece objetiva pero que en realidad es ridícula."
“Esto se debe a que cuando todo el mundo habla de big data, los da demasiado por sentado. Si solo confías en esta conciencia para hacer datos Análisis en el campo de la financiación al consumo, muchos inversores definitivamente serán engañados. ¡Estás en el cielo!
“Así que las empresas de datos que ganan dinero ahora todavía dependen de la compra y venta de datos de los usuarios. agregue un poco de agua a un paquete de datos y véndalo en todas partes, y las ganancias serán ilimitadas”.
” Sin embargo, parece que últimamente no es tan fácil de manejar, porque las inspecciones oficiales son cada vez más Es más estricto y algunas de las llamadas empresas de big data no pueden manejarlos y temen quebrar”.
El Internet de las cosas puede ser una verdadera empresa de big data. oportunidad "Además de la acumulación de experiencia en la industria, se necesitan más datos para el soporte en línea."
"Por supuesto, esto no significa que más datos sean mejores, sino que cuanto más ricos sean los datos en línea, mejor mejor". , más propicio será para nosotros organizar datos efectivos."
"El problema central es cómo generar una gran cantidad de datos efectivos."
"Datos efectivos" En pocas palabras, está en un campo determinado. Por ejemplo, después de una combinación y deconstrucción razonable de datos relevantes de un pequeño segmento de bienes de consumo en el campo de la financiación al consumo, podemos hacer predicciones razonables sobre el desarrollo de la industria y. ser responsable de las expectativas de los inversores, de lo contrario, cuanto mayores sean los datos, mayor será la carga y menos probabilidades habrá de lograr algo".
¿Cuándo será la acumulación de experiencia? ¿suficiente?
"Quizás tengamos que esperar hasta que llegue realmente la era del Internet de las Cosas.
”
¿Por qué?
“El Internet de las cosas puede hacer que haya más datos financieros y logísticos de los consumidores en línea, y la información crediticia personal del consumidor también estará más en línea, y la recopilación y el procesamiento de datos ser más eficiente y completo. ”
“Sin embargo, con el rápido desarrollo de los pagos móviles, las capacidades de consumo financiero de más personas se presentan básicamente en línea, incluidos los hábitos de consumo personal y la información crediticia personal, y la información logística, vivienda y préstamos resultantes. etc. están completando gradualmente el último proceso en línea. Estas son excelentes oportunidades para big data. ”
“La industria de big data tiene grandes oportunidades, pero big data es una industria inestable, porque todos los datos se atribuyen a máquinas y las máquinas están controladas por humanos, y los riesgos operativos relacionados dependen totalmente de usted. Conciencia del riesgo y carácter. Los riesgos a gran escala pueden surgir en la industria en cualquier momento. Si tiene suerte, solo afectará la seguridad de los datos. Si no tiene suerte, el crédito de las empresas y los individuos se arruinará. Esto traerá un gran desastre a la industria e incluso a toda la sociedad. ”
“Por lo tanto, los estándares relevantes de las empresas deben perfeccionarse y estandarizarse aún más, y las personas también deben tener controles de ética profesional. ”
El tipo de personas que utilizan los datos tiene diferentes propósitos y efectos.
Esto tiene algo que ver con una broma relacionada con los grandes datos. Resulta que es una broma al principio. el chiste. El final es bastante satisfactorio.