Red de conocimiento informático - Material del sitio web - ¿Cómo se utilizarán los big data en la vida futura?

¿Cómo se utilizarán los big data en la vida futura?

Sun Minsong de la Universidad de Ciencia y Tecnología de Harbin habla sobre la aplicación de big data en campus universitarios inteligentes

Resumen: ?15 de febrero, Escuela de Software, el presidente y profesor de la Universidad de Ciencia y Tecnología de Harbin, Sun Mingsong, compartió un tema titulado "Aplicación de Big Data en campus universitarios inteligentes" en la sección de microconferencias de la aplicación CIO Times.

Palabras clave:

CIO Times APP

Micro conferencia

El 15 de febrero, Sun Minsong, decano y profesor de la Escuela de Software del Instituto de Tecnología de Harbin, dio una conferencia titulada "Big Data en campus inteligentes de colegios y universidades" en la microcolumna de conferencias de la aplicación CIO Times. El tema compartido de "Aplicaciones" se describe específicamente en dos partes: la era de los pequeños datos y la era de los grandes datos, y los casos de aplicación de los grandes. datos en campus inteligentes de universidades.

1. La era del big data y la era del big data

"Datos" significa "conocido" en latín y también puede entenderse como "existencia". Entonces, "datos" son "existencia" y "grandes datos" son "gran existencia". Estudiar big data significa estudiar la gran existencia, es decir, estudiar toda la materia, todos los comportamientos, todos los pensamientos y al propio ser humano.

Los datos inundan y transforman la vida y el trabajo de las personas. La datificación se refiere al proceso de transformar fenómenos en formas cuantitativas que puedan indexarse ​​y analizarse, lo que incluye clasificar y comprender el mundo, y formar una experiencia que se pueda guardar. Tanto la informática como el registro contribuyen a la generación de datos y son la base de la digitalización. La digitalización consiste en convertir datos analógicos en códigos binarios representados por 0 y 1, lo que facilita a los humanos utilizar tecnología moderna para procesar mejor los datos. La dataización es una idea y la digitalización es un método; la dataización ha existido desde la antigüedad, pero la digitalización está en ascenso.

La era de los datos pequeños se basa en el muestreo aleatorio y su principio es obtener la mayor información con la menor cantidad de datos. Sin embargo, en este caso, algunos microdetalles no se pueden entender, lo que no favorece el análisis de determinadas subcategorías específicas. "La variedad es la esencia del mundo", y la falta de detalles afectará la exploración e investigación de todas las actividades naturales y humanas. Además, el muestreo aleatorio se basa en la premisa teórica del investigador y solo puede responder preguntas seleccionadas, pero es difícil considerar otras cuestiones. En otras palabras, en la era de los datos pequeños, nos enfrentamos al problema del "sesgo" con información extremadamente limitada.

La era del big data supone digitalizar el mundo, lo que significa que la esencia del mundo es la información. El mundo no es visto sólo como una serie de acontecimientos, sino también como una colección de información y datos. Este es un cambio profundo en la visión del mundo: los seres humanos tienen la experiencia de comprender y procesar eventos del pasado sin seguir ciegamente la experiencia. Los seres humanos recopilan "datos", pero es más claro que "lo que ven, piensan y obtienen" son. todos "datos". Vivimos en un mundo de datos. En el océano, nosotros mismos somos datos.

Lo anterior, desde la era del big data hasta la era del big data, ha ido acompañado o producido los siguientes cambios y entendimientos:

1. la población. Observar, comprender y cuidar el mundo con una actitud más amplia, más completa y más integral.

2. Los big data tienen menores requisitos de precisión. En la era de los datos pequeños, debido a que hay pocos datos, la precisión de los datos es muy alta. Cuando aparece una gran cantidad de datos o se requiere una gran cantidad de datos, es necesario aceptar la complejidad de los datos.

3. Tenga en cuenta que los errores de datos no son una característica inherente de big data, sino un problema práctico que debe abordarse, y este problema puede existir durante mucho tiempo.

4. Mezclar no significa estar mal. La confusión es el estado normal del big data y debería ser un estado básico y estándar.

5. Los macrodatos revelan detalles que las muestras tradicionales no pueden revelar. Los macrodatos son la forma básica de realizar un procesamiento "preciso".

6. En la era del big data, ya no nos interesa buscar relaciones causales, sino que intentamos explorar las relaciones entre diferentes cosas y, sobre esta base, podemos encontrar correlatos observables para hacer predicciones. . La predicción es el núcleo de las aplicaciones de big data.

7. Una vez explicada la correlación, se puede analizar la relación causal.

Sin embargo, cabe señalar que la causalidad es sólo una forma especial de correlación. La causalidad ya no es la base para explicar el mundo en la era del big data. La correlación es una existencia relativamente común, que es más fácil de descubrir en la era del big data. datos y se pueden utilizar de manera más eficiente, o incluso con el desarrollo de big data, las relaciones causales previas pueden ser falsificadas o consideradas como correlaciones.

El primer punto es la transformación de la epistemología por los grandes datos; los puntos segundo a quinto reflejan los requisitos de datos completamente diferentes entre la era de los grandes datos y la era tradicional; los puntos sexto y séptimo son las relaciones lógicas entre ellos; datos Subversión de prioridades. Desde una perspectiva práctica, el punto 1 se puede utilizar como premisa, los puntos 2 a 5 se pueden utilizar como directrices para la recopilación y el procesamiento de datos, y los puntos 6 y 7 se pueden utilizar como guía para la interpretación de los datos.

2. La aplicación del big data en los campus inteligentes de las universidades

En 2015, el país propuso y formuló el plan de acción "Internet+", elevando "Internet+" a nivel nacional. estrategia. La propuesta de "Internet +" definitivamente agregará una nueva connotación e inyectará un nuevo impulso a la construcción de campus inteligentes en colegios y universidades. Utilice "Internet +" para acelerar la actualización de los campus digitales a campus inteligentes y aproveche al máximo una serie de nuevas tecnologías, nuevos conceptos y nuevos modelos, como la computación en la nube, el Internet de las cosas, el Internet móvil y los big data. crear un nuevo campus universitario inteligente y apoyar eficazmente la estrategia de desarrollo futuro de la universidad, impulsar la innovación en los métodos de formación y evaluación de talentos, mejorar la gobernanza escolar y proporcionar servicios personalizados multinivel y decisiones de gestión inteligentes. La construcción se puede resumir como "percepción ambiental integral, interoperabilidad de red perfecta, ecosistema de nube flexible, soporte de datos masivos, entorno de aprendizaje abierto, servicios personalizados para maestros y estudiantes, toma de decisiones de gestión inteligente y gobernanza escolar eficiente".

En el proceso de informatización, los colegios y universidades han generado diversos datos estructurados y no estructurados, incluidos datos de gestión de la enseñanza, datos de recursos docentes, datos de información de los estudiantes, etc., que van desde las políticas y estrategias de los colegios y universidades. , Por pequeño que sea el consumo diario de los estudiantes, los datos son numerosos y complejos. El uso de tecnología big data para recopilar y analizar estos datos y transformarlos en recursos disponibles para la gestión y los servicios universitarios jugará un papel muy importante en la construcción de campus inteligentes.

Los siguientes ejemplos ilustran la aplicación de la tecnología big data en campus inteligentes.

1. Visualización integral de la situación escolar

Para los administradores escolares, a través del análisis y visualización integral de la situación escolar, pueden comprender a los estudiantes actuales de la escuela (estudiantes universitarios, estudiantes de posgrado) y el curso. condiciones, logros de investigación científica, premios, empleo, personal docente, distribución de docentes, cuadros, mobiliario, activos, vivienda, clasificaciones, consumo y otros aspectos para realizar una comprensión intuitiva y comparaciones horizontales y verticales. La combinación de los cambios en los datos a lo largo de los años puede proporcionar una base para la toma de decisiones auxiliares. La correlación de datos entre diferentes sistemas puede proporcionar nuevas ideas para que los gerentes tomen decisiones.

La visualización de información escolar integral incluye principalmente visualización de análisis de datos básicos y visualización de análisis de datos de comportamiento.

Análisis de datos básicos: como análisis de datos de inscripción, análisis de datos de estudiantes, análisis de datos de graduación, análisis de datos de docentes, análisis de datos de cursos, análisis de datos de desempeño, análisis de datos de empleo, análisis de datos de activos universitarios, etc.

Análisis de datos de comportamiento: análisis de las condiciones de las comidas en las cafeterías escolares, análisis del comportamiento de consumo de una tarjeta, análisis del comportamiento en línea, análisis del comportamiento de préstamo de libros, análisis de la correlación entre el tiempo de uso de la biblioteca, el tiempo/tráfico en línea y calificaciones, puntos clave Análisis de caracterización y alerta temprana de grupos de multitudes, etc.

Ejemplos:

(a) Estadísticas de información sobre empleo universitario. Realizar análisis estadísticos de múltiples dimensiones, como el destino de graduación de los estudiantes universitarios, la unidad de empleo, el área de empleo, la industria laboral, el salario laboral, etc., presentar de manera integral la situación laboral de los colegios y universidades y brindar apoyo a las oficinas de empleo de las universidades para descubrir a los estudiantes. patrones de empleo y proporcionar orientación laboral específica para los estudiantes.

(b) Análisis estadístico de la información docente. Presenta a los líderes escolares la clasificación de cursos populares en colegios y universidades, estadísticas de cursos ofrecidos por departamentos y departamentos, análisis estadístico del desempeño de los estudiantes y análisis de las tasas de fracaso, presenta de manera integral el aprendizaje y la distribución del desempeño de los estudiantes durante la escuela y brinda apoyo. para orientar los cursos universitarios y mejorar el rendimiento de los estudiantes.

(c) Análisis estadístico de una tarjeta. Muestra la capacidad de consumo general y las preferencias de consumo de los estudiantes universitarios y brinda apoyo al departamento de logística para comprender las preferencias gastronómicas y de compras de los estudiantes y mejorar los niveles de servicio de manera específica.

(d) La capacidad de consumo de cada fuente estudiantil. El poder de consumo de los estudiantes en el área se calcula según el lugar de origen para ver en detalle las estadísticas de la cantidad de consumo de los estudiantes y los tiempos de consumo en un período de tiempo determinado.

(e) Análisis del uso de la red escolar y estadísticas del comportamiento en línea de los estudiantes. A través de estadísticas y análisis de las direcciones de Internet de los estudiantes, combinadas con sus datos de información personal básica, podemos contar la frecuencia de uso de ciertos tipos de sitios web por diferentes categorías de personas según diferentes dimensiones, como género, lugar de origen, departamento, etc. Si los registros registrados son lo suficientemente detallados, incluso se pueden calcular las preferencias de los estudiantes o las preferencias de consumo en línea, lo que también es una referencia importante para los departamentos de logística o académicos y de ingeniería.

Las tecnologías relevantes aplicadas incluyen: análisis de correlación de datos, integración de datos de múltiples fuentes, procesamiento masivo de datos de registros, puntos de referencia, establecimiento de sistemas de indicadores, AgileBI y motor de búsqueda de texto completo.

2. Análisis del uso de los recursos públicos

Para colegios y universidades, diversos recursos públicos como comedores, estadios, aulas, bibliotecas y hospitales escolares son limitados, profesores y estudiantes. No tener una buena manera de conocer las capacidades de servicio de estos recursos, lo que resulta en colas y aglomeraciones frecuentes, lo que trae una mala experiencia para el aprendizaje y la vida de profesores y estudiantes. Con el avance de la informatización escolar, los sistemas de información de gestión de varios departamentos se han construido y puesto en uso gradualmente, con el desarrollo de la tecnología, especialmente el surgimiento de Internet de las cosas y los dispositivos de detección inteligentes, los servicios inteligentes del campus digital se han hecho posibles.

Los datos provienen de consumo con una sola tarjeta, control de acceso con una sola tarjeta, red inalámbrica, videovigilancia de seguridad del campus, etc.

(a) La densidad de personas en comedores y baños públicos y la densidad recomendada de personas que cenan en comedores y baños públicos en distintos momentos, así como los pasatiempos y hábitos gastronómicos de los distintos tipos de personal (grado, lugar de procedencia, título profesional, etc.).

(b) Uso del aula, densidad de personal, uso del aula en cada período, número de personas en el aula, etc., según la red inalámbrica.

(c) Condiciones de uso y densidad de población de las salas de congresos y recintos deportivos. Proporcionar a profesores y estudiantes consultas sobre disponibilidad de lugares de conferencias, estado de uso de lugares deportivos (con o sin clases, etc.) y liberación de densidad de personal.

(e) Divulgar el estado de uso de los asientos de la biblioteca y la densidad de personal, proporcionar la disponibilidad de asientos de la biblioteca y el número de personas en la biblioteca, etc.

(f) Distribución de la densidad de personas en el centro educativo. Con base en los datos de la red inalámbrica de la escuela y la información de videovigilancia de seguridad, se identifica el mapa de distribución térmica del personal de la escuela.

Las tecnologías relevantes aplicadas incluyen: análisis de asociación de datos, minería de datos (análisis de agrupamiento), procesamiento masivo de datos de registro, integración de datos de múltiples fuentes (datos de registro e integración de datos estructurados), base de datos de memoria de alta velocidad, distribución completa -Motor de búsqueda de texto.

3. Informe de datos personales

Proporcionar servicios de datos personalizados para profesores y alumnos del campus, mostrando el aprendizaje, consumo, vida, salud, etc. de profesores y alumnos en el campus

En términos de hábitos de comportamiento personal, ayuda a los estudiantes a comprenderse mejor a sí mismos y a las diferencias con los demás a través de un análisis de datos riguroso, y ayuda a los profesores y estudiantes del campus a sentir el cuidado humanista y los cambios provocados por la informatización.

Los datos proceden del consumo de tarjetas todo en uno, control de acceso a bibliotecas, sistema de préstamo de libros, sistema de red del campus, control de acceso a estadios, etc.

(a) Informe de análisis de hábitos de consumo y factura de tarjetas del campus;

(b) Informe de análisis de frecuencia de entrada y salida de la biblioteca, duración y hábitos de endeudamiento;

( c ) Informe de análisis de factura de Internet y hábitos de Internet;

(d) Informe semestral de ejercicio físico.

El envío móvil se realiza a través de la identificación y la aplicación WeChat oficiales de la universidad. En la era de Internet móvil, es conveniente para los usuarios leer, compartir y difundir a tiempo.

Brindar servicios de datos personalizados para profesores y estudiantes del campus, mostrando los hábitos de comportamiento personal de profesores y estudiantes en el campus en términos de aprendizaje, consumo, vida, salud, etc., para ayudar a los estudiantes a comprenderse mejor a sí mismos a través de rigurosos análisis de datos y diferencias con los demás, para ayudar a los profesores y estudiantes del campus a sentir el cuidado humanista y los cambios provocados por la informatización.

Las tecnologías relevantes aplicadas incluyen: análisis de correlación de datos, extracción de datos (retratos de usuarios), procesamiento masivo de datos de registros e integración de datos de múltiples fuentes.

4. Análisis de la eficiencia de utilización de los recursos de revistas electrónicas de las bibliotecas

Las universidades gastan dinero cada año en la compra de colecciones de revistas famosas para proporcionar a profesores y estudiantes servicios convenientes de recuperación y descarga de literatura. El uso de recursos de revistas electrónicas en las bibliotecas y las diferencias en las preferencias de uso de diferentes disciplinas para diferentes recursos de revistas electrónicas son cosas que las bibliotecas necesitan comprender con urgencia.

A través del análisis de big data de los registros de recuperación de literatura de revistas de los usuarios universitarios, se optimiza el plan de compra de papel y publicaciones periódicas, lo que permite a la biblioteca comprar recursos (papel tradicional + recursos electrónicos) que los profesores y estudiantes necesitan más y mejorar la eficiencia de las adquisiciones existentes.

La práctica habitual de las escuelas es comprar estadísticas de acceso a recursos de revistas electrónicas de proveedores de datos (como Wanfang y CNKI). Sin embargo, este método se basa en los datos de acceso generales de la escuela para el análisis estadístico y no se puede utilizar. basado en los detalles de acceso de los usuarios, el análisis de las estadísticas hace imposible obtener un análisis del acceso a las revistas por parte de diferentes grupos de personas en función de diferentes categorías temáticas, diferentes características universitarias y profesionales y diferentes niveles docentes, y también es imposible obtener una comparación horizontal. Análisis del uso de diferentes bibliotecas de recursos. La extracción de palabras clave de búsqueda de profesores y estudiantes también es una dirección muy importante. Sin embargo, los métodos tradicionales no pueden comprender la información específica, como las preferencias de búsqueda y los puntos calientes de búsqueda de recursos de revistas electrónicas de profesores y estudiantes de escuela.

Los datos de registro de la red de exportación registran el comportamiento de los profesores y estudiantes que acceden a la biblioteca de recursos de revistas electrónicas. La tecnología de big data se utiliza para procesar el registro de URL de exportación y otros datos, extraer información clave y asociar los datos internos de la escuela. datos de información del usuario para realizar el libro Análisis integral del uso de recursos electrónicos de la biblioteca y análisis de multitudes para brindar asistencia en las decisiones de adquisición de la biblioteca.

Los datos provienen de la lista de recursos de revistas electrónicas adquiridos por la biblioteca, registros de URL en línea de profesores y estudiantes, autenticación de identidad en línea de profesores y estudiantes, etc.

Las tecnologías relevantes aplicadas incluyen: análisis de correlación de datos, procesamiento masivo de datos de registros, integración de datos de múltiples fuentes (datos de registros e integración de datos estructurados) y motores de búsqueda distribuidos de texto completo.

5. Monitoreo de la opinión pública del campus

Bajo la tendencia de Internet móvil, tanto la información positiva como la negativa se difundirán a mayor velocidad. La reputación de la escuela tiene un gran impacto en la matrícula escolar, el empleo y la evaluación de méritos. Con la popularidad de Internet móvil y las redes sociales, los colegios y universidades están prestando cada vez más atención a la evaluación social de la escuela. En la actualidad, algunos colegios y universidades utilizan datos de Internet para monitorear la reputación de la escuela y usan big data para comprender la opinión pública, la reputación y la influencia de la escuela mediante el monitoreo en tiempo real de noticias relacionadas con la escuela, temas de comunicación y comentarios de los usuarios sobre los nuevos medios de Internet.

Las tecnologías relevantes aplicadas incluyen: minería de texto, análisis semántico (juicio positivo y negativo), cálculo de similitud semántica, motor de rastreo elástico y motor de búsqueda distribuido de texto completo.

La aplicación de big data en campus inteligentes que entiendo también incluye el análisis estadístico de la información docente a través del análisis de muestras de la estructura del conocimiento del curso, combinado con el proceso educativo y la distribución integral del desempeño del aprendizaje de los estudiantes para verificar la calidad. El proceso de enseñanza del curso es un análisis integral de la racionalidad de la oferta de cursos que se basa en la racionalidad y el logro de la certificación de la educación en ingeniería.

Otro ejemplo es el análisis de la información de gestión de activos escolares. Con la ayuda de la plataforma de información de gestión de activos, se pueden recopilar y analizar datos sobre la infraestructura del campus, el equipo de experimentos de enseñanza, el equipo de la red de comunicación del campus, etc. Se utilizará para proporcionar orientación para la dirección de la construcción de infraestructura escolar y experimentos de enseñanza. Proporcionar soporte de datos para el mantenimiento de equipos y la actualización de los equipos de comunicación de la red del campus.

La "Plataforma de gestión de estudiantes Smart Grid" se basa en los logros de la tecnología de la información universitaria y la construcción de campus digitales, y construye una red con tres dimensiones: red comunitaria, red de gestión y red educativa como portadora. , un marco general para la gestión integral y la optimización de procesos de servicio para el desarrollo de los estudiantes. Proporcionar orientación proactiva sobre los procesos de desarrollo vital, académico, ideológico y otros de los estudiantes a lo largo de su ciclo de vida, formando un nuevo modelo de gestión inteligente y desarrollo de orientación colaborativo y sostenible, con retratos de los estudiantes y advertencias de comportamiento de los estudiantes (estado escolar, académico, consumo, Salud física y mental), análisis del estado económico de la familia de los estudiantes, recuperación integral de datos de los estudiantes, análisis de grupos de estudiantes y otras funciones pueden ayudar a los departamentos académicos, gerentes de departamento y consejeros a llevar a cabo la gestión de la educación sobre seguridad de los estudiantes, el asesoramiento sobre salud mental de los estudiantes, la financiación precisa y otras tareas. Mejorar la eficiencia del trabajo y promover la innovación y la práctica en la gestión estudiantil.

Debido a limitaciones de tiempo, hoy solo comunicaremos una cantidad limitada. ¡Gracias!