¿Cuáles son las diferencias entre las aplicaciones de big data de Internet de Alibaba, Tencent y Baidu?
¿Cuáles son las diferencias entre las aplicaciones de big data de Internet de Alibaba, Tencent y Baidu?
Las tres principales empresas de Internet, Baidu, Alibaba y Tencent, tienen big data, y la Los datos de los tres principales gigantes de Internet se utilizan para optimizar los efectos operativos de su propio negocio; desde esta perspectiva, sus escenarios de aplicación de valor de datos son relativamente similares. Sin embargo, debido a las diferencias en sus negocios y modelos de negocios, los activos de datos de los tres son diferentes y las estrategias futuras de big data de los tres también son diferentes, especialmente desde la perspectiva de la apertura y la cooperación basada en big data, Baidu y. Alibaba es relativamente más abierta. Para las empresas de Internet que valoran la apertura y la cooperación de Big Data, lo que más esperan es utilizar la estrategia de apertura de Big Data para intercambiar más datos con industrias más tradicionales, enriqueciendo así mejor sus datos fuera de línea y formando en línea y La colaboración de datos fuera de línea puede conducir al desarrollo de nuevos modelos de negocio, como hardware inteligente y salud de big data. ¿Cuáles son las diferencias entre las aplicaciones de big data de Internet de BAT?
En términos de tipos de datos, los datos de Tencent son los más completos y están totalmente relacionados con su negocio de Internet. Los más destacados son los datos sociales y los datos de juegos. entre los cuales: los datos sociales son el núcleo Los datos son datos de la cadena de relaciones, datos de interacción entre usuarios, texto, imágenes y contenido de video generados por los usuarios. Los datos de juegos incluyen principalmente datos de juegos en línea a gran escala, datos de juegos web y datos de juegos móviles. El núcleo de los datos del juego son los datos de comportamiento activo del juego y los datos de comportamiento de pago. La característica más importante de los datos de Tencent son varios datos de entretenimiento y comportamiento del usuario basados en las redes sociales. Los datos de comercio electrónico más destacados de Alibaba son los datos sobre la navegación de productos, las búsquedas, los clics, las colecciones y las compras de los usuarios en Taobao y Tmall. La característica más destacada de sus datos son los datos de conversión del embudo de usuario desde la navegación hasta el pago. Los datos de Baidu se basan principalmente en palabras clave buscadas por los usuarios, páginas web, imágenes y datos de videos capturados por rastreadores. Los datos de Baidu se caracterizan por reflejar más directamente los intereses y necesidades de los usuarios a través de palabras clave de búsqueda.
Escenarios de aplicación de datos de Baidu, Alibaba y Tencent
Los escenarios de aplicación de datos de Baidu, Alibaba y Tencent tienen el mismo sistema, que se divide en Tiene siete capas, que representan datos. escenarios de aplicación de valor en diferentes niveles de la empresa, formando una pirámide de valor de datos para las operaciones empresariales:
(1) Capa de plataforma de base de datos. La capa inferior de la pirámide es también la capa básica de toda la pirámide. Si la capa básica no está bien construida, será difícil que la capa de aplicación superior sea efectiva en las operaciones empresariales. almacenamiento, cálculo y gestión de calidad eficaces de los datos. El objetivo empresarial es unir todos los datos del usuario (cliente) de la empresa con una identificación única, incluido el retrato del usuario (cliente) (como el sexo, la edad, etc.); comportamiento, intereses y pasatiempos, etc., con el fin de lograr una comprensión integral del usuario (cliente) Propósito;
(2) Capa de monitoreo de operaciones comerciales. La primera prioridad de esta capa es construir un sistema de datos clave para las operaciones comerciales. Sobre esta base, los productos de datos desarrollados a través de modelos inteligentes pueden monitorear los cambios en los datos clave. A través de varios modelos de análisis, las causas de los cambios de datos se pueden localizar rápidamente. ayudar a las operaciones en la toma de decisiones;
(3) Capa de optimización de la experiencia del usuario/cliente. Esta capa utiliza principalmente datos para monitorear y optimizar los problemas de experiencia del usuario/cliente. Esto utiliza datos estructurados para monitorear y datos no estructurados (como texto) para monitorear problemas de experiencia. Lo primero se logra más mediante la aplicación de varios modelos o herramientas de monitoreo de la experiencia del usuario (cliente), mientras que lo segundo se trata más de descubrir el boca a boca negativo al monitorear el texto de Weibo, foros y sistemas internos de comentarios de los clientes dentro de la empresa. y productos o servicios rápidamente optimizados;
(4) Operaciones refinadas y capas de marketing. Esta capa impulsa principalmente operaciones comerciales refinadas y marketing a través de datos. Se puede dividir principalmente en cuatro aspectos: primero, crear herramientas operativas y de extracción de datos basadas en el usuario para facilitar que el personal de operaciones y marketing capte clientes a través de la segmentación colectiva, a fin de realizar actividades operativas u de marketing para los clientes; mejorar la respuesta del cliente a las actividades; en tercer lugar, realizar la gestión del ciclo de vida del cliente a través de la extracción de datos; en cuarto lugar, utilizar principalmente algoritmos de recomendación personalizados para recomendar diferentes productos o productos en función de los diferentes intereses y necesidades de los usuarios para lograr la promoción y maximizar la eficiencia y los efectos de los recursos; como recomendaciones personalizadas de productos Taobao;
(5) Servicios externos de datos y niveles de comunicación de mercado.
Los servicios externos de datos generalmente sirven a los clientes o usuarios de empresas de Internet. Por ejemplo, Baidu brinda servicios a sus clientes anunciantes proporcionando opinión pública de Baidu, portavoz de Baidu, índice de Baidu, etc., a través de cubos de datos, inteligencia de Taobao y productos en la nube; Tencent atiende a sus clientes desarrolladores a través de Tencent Analytics y Tencent Cloud Analytics. A nivel de comunicación de mercado, se realiza principalmente a través de interesantes mapas de información de datos y productos de visualización de datos (como el Índice Taobao, el Índice Baidu y el Mapa Migratorio del Festival de Primavera de Baidu).
(6) Nivel de análisis operativo. Los analistas realizan principalmente estadísticas sobre big data para formar informes semanales, informes mensuales e informes trimestrales de análisis de experiencias, etc., analizan las condiciones operativas del usuario y la finalización de ingresos, identifican problemas y optimizan las estrategias comerciales.
(7) Nivel de análisis estratégico. En este sentido, es necesario combinar big data internos para formar una vista de datos para el nivel de toma de decisiones, y también combinar datos externos, especialmente varios datos de monitoreo de inteligencia competitiva y datos de investigación de tendencias extranjeras, para ayudar al nivel de toma de decisiones en análisis estratégico.
Aunque Baidu, Alibaba y Tencent tienen las mismas características en el sistema de aplicación de valor de datos operado por las empresas, debido a los diferentes modelos comerciales y activos de datos de las empresas, tienen diferentes ventajas en el desarrollo general de big data. Las estrategias también son significativamente diferentes.
Estrategia de Big Data de Baidu
La fuente más importante de Big Data de Baidu es que proviene de casi billones de datos de páginas web recopilados a través de rastreadores en más de 100 países. está en el nivel EB. Los datos de Baidu son muy diversos. Los datos que recopila incluyen datos no estructurados o semiestructurados, incluidos datos de páginas web, videos e imágenes, así como datos estructurados, como datos de comportamiento de clics del usuario, anunciantes, etc. etc.
Los big data de Baidu sirven principalmente a tres tipos de personas: uno son los usuarios de Internet, que utilizan big data y tecnología de procesamiento del lenguaje natural para hacer que las búsquedas de los internautas sean más precisas; el segundo tipo son los anunciantes, que utilizan big data para; permitir a los anunciantes que los anuncios tengan un mayor grado de coincidencia con las palabras clave de búsqueda, o un mayor grado de coincidencia con el contenido de la página web que los internautas están viendo. La tercera categoría es el motor de big data de Baidu, que también se promociona con un; centrarse en servir a industrias tradicionales con una cierta escala de datos.
Baidu Big Data Engine representa la tendencia de apertura y cooperación en las capacidades de servicios de datos empresariales de Internet. Baidu Big Data Engine consta de los siguientes tres aspectos:
Open Cloud: la gran escala de Baidu. distribución Computación y almacenamiento en la nube a gran escala, los big data en la nube abierta abren capacidades de infraestructura y hardware. En el pasado, Baidu Cloud estaba dirigida principalmente a desarrolladores, mientras que la nube abierta del motor de big data estaba dirigida a "grandes desarrolladores" que tienen necesidades de procesamiento y almacenamiento de big data. Según el personal relevante de Baidu, Baidu Open Cloud también tiene las características de alta utilización de CPU, alta elasticidad y bajo costo. Baidu es la primera empresa del mundo en comercializar servidores ARM a gran escala. La arquitectura ARM se caracteriza por un bajo consumo de energía y una alta densidad de almacenamiento. Al mismo tiempo, Baidu es también la primera empresa en aplicar GPU (procesador de gráficos). el campo del aprendizaje automático, logrando la capacidad de ahorrar consumo.
Data Factory: Data Factory es la capacidad del software de Baidu para organizar cantidades masivas de datos. Funciona de manera similar al software de base de datos, pero la diferencia es que Data Factory se utiliza para procesar terabytes o incluso datos más grandes. Baidu Data Factory admite consultas de datos heterogéneos a gran escala, admite declaraciones de consulta más complejas y similares a SQL y admite varios escenarios comerciales de consulta. Al mismo tiempo, Baidu Data Factory también albergará consultas y escaneos simultáneos para tablas grandes de nivel de terabytes, que pueden alcanzar cientos de GB por segundo para consultas grandes y baja concurrencia.
Baidu Brain: Baidu Brain abre las capacidades anteriores de Baidu en inteligencia artificial, principalmente capacidades de aprendizaje automático a gran escala y capacidades de aprendizaje profundo. Anteriormente se han utilizado en reconocimiento de voz, imágenes, texto, así como en lenguaje natural y comprensión semántica, y se han abierto al hardware inteligente a través de plataformas como Baidu Inside. Ahora estas capacidades se utilizarán para analizar, aprender, procesar, utilizar big data de manera inteligente y ponerlos a disposición del mundo exterior.
Baidu agrupa capacidades de infraestructura, capacidades de sistemas de software y tecnología de algoritmos inteligentes. Después de abrirse a través del motor de big data, las industrias con big data pueden acceder a sus propios datos a este motor para su procesamiento. Desde un punto de vista arquitectónico, las empresas u organizaciones también pueden optar por utilizar solo uno de los tres conjuntos. Por ejemplo, los datos deben almacenarse en su propia nube, pero se deben utilizar algunos algoritmos inteligentes de Baidu Brain, o los datos deben usarse. se almacenará en Baidu Cloud y el algoritmo se escribirá por sí mismo.
El papel del motor de big data de Baidu
Podemos analizar el papel del motor de big data de Baidu en detalle desde dos aspectos:
(1) Para * ** organizaciones: Por ejemplo, el departamento de transporte tiene big data de Internet de vehículos, Internet de las cosas, monitoreo de redes de carreteras, Internet de barcos, monitoreo de terminales y estaciones, etc. Si estos datos se combinan con los registros de búsqueda de Baidu, se obtienen datos de toda la red. y datos LBS, se puede utilizar el motor de big data de Baidu Con capacidades de big data, se puede realizar una planificación de ruta inteligente y una gestión de capacidad; el departamento de salud tiene datos de informes legales sobre influenza, vigilancia centinela nacional de casos similares a la influenza y datos de vigilancia patógena. Si se combina con los registros de búsqueda de Baidu y los datos de toda la red, puede proporcionar orientación sobre vacunación y predicción de la influenza.
(2) Para las empresas: muchas empresas también tienen big data masivos, pero muchas empresas tienen capacidades débiles de procesamiento y minería de big data. Si se aplica el motor de big data de Baidu, los datos masivos se pueden procesar de manera confiable y a bajo costo. costo de almacenamiento y llevar a cabo una minería de valor inteligente de poca profundidad a profundidad. Por ejemplo, en la jornada de puertas abiertas tecnológicas de Baidu en abril de 2014, Ping An de China presentó cómo utilizar las capacidades de big data de Baidu para mejorar la comprensión y la predicción de los consumidores y segmentar grupos de clientes para desarrollar productos y planes de marketing personalizados.
La estrategia de big data de Alibaba
La dirección general de desarrollo de big data de Alibaba es el desarrollo de la era de datos DT (tecnología de datos, impulsada por la tecnología de datos) con el propósito de activar la productividad. Los big data de Alibaba en el futuro consistirán en "apertura de datos basada en la computación en la nube + aplicación de herramientas de big data":
(1) Apertura de datos basada en la computación en la nube. La computación en la nube permite a las pequeñas y medianas empresas obtener servicios de almacenamiento y procesamiento de datos en Alibaba Cloud y también pueden crear sus propias aplicaciones de datos. La computación en la nube es la base de la apertura de datos. La computación en la nube puede proporcionar una plataforma de trabajo de datos para los desarrolladores de datos de todo el mundo. Al mismo tiempo, los desarrolladores de datos pueden utilizar mejor las herramientas de algoritmos de Alibaba en esta plataforma. Necesita desensibilizar los datos y hacer que la definición comercial de datos y cada etiqueta sea lo suficientemente clara para permitir que los desarrolladores de datos de todo el mundo comiencen a pensar en los datos en la plataforma Alibaba, de modo que los datos puedan ser utilizados por *** y los consumidores. por industria. Una vez que se abren los big data de Alibaba, los datos en línea y fuera de línea se pueden conectar en serie. Todos son proveedores y usuarios de datos.
(2) En términos de la aplicación de big data, Jack Ma ha determinado dos políticas para toda la aplicación de datos:
La primera política: de TI a DT (tecnología de datos), DT Es el poder que enciende e inspira todos los datos. Es utilizado por la administración, la sociedad, las ventas, la fabricación y el crédito al consumo. Como se analizó anteriormente, los activos de datos de Alibaba son principalmente el comercio electrónico. Entre ellos, Taobao y Tmall generan datos ricos y diversos todos los días. Alibaba ha acumulado varios tipos de datos, incluidos transacciones, finanzas, servicios de vida, etc. Estos datos pueden ayudar a Alibaba a realizar operaciones digitales (como se muestra a continuación).
Otra de sus aplicaciones más importantes es en el ámbito financiero: las pequeñas y microfinanzas. En el ámbito de la financiación de pequeñas y microempresas financieras. Debido a que los bancos no pueden captar los datos operativos reales de las pequeñas y microempresas, no solo muchas empresas no pueden obtener préstamos, sino que además todo el proceso de evaluación es demasiado largo debido a que los tipos de datos son insuficientes. Alibaba ya ha utilizado transacciones, crédito y SNS. , etc. en sus datos de comercio electrónico. Estos datos se utilizan para determinar si se puede otorgar un préstamo y el monto del préstamo.
La segunda política: dejar que los datos y las herramientas de Alibaba se conviertan en la infraestructura de las empresas chinas. Alibaba ha comenzado a transformarse. Alibaba pasará de estar frente a los consumidores directamente a apoyar a los comerciantes en línea para enfrentar a los consumidores. Alibaba desarrollará más herramientas basadas en su experiencia operativa y de datos existente para ayudar a los comerciantes en línea a crecer y permitir que los comerciantes de Internet crezcan. utilizar las mejores herramientas y servicios para servir bien a los consumidores. Como dijo Jack Ma: "Creo que no hay ningún negocio online que no quiera tener sus propios clientes. No hay ningún negocio online que no quiera saber si la experiencia del cliente con ellos es buena o mala, y cómo tenerla". estos clientes durante mucho tiempo. Creemos que la economía de un país debería dejarse en manos de la comunidad empresarial. Creemos que la economía futura de los comerciantes de Taobao debería dejarse en manos de los comerciantes en línea, no de nosotros".
La estrategia de big data de Tencent
El big data de Tencent actualmente sirve a más operaciones internas de Tencent. En comparación con Alibaba y Baidu, el grado de apertura de datos no es alto.
Por lo tanto, para Tencent, nos centramos principalmente en los escenarios de aplicación y servicios de big data de Tencent en empresas de servicios.
Más del 90% de los datos de Tencent se han administrado de forma centralizada. Los datos se concentran en el departamento de plataforma de datos. Los datos de más de 100 productos se han administrado y almacenado de forma centralizada en el almacén de datos de desarrollo propio de Tencent. (TDT). Tencent Big Data se puede dividir en cuatro niveles a partir de diferentes aspectos de la aplicación de datos, incluido el análisis de datos, la extracción de datos, la gestión de datos y la visualización de datos:
(1) La capa de análisis de datos tiene cuatro productos: autoservicio Análisis, perfilado de usuarios, análisis multidimensional en tiempo real y cambio de herramientas de posicionamiento inteligente. El análisis de autoservicio puede ayudar al personal no técnico a realizar estadísticas de datos y funciones de visualización a través de una configuración de condición simple, que puede ser una herramienta de análisis multidimensional en tiempo real para un determinado grupo de usuarios o usuarios de una determinada empresa; utilizado para Un indicador puede realizar una segmentación en tiempo real en múltiples dimensiones, lo que hace que sea conveniente para los analistas realizar un análisis multidimensional de un determinado indicador desde diferentes ángulos; la herramienta de posicionamiento inteligente de movimiento anormal realiza un posicionamiento inteligente de problemas de anomalías de datos.
(2) Las aplicaciones de productos a nivel de minería de datos incluyen: sistemas de publicidad de precisión, motores de recomendación personalizados para el usuario y gestión del ciclo de vida del cliente. Los sistemas de publicidad de precisión como Guangdiantong se basan en los datos masivos de la gran plataforma social de Tencent. A través de algoritmos de recomendación precisos, se utilizan posiciones de promoción dirigidas inteligentes para lograr una entrega de publicidad precisa en función de los intereses y preferencias de cada usuario. algoritmos de recomendación personalizados (filtrado colaborativo, recomendación basada en contenido, algoritmo gráfico, bayesiano, etc.), se realizan las necesidades de recomendación personalizada de los productos y el sistema de gestión del ciclo de vida del cliente se basa en big data y en la ubicación del usuario; cliente Realizar extracción de datos en diferentes ciclos de vida y establecer modelos de predicción, alerta temprana y características del usuario para realizar operaciones refinadas y marketing en función de las diferentes características del ciclo de vida de los usuarios/clientes.
(3) A nivel de gestión de datos, se encuentran: TDW (Tencent Data Warehouse), TDBank (Data Bank), plataforma de gestión de metadatos, sistema de programación de tareas y seguimiento de datos. Este nivel implementa principalmente el almacenamiento centralizado eficiente de datos, la gestión de datos de definición de indicadores comerciales, la gestión de la calidad de los datos, la programación y el cálculo oportunos de tareas informáticas y el monitoreo y alarma de problemas de datos.
(4) A nivel de visualización de datos, existen: herramientas de informes de autoservicio, Tencent Compass, Tencent Analysis y Tencent Cloud Analysis, entre otras herramientas. Las herramientas de informes de autoservicio pueden realizar informes de autoservicio con estructuras y lógicas relativamente simples. Tencent Compass se divide en una versión interna y una versión externa. La versión interna es una herramienta de informes eficiente que sirve a los usuarios internos de Tencent (gerentes de producto, personal de operaciones y personal técnico, etc.), mientras que la versión externa es una herramienta de informes que sirve. Los socios de Tencent, como los desarrolladores. Tencent Analytics es una herramienta de análisis de sitios web que ayuda a los propietarios de sitios web a realizar análisis completos de sus sitios web. Tencent Cloud Analysis es una herramienta de análisis que ayuda a los desarrolladores de aplicaciones a tomar decisiones y optimizar operaciones.
En términos generales, las tres principales empresas de Internet, Baidu, Alibaba y Tencent, tienen big data, y los datos de los tres principales gigantes de Internet se utilizan para optimizar los efectos operativos de sus propios negocios. sus datos Los escenarios de aplicación de valor son relativamente similares. Sin embargo, debido a las diferencias en sus negocios y modelos de negocios, los activos de datos de los tres son diferentes y las estrategias futuras de big data de los tres también son diferentes, especialmente desde la perspectiva de la apertura y la cooperación basada en big data, Baidu y. Alibaba es relativamente más abierta. Para las empresas de Internet que valoran la apertura y la cooperación de Big Data, lo que más esperan es utilizar la estrategia de apertura de Big Data para intercambiar más datos con industrias más tradicionales, enriqueciendo así mejor sus datos fuera de línea y formando en línea y La colaboración de datos fuera de línea puede conducir al desarrollo de nuevos modelos de negocio, como hardware inteligente y salud de big data. ¿Cuáles son las diferencias entre las aplicaciones de big data de Internet de BAT?
Esto debe analizarse a partir de los respectivos genes de BAT. Baidu busca principalmente productos, por lo que los big data de Baidu se utilizan principalmente para la búsqueda, lo que hace que las búsquedas sean más precisas y coincidentes; Alibaba se centra en el comercio electrónico, por lo que los big data de Alibaba se centrarán principalmente en los productos de los usuarios; por lo que Tencent puede utilizar más big data en el análisis de redes sociales. El objetivo principal de big data es la predicción, por lo que el enfoque principal de BAT en big data es proporcionar servicios y marketing más precisos a través del análisis de usuarios. Mire a Baidu, cómo Alibaba y Tencent utilizan las aplicaciones de big data de Internet.
Alibaba tiene un cubo de datos para proporcionar a los vendedores servicios pagos.
¿Cuál es la diferencia entre "Internet" y "todos los espacios" en Baidu?
“Internet”
y
“Todos los espacios”
Internet se refiere a toda la información que hay en Internet
Para Baidu
Información principalmente china
Todos los espacios
Se refiere a todos los usuarios de Baidu
Espacio Baidu creado
(Blog + Álbum + Tablero de mensajes)
Obviamente, la búsqueda de este último
no incluye blogs distintos de Baidu Space
¿Cómo obtener y postular? Big data de Internet
Big data es una gran cantidad de información cambiante, de alta velocidad y que requiere nuevos métodos de procesamiento para promover capacidades de toma de decisiones más sólidas, conocimientos y un procesamiento óptimo. Big data proporciona un espacio y un potencial sin precedentes para que las empresas obtengan conocimientos más profundos y completos.
Con la ayuda de big data y tecnologías relacionadas, podemos realizar marketing dirigido a clientes con diferentes características de comportamiento, e incluso pasar de "recomendar un producto a algunos clientes adecuados" a "recomendar algunos productos adecuados a "Un cliente" puede centrarse más en los clientes y realizar un marketing de precisión personalizado.
El marketing de precisión en la era del big data se refiere a obtener las preferencias y preferencias de comportamiento de los objetos a través de big data y realizar diferentes marketing para diferentes objetos. El núcleo del marketing de precisión de big data se puede resumir en varias palabras clave: usuarios, necesidades, identificación y experiencia.
YimeiSoftStone lanza servicios de datos en la nube, continuando con la filosofía comercial corporativa de Yimei de servicio al cliente, marketing de clientes y gestión de clientes, y brindando a los clientes servicios a nivel de datos, como verificación de datos y marketing de precisión a través de sus enormes recursos de datos de consumo. . En pocas palabras, proporciona servicios de verificación y análisis de datos para empresas.
- ¿Cuáles son las perspectivas para la aplicación de la formación en big data de Internet?
No te preocupes, tendrás buenas perspectivas si lo aprendes bien. {Variable 9} ¿Cuál es la diferencia entre big data y small data?
1. Los grandes datos enfatizan la predicción, los pequeños datos enfatizan la explicación; 2. Los grandes datos enfatizan el descubrimiento, mientras que los pequeños datos enfatizan la evidencia empírica; 3. Los grandes datos enfatizan la correlación, mientras que los pequeños datos enfatizan la causalidad; enfatiza el conjunto, el remuestreo de datos pequeños 5. Repercepción de big data, precisión de datos pequeños; ¿Cuál es la diferencia entre un centro de datos empresarial y un centro de datos de Internet?
DCCI DATA CENTER OF CHINA INTERNET (DCCI para abreviar), una organización autorizada y plataforma de datos para monitoreo e investigación, medición, análisis y optimización de Internet proveedor de servicios de marketing. Basado en una variedad de medios técnicos líderes, como software Panel, incrustación de código, extracción masiva de datos y procesamiento de información semántica, realiza sitios web y usuarios...
Centro de datos de Internet: IDC, que almacena principalmente redes data (Sitio web + datos + sitio de descarga, etc.) cubre una amplia gama de opciones, y cualquier empresa formal o pequeño y mediano webmaster puede elegir entre ellas.
Centro de datos empresarial: Es más específico y puede formar parte del centro de datos de Internet.