Hoja de registro de datos
1. Dominio empresarial
Un método de división empresarial con una dimensión mayor que el dominio de datos es adecuado para sistemas empresariales muy grandes donde los indicadores o negocios se superponen entre negocios. sectores más pequeños. Por ejemplo, el segmento de negocios de automóviles privados incluye terminales de pasajeros y terminales de conductores, y el segmento de negocios de comercio electrónico incluye centros comerciales y módulos de reembolsos.
2. Proceso de negocio
El proceso de negocio se puede resumir como eventos de comportamiento indivisibles, como facturación, pago, evaluación y otros procesos/eventos de negocio.
Después de ver esta serie de términos, muchas personas pueden confundirse, pero el ámbito empresarial aún es comprensible. En resumen, es la clasificación de diferentes negocios; el proceso de negocio también es fácil de entender, lo que equivale a dibujar un diagrama de flujo de negocio.
Entonces, ¿dónde está el carácter sagrado del dominio de datos?
3. Dominio de datos
Es una colección de temas de datos estrechamente relacionados y una clasificación conceptual altamente generalizada de objetos de negocio, con el propósito de promover la gestión y aplicación de datos.
En definitiva, el dominio de los datos es similar al escritorio de nuestro ordenador. Necesitamos crear diferentes carpetas para almacenar datos. Estas carpetas se denominan campos de datos.
¿Cómo entender las dimensiones, los atributos de las dimensiones y la decoración? ¿De qué sirve?
4. Escala
Es un entorno de medición utilizado para reflejar un atributo empresarial. La colección de tales atributos forma una dimensión que puede verse en el nivel quién-dónde-cuándo-qué.
5. Atributos de dimensión
Los atributos de dimensión pertenecen a dimensiones y son equivalentes a la descripción específica de la dimensión. Por ejemplo, el género en la dimensión del usuario es masculino o femenino.
Modificar la palabra
Hacer referencia al escenario empresarial de indicadores distintos de las dimensiones estadísticas.
7. Tipo de modificación
División abstracta de modificadores.
En resumen, las dimensiones y modificaciones pueden entenderse como algunas condiciones restrictivas de los indicadores atómicos. Las personas que conocen SQL pueden comprender mejor cuando escriben SQL, generalmente se colocan después de la declaración donde.
8. Indicadores Métricos/Atómicos
Los indicadores atómicos y las medidas tienen el mismo significado. La medición bajo un determinado evento de comportamiento empresarial es un indicador integral en la definición del negocio, como lo es el número de registros.
9. Periodo
Se utiliza para definir el rango de tiempo o punto temporal de las estadísticas de datos, como los últimos 30 días, semanas naturales, al día de hoy, etc.
10. Tipos de indicadores
Incluidos indicadores atómicos e indicadores derivados.
Índice atómico = medición de eventos de comportamiento
Índice derivado = un índice atómico con múltiples períodos de tiempo de modificación
Por ejemplo, índice atómico = volumen de pedidos completado, índice derivado = Pedidos completados para pasajeros de iOS la semana pasada, donde período de tiempo = la semana pasada, modificación = iOS, dimensión = pasajeros, índice atómico = pedidos completados.
2. Problemas comunes y soluciones en el desarrollo de etiquetas de datos
Problema 1: La definición del indicador no es lo suficientemente clara. Las definiciones de los indicadores en las dos páginas son en realidad diferentes, pero es posible que se muestre al comerciante el mismo nombre chino. O los indicadores con el mismo significado tienen diferentes nombres en diferentes interfaces, lo que resulta confuso.
Problema 2: dado que un indicador es desarrollado por diferentes estudiantes de desarrollo de datos, puede desarrollarse repetidamente, lo que no solo desperdicia recursos, sino que también dificulta el mantenimiento.
Pregunta 3: Para los indicadores que necesitan ser desarrollados recientemente, no solo faltan herramientas de desarrollo para simplificar el proceso de desarrollo, sino que también depende en gran medida qué tablas deben usarse y cuáles no. sobre estudiantes de desarrollo de datos y la experiencia de varios compañeros de Warehouse. Si es un poco descuidado o carece de experiencia, por ejemplo, si usa tablas que son exclusivas de ciertos campos comerciales, o tablas que no son capas intermedias unificadas proporcionadas por varios almacenes, puede usar datos incorrectos, lo que resultará en reelaboraciones posteriores.
Para resolver los problemas anteriores, surgió la base de datos de índice.
La fuente de datos de índice en la base de datos de índice generalmente se calcula a partir de las tablas de la base de datos DW y la capa intermedia unificada del almacén de datos. Los metadatos más básicos de la base de datos de índice, como información de dimensiones, información de índice atómico, etc., utilizan la capa intermedia unificada del almacén de datos.
El primer paso: determinar el dominio comercial del almacén e importar las tablas de la biblioteca DW para unificar la capa intermedia.
Primero determine a qué dominio pertenece el indicador de dimensión que se ingresará. Por ejemplo, una tienda pertenece al dominio de la tienda y el monto del pago del pedido pertenece al dominio de la transacción. Siempre que algunos almacenes tengan su propia planificación unificada. Luego, la tabla de la capa intermedia se puede importar a la biblioteca de indicadores.
Paso 2: Definir indicadores atómicos, dimensiones y modificadores.
Crear nuevas dimensiones métricas, etc. si no están definidas previamente. y asociarlos con los campos correctos de la tabla. En el primer paso de importar la tabla, también puede asociar rápidamente la tabla con indicadores de dimensiones existentes.
Paso 3: Generar indicadores derivados.
Utilizando metadatos como indicadores atómicos y de dimensión, puede definir indicadores derivados. Utilizando la función de generación de SQL de la biblioteca de índices, se pueden generar rápidamente calibres técnicos. Al mismo tiempo, la tarea de programación de la plataforma de desarrollo de datos de un único indicador derivado se puede crear rápidamente en la biblioteca de indicadores.
Paso 4: Aplicar indicadores derivados.
Después de seleccionar múltiples indicadores derivados, puede crear rápidamente una plataforma de desarrollo de datos para programar tareas y una API en línea para servicios de datos unificados para múltiples indicadores derivados a través de la biblioteca de indicadores. En este momento, puede consultar un lote de datos de indicadores en línea. Por supuesto, la base de datos de índice también admite consultas ad hoc de datos de índice.
Características de la biblioteca de etiquetas:
(1) Búsqueda: muchas etiquetas significan una baja eficiencia de búsqueda. La mayoría del personal empresarial está acostumbrado a acceder a las etiquetas que le interesan, por lo que deben configurarlas. cree un área comercial especial según Clasifique las etiquetas según la clasificación comercial de su propia empresa. Pero no importa qué clasificación pueda resolver los requisitos de la gestión flexible de primera línea, también debe proporcionar la capacidad de personalizar las etiquetas para garantizar la autoridad y las etiquetas personalizadas para garantizar la flexibilidad.
(2) Tiempo real: toda la escena (LBS) se puede encapsular en una etiqueta dinámica y luego se pueden configurar las reglas de activación.
(3) Clúster: cada uno; El usuario está en un grupo específico, es necesario romper con el método original de administración de etiquetas centrado en el usuario y crear un nuevo sistema de etiquetas de clúster basado en el negocio real, lo que puede mejorar en gran medida la eficiencia de la administración y generación de grupos de clientes. Por ejemplo, al comercializar productos para el hogar, debemos prestar más atención al cabeza de familia, por lo que necesitamos etiquetas del hogar en lugar de etiquetas personales.
(4) Rendimiento: la biblioteca de etiquetas presta especial atención a dos tipos de rendimiento, uno es la capacidad informática en tiempo real y el otro es la capacidad de consulta en tiempo real. El primero resuelve el problema de la eficiencia en la generación de grupos de clientes mediante cálculos de combinación de etiquetas. Por ejemplo, al asociar 10 combinaciones de etiquetas para obtener un grupo de usuarios objetivo, debe generarlo en poco tiempo. estadísticas, porque personal de negocios La estrategia debe ajustarse en función del volumen de datos real.
(5) Etiquetas de colección: por ejemplo, hay cuatro etiquetas para el lugar de trabajo, a saber, el día de la ciudad donde trabaja el usuario, el día del condado donde trabaja el usuario, el día del municipio donde trabaja el usuario, el día XXXX en que el usuario trabaja, etc. Pero encontrará que los usuarios a menudo no pueden seleccionar las etiquetas que necesitan en un solo paso cuando lo usan porque hay demasiadas opciones y la granularidad es demasiado fina. Este fenómeno es muy común. Por lo tanto, se agrega el concepto de etiquetas agregadas, es decir, se empaqueta una vez y las etiquetas finalmente mostradas al usuario se integran en una, es decir, el día que el usuario trabaja en el área administrativa, etiquetas más detalladas. se definen como subetiquetas, que es un método de diseño de arriba hacia abajo.
En tercer lugar, la aplicación de etiquetas en marketing
El proceso de conexión entre la biblioteca de etiquetas y la plataforma de marketing: todos los grupos de clientes utilizados por la plataforma de marketing provienen de la biblioteca de etiquetas. Para el proceso de iniciación iniciado por los usuarios en la plataforma de marketing, lo más conveniente debería ser seleccionar los grupos de clientes que crearon en la biblioteca de etiquetas. Por el contrario, lo más conveniente debería ser enviar los grupos de clientes a plataformas externas como las de marketing.
Ahora estamos promocionando plataformas intermedias, y los sellos también son plataformas intermedias. El trabajo principal de la plataforma intermedia de datos no es crear funciones, sino mejorar continuamente la calidad de los modelos y etiquetas para que estos datos puedan continuar generando valor.
Es necesario establecer un mecanismo de retroalimentación para la efectividad de las etiquetas, como evaluar las etiquetas en función de su tasa de éxito de marketing. Al menos debe saber qué etiqueta está relacionada con qué campaña de marketing, para poder juzgar el valor de la etiqueta en función del éxito del marketing.