Práctica 8 de Microsoft Business Intelligence: un breve análisis de la tecnología SSAS
Con la continua popularidad del software ERP nacional, un gran número de empresas han acumulado una gran cantidad de datos. Cómo extraer y extraer información valiosa para el desarrollo empresarial a partir de datos, proporcionar una base para la toma de decisiones para los negocios corporativos y promover una gestión corporativa eficiente. Los analistas de negocios suelen utilizar varias herramientas de análisis de datos, como Excel, Tableau y PowerBI, que son herramientas de análisis de datos de uso común. La tecnología del motor OLAP se utiliza a menudo para interactuar con dichas herramientas de análisis de datos y proporcionar soporte de datos a estas herramientas de análisis de datos.
Hay muchos motores OLAP tradicionales. Oracle, SAP, IBM y Microsoft tienen su propia tecnología de motor OLAP. Según la comprensión de Xiaolizi de la tecnología de motor OLAP, Microsoft SQL Server Analysis Services (SSAS) también es el mejor del mundo. El motor OLAP más grande es uno de los motores OLAP más utilizados. Muchas grandes empresas con las que está familiarizado son usuarios profundos de SSAS. El éxito de SSAS es inseparable de algunas de sus características funcionales:
Integración profunda con Excel
Excel es la herramienta de análisis empresarial más utilizada en el mundo y SSAS se puede integrar profundamente con Excel. Los usuarios pueden usar Excel para conectarse a cubos SSAS, realizar operaciones de manera flexible y rápida como dividir, filtrar, acumular y profundizar en los datos, y analizar los datos en profundidad hasta encontrar la información empresarial que necesitan.
Admite lenguaje MDX
SSAS puede usar MDX (expresión multidimensional) para admitir requisitos avanzados de inteligencia empresarial, como los indicadores de cálculo YTD, QTD y MTD de uso común que se pueden admitir fácilmente. Y MDX puede satisfacer diversas necesidades de inteligencia empresarial de forma más sencilla y amplia que SQL.
Se puede integrar con BI convencional
Por ejemplo, PowerBI, Tableau, etc. se pueden integrar fácilmente con SSAS. SSAS recibe los requisitos de consulta enviados por el BI front-end y los calcula. en su propio motor y los agrega. El valor final se devuelve al BI de front-end para mejorar la experiencia de consulta del BI de front-end.
Aunque SSAS de Microsoft tiene muchas características excelentes, lo que lo convierte en una opción ideal para muchas soluciones de inteligencia empresarial, en la era del big data se enfrenta cada vez a más desafíos. Y a medida que los volúmenes de datos aumentan, estos desafíos se vuelven aún más importantes.
Limitaciones en la cantidad de datos y el número de dimensiones
Por lo general, SSAS utiliza el modo MOLAP. MOLAP almacena físicamente los datos multidimensionales utilizados en el análisis OLAP en forma de matrices multidimensionales, formando. Estructura de "cubo". Este método tiene mayores ventajas de rendimiento cuando la cantidad de datos es menor. Pero cuando se enfrenta a grandes conjuntos de datos, el problema de explosión de dimensiones resultante dificultará el mantenimiento de la arquitectura MOLAP. Por tanto, esta solución tendrá cuellos de botella ante datos masivos.
Expansión restringida
Si las capacidades de procesamiento SSAS existentes no pueden satisfacer la demanda y necesitan mejorar sus capacidades de procesamiento, el usuario debe agregar más instalaciones de hardware al servidor que ejecuta SSAS para satisfacer las necesidades. . necesidad. Al mismo tiempo, si necesita almacenar más datos, deberá ampliar el almacenamiento local.
Al entrar en la era de la transformación digital, los datos están creciendo explosivamente y las desventajas de SSAS son cada vez más obvias. Cada vez más empresas están comenzando a buscar tecnologías para reemplazar SSAS. Hoy en día, a medida que la tecnología Hadoop se vuelve cada vez más perfecta, una arquitectura de análisis BI/OLAP ideal debería conservar todas las funciones de análisis SSAS y poder utilizar la escalabilidad horizontal de la tecnología Hadoop para resolver todos los puntos débiles que enfrenta dicho OLAP. La arquitectura de análisis de Hadoop debería poder hacer lo siguiente:
Proporcionar escalabilidad horizontal
Una característica importante del sistema de archivos distribuido de Hadoop (HDFS) es que las capacidades de almacenamiento y procesamiento se pueden ampliar agregando servidores. al clúster. Una solución ideal La solución OLAP en Hadoop también hereda esta poderosa característica. Esta solución mejora enormemente la escalabilidad del sistema y reduce la dificultad de ampliar las capacidades del sistema.
Romper el límite superior en volumen de datos y número de dimensiones. Como se mencionó anteriormente, debido a la capacidad de Hadoop para escalar horizontalmente, el almacenamiento de datos ya no es un cuello de botella, siempre que el clúster sea suficiente. límite superior en el volumen de datos. Dado que SSAS necesita agregarse de acuerdo con todas las dimensiones en el conjunto de datos multidimensionales, el problema de la explosión de dimensiones es inevitable. La tecnología OLAP ideal debería permitir a los usuarios personalizar las dimensiones de agregación, evitando efectivamente el problema de la explosión de dimensiones y rompiendo el límite superior del número. de dimensiones.
Rendimiento de mayor costo La solución OLAP en Hadoop no requiere una máquina todo en uno de alta configuración para construir un clúster, y el costo de hardware se reduce considerablemente. Esta característica es especialmente obvia en plataformas en la nube que cobran según los clústeres y el tiempo. Los usuarios pueden expandir el clúster cuando se necesita una gran cantidad de recursos, reducir el clúster cuando está inactivo y liberar el exceso de recursos para lograr el máximo ahorro de recursos y costos.
Este artículo nos permite ver claramente las muchas ventajas de SSAS, lo que lo convierte en un motor OLAP muy popular. Sin embargo, también tiene varios problemas, como capacidades de expansión limitadas y capacidad de datos limitada. Aunque Microsoft SSAS no puede superar las limitaciones de volumen de datos y número de dimensiones, es suficiente para muchas pequeñas y medianas empresas. Por lo tanto, la cantidad de datos es un punto de referencia importante para la selección del motor, porque a medida que aumenta la cantidad de datos, plantea mayores desafíos para las capacidades de procesamiento del motor y la respuesta a las consultas. Hay diferentes motores disponibles para diferentes cantidades de datos. como se muestra en la siguiente figura:
El motor OLAP que se utiliza finalmente depende de la cantidad de datos que el usuario necesita procesar. Después de todo, cuando se enfrenta a una pequeña cantidad de datos que Microsoft SSAS puede resolver, ¿por qué gastar tanto dinero para comprar una solución de tecnología Hadoop? Lo que debemos hacer es aprender bien estas tecnologías y brindar a los clientes mejores soluciones técnicas desde una perspectiva más razonable.