¿Cuáles son las funciones comunes pero inútiles en el análisis de registros de operación y mantenimiento de TI?
El análisis de registros, que es común en la operación y el mantenimiento de TI, no tiene muchas funciones.
Entre estos enormes requisitos funcionales, o "que lo abarcan todo", hay algunos, tal vez porque suena genial, o tal vez porque quiero continuar con mis hábitos pasados, hoy estoy en un viaje de negocios y rara vez tengo tiempo libre para relajarme, así que decidí quejarme de funciones tan insignificantes.
Autor: Brother Xiaoma Fuente: Escuela de Operación y Mantenimiento | 2016-11-22 14:12 Colección Compartir
El análisis de registros es una parte muy importante del campo de operación y mantenimiento de TI. Incluso se puede decir que hoy en día, cuando prevalecen la plataformatización, la modularización y la orientación a servicios, la importancia de esta parte del trabajo se ha acercado a la del monitoreo de equipos tradicionales. Sin embargo, los registros son más complejos que los indicadores de dispositivos debido a sus fuentes, usuarios y administradores, por lo que los requisitos funcionales para el análisis de registros también son mayores. Entre estos requisitos funcionales enormes o "que lo abarcan todo", hay algunos, tal vez porque suenan geniales, tal vez porque quieren continuar con los hábitos de uso anteriores. Hoy estoy en un viaje de negocios y rara vez tengo tiempo libre para relajarme. Decidí No es lo mismo quejarse de varias de sus funciones.
Alertas en Tiempo Real
La primera de ellas es la denominada “Alerta en Tiempo Real”. El propósito de un sistema de alerta se puede dividir en dos tipos:
Hay problemas que deben resolverse y
Hay problemas que deben evitarse.
Dividámoslo en dos categorías:
Si desea llamar a alguien para solucionar el problema, suponiendo que sus alertas hayan mejorado hasta el punto de que no sea necesario solucionar el problema en absoluto. , luego, pasan al menos unos minutos desde el momento en que suena la alerta hasta que inicia sesión en el servidor para resolver el problema, lo cual, según la Ley de Murphy, podría ocurrir mientras duerme, come o en el autobús a la hora construcción de grupos. De acuerdo con la Ley de Murphy, lo más probable es que esté durmiendo, comiendo, viajando en el automóvil o asistiendo a una reunión de clase, por lo que diez minutos es un buen momento para actuar rápidamente. Entonces, ¿cuál es la diferencia entre una alarma en los primeros 0,1 segundos y una alarma en el décimo segundo? Y comprimir la alarma de un intervalo de 10 segundos a 1 segundo en tiempo real requiere un ajuste estructural y un aumento de costos, que no es ni un poquito... (¿Dijiste que el filtrado en tiempo real de una palabra clave no cuesta mucho? Entonces tienes para fortalecerlo primero El seguimiento, expansión, supresión y otras funciones del sistema de alarma, las alarmas no son tan simples)
Si desea evitarlas de antemano, en términos generales, su infraestructura se ha desarrollado muy bien. y solo desea pasar la alarma. Activa acciones para modificar automáticamente la coordinación del tráfico, los recursos y la programación de tareas. Esta necesidad realmente cae más en el ámbito de la planificación de capacidad, es difícil imaginar que necesites manejar este tipo de cosas en tiempo real y ¿quién no jugaría con el espacio libre en su plataforma?
Por supuesto, no importa de qué me queje anteriormente, es la búsqueda de un rendimiento en tiempo real de 1 segundo o incluso milisegundo. Si su intervalo de monitoreo todavía está estancado en 5 minutos o más, no lo use como escudo; si necesita horas desde la alerta hasta la resolución del problema, es posible que 5 minutos no sean suficientes, pero la forma en que localiza fallas o fallas. Es necesario mejorar el contenido de su sistema de alarma.
Pasa página, pasa página, pasa página, pasa página
El segundo es showmemoremoney, incorrecto, es logline. Los sistemas de análisis de registros generalmente enumeran las líneas de registro en la interfaz para su visualización. Y un montón de 'trucos' harán felizmente clic en página siguiente página siguiente página siguiente página siguiente ~ una ~ página ~ siguiente ~ página ~ y luego el sistema fallará.
Esta solicitud de función es en realidad un vestigio del antiguo hábito catlogfile|grepKEYWORD|less.
Con suerte, podrán formar una fila y comenzar a mirar los registros. Ctrl F Es genial estar atrapado en una página, pero pierdes todo el tiempo sin darte cuenta. Piensa en la última y seguirás queriendo "tiempo real". La forma más adecuada de solucionar problemas de operaciones y mantenimiento es intentar hacer errores rápidamente! Si una idea no funciona, es hora de probar la siguiente. Si no puede distinguir entre 20 publicaciones en una página y 40 publicaciones en dos páginas, entonces debe cambiar el período de tiempo y las palabras clave.
Por supuesto, dicho esto, si sigues pensando en volver la página, también es posible que realmente no quieras cambiar ninguna palabra clave. Es necesario que el sistema de análisis de registros proporcione funciones que ayuden a los usuarios a encontrar las palabras clave correctas más rápidamente. Esta es la visualización del panel. Aprovechar la funcionalidad adecuada para hacer lo correcto no debería seguir utilizando métodos engorrosos cuando existe una manera correcta.