El conocimiento de la red involucra básicamente dos aspectos, configuración de la red (física y lógica) y monitoreo del desempeño. Para buscar este conocimiento, el NPMD, que significa Monitoreo y Diagnóstico del Desempeño de la Red, debe estar entre las prioridades.

Mantener la configuración siempre actualizada es esencial en todo lo que implica la Operación y el Mantenimiento (O&M) de la Red. Conocerla es posible gracias a un sistema fiable de inventario y también a procesos que se utilizan para mantener la imagen de la red siempre actualizada. Esto, a su vez, depende de procedimientos que deben ser definidos y puestos en marcha: cada vez que se produce un cambio, éste debe entrar en la base de datos del inventario, ya sea de forma manual (con procedimientos auditables y fácilmente aplicables) o automática (a través de interfaces de software con los sistemas de planificación y proyectos, ventas y reserva de capacidad, además de los sistemas de apoyo a la operación de la red, como los de aprovisionamiento de nuevas conexiones). 

Los sistemas de gestión tanto de los elementos de la red como de la propia red, si están habilitados para intercambiar información con el sistema de inventario, pueden automatizar tanto las consultas a la base de datos de la capa física como la reserva de conexiones y la actualización de la imagen de ocupación de la red. 

El otro aspecto que se tiene en cuenta en el conocimiento de la red es la monitorización del desempeño de la misma, analizando el desempeño de aplicaciones, máquinas y de la propia rede (network performance), así como el comportamiento de los usuarios y estimando su percepción de calidad, de servicio . 

Prepararse para operar y mantener las redes en el nuevo entorno requiere planificación, conocimiento de ese entorno de red y de los métodos y herramientas que estarán disponibles. Es necesario entender las nuevas necesidades operativas y establecer el tipo y la necesidad de informaciones relevantes para entender el comportamiento de la red en relación con las expectativas de los usuarios. También es necesario identificar a los usuarios y las aplicaciones, estableciendo objetivos de desempeño ideales y aceptables para cada caso. 

 Para ello, el primer paso es conocer la topología de las redes y monitorizarlas para establecer una referencia del grado de utilización de los recursos de comunicaciones, así como mapear y mantener actualizado el inventario físico y lógico de las redes.  

También es necesario conocer las herramientas y sistemas existentes para la supervisión de las redes, el tipo y el modelo de información que generan para determinar si son suficientes o incluso necesarios. Además, es importante saber cómo se almacena la información generada y cómo se accede a ella cuando se trata del conocimiento de la red. En los casos en los que se utilizan agentes y contadores de software en los propios elementos de red también es necesario saber si la obtención de estos elementos puede afectar al comportamiento de las CPU que controlan las funciones de red de los respectivos routers, switches, firewalls, etc. 

Como todos los métodos de supervisión del rendimiento de la red, los sistemas NPMD (Network Performance Monitoring and Diagnostics) también dependen de la obtención de datos indicativos del desempeño. Estos datos son generados por tres tipos de procesos:  

– recuento de eventos (que generan KPIs, Key Performance Indicators);  

– registrado de flujos;  

– captura de datos de tráfico reales. 

Los indicadores clave de desempeño (KPI) del entorno de datos incluyen algunos elementos básicos: 

– Experiencia del usuario 

  • Tiempo de reacción; 
  • Throughput sostenido; 
  • Calidad del desempeño de la aplicación; 
  • Consistencia; 
  • Disponibilidad; 

– Comportamiento de la red 

  • Estabilidad de las rutas; 
  • Características del trayecto; 

– Comportamiento de los elementos 

  • Características de las subredes 
  • Comportamiento de los elementos de conmutación; 
  • Comportamiento de los recursos de conmutación; 

– Disponibilidad de la red 

  • Disponibilidad de los elementos; 
  • Disponibilidad del trayecto; 
  • Tasa de error de bits (BER) de los elementos de transmisión; 
  • Disponibilidad de trayectos en la red; 

– Características de los caminos 

  • Latencia; 
  • Características de jitter (variación de la latencia de los paquetes); 
  • Características de pérdida de paquetes; 

Algo esencial en las redes actuales es registrar los flujos y clasificarlos de acuerdo a varias propiedades, agrupándolos por varios criterios con el objetivo de generar vistas detalladas clasificadas según la relevancia en cada caso: la ubicación de los puntos finales del flujo, las aplicaciones, los servicios, los caminos y conexiones por donde pasan los flujos, las ubicaciones, la calidad del servicio, el ancho de banda ocupado, etc. Estas vistas, y no la simple identificación de los flujos individuales que pasan por una interfaz determinada, son lo que llamamos “flujos enriquecidos”. Esas son las vistas que permiten construir visualizaciones mucho más detalladas de los flujos y, por lo tanto, facilitan en gran medida la evaluación de comportamientos anómalos y el diagnóstico inmediato de los problemas, así como la identificacón de la tendencia de los cambios a largo plazo. 

Por supuesto, la correlación de la información recogida y el análisis de su impacto en los servicios depende de una representación correcta, actual y precisa del inventario de conexiones en la red. Asimismo, el diagnóstico de los problemas, hasta la capa de red más baja (la capa física, por ejemplo), depende de que se conozcan con exactitud todas las capas de red que contienen las conexiones afectadas. Y, a la inversa, el análisis del impacto de un fallo localizado en las capas inferiores depende de conocer las respectivas conexiones en las capas superiores. 

Dada la enorme complejidad de las redes actuales, la diversidad de caminos, tecnologías y arquitecturas requiere criterios que exigirían demasiado tiempo en el análisis manual de los datos en bruto o incluso preprocesados. Por lo tanto, el uso de técnicas de aprendizaje automático e inteligencia artificial es una parte integral de los sistemas NPMD más modernos y versátiles cuyo objetivo es tratar exactamente este tipo de entornos. Un sistema NPMD se considera tanto mejor cuanto mayor sea su capacidad para seleccionar, clasificar, organizar y procesar los datos de medición y relacionar estos datos con comportamientos relevantes que permitan consolidar la información en los contextos más granulares posibles. Estos contextos granulares incluyen aplicaciones, servidores, ubicaciones, rutas, redes y subredes, usuarios, criticidad, relevancia y experiencia del usuario final. Y, por supuesto, la capacidad de sintetizar los datos observados en dashboards (cuadros sintéticos) que pueden individualizarse para cada operador o función de gestión. 

En resumen, depender de muchas pantallas de varios sistemas de supervisión del desempeño de la red con grandes cantidades de información capturada localmente no permite por sí mismo una gestión eficaz de la red. 

En definitiva, la eficacia de la gestión de la red es posible a partir del concepto de NPMD junto con el análisis y la consolidación de los datos, con el fin de permitir ganancias significativas en la eficacia, tanto en el funcionamiento de la propia red, como en la notificación de fallos y tendencias, y también la formulación de diagnósticos y flujos de trabajo para la solución inmediata de cualquier problema que pueda surgir.

 

Por Cristiano Henrique Ferraz – CTO de Netcon Americas