[TP] Práctica - Análisis avanzado con Grail, DQL y Entity Selectors


En esta práctica, haremos un repaso sobre Grail, explotaremos los Entity Selectors en consultas DQL y exportaremos todo a un panel de control y a un notebook.

Lo que vas a aprender en este TP :
  • Comprender el papel de Grail
  • Aplicar las buenas prácticas de DQL

Repaso sobre Grail y DQL


Lo que vas a aprender en esta sección :
  • Comprender el papel de Grail
  • Aplicar las buenas prácticas de DQL

Antes de comenzar, hagamos un repaso sobre Grail y las buenas prácticas para construir sus consultas DQL.
  1. ¿Qué es Grail?
    Grail es el data lakehouse de Dynatrace. A diferencia de las bases de datos tradicionales, Grail está diseñado específicamente para la observabilidad. Almacena logs, métricas, trazas y eventos comerciales (bizevents) de manera unificada, sin requerir esquemas estrictos ni indexación previa (schema-on-read). Esto permite consultar datos masivamente con el contexto topológico (Smartscape) siempre conservado.
  2. Buenas prácticas para las consultas DQL
    Para escribir consultas eficientes en DQL (Dynatrace Query Language), debe seguir algunas reglas de oro:
    • Filtrar temprano: Utilice el comando filter lo antes posible en su consulta para reducir el volumen de datos a procesar en las canalizaciones posteriores.
    • Selectividad temporal: Limite siempre el rango de tiempo de su búsqueda (directamente a través del selector de tiempo o en la consulta).
    • Aprovechar los Entity Selectors: Utilice la función entitySelector() para beneficiarse del contexto dinámico en lugar de buscar ID estáticos fijos.
    • Usar limit(): Al escribir y probar, termine sus consultas con limit 10 para acelerar los tiempos de respuesta.

Creación de consultas DQL

Va a crear 5 consultas DQL que aprovechan la función `entitySelector()` para apuntar dinámicamente a sus entidades.
  1. Consulta 1: Logs de los hosts en producción
    Escriba una consulta DQL para recuperar los logs únicamente de los hosts que llevan la etiqueta 'ENV:PROD'. Debe utilizar un Entity Selector.
  2. Consulta 2: Eventos vinculados a servicios Java
    Escriba una consulta para listar y contar los eventos recientes relacionados con los servicios que ejecutan la tecnología 'Java'.
  3. Consulta 3: Uso de CPU a través de Timeseries
    Grail también permite consultar métricas. Muestre el uso promedio de CPU (métrica `builtin:host.cpu.usage`) para todos los hosts que pertenecen a una Management Zone llamada 'MZ_Finance'.
  4. Consulta 4: Búsqueda de errores de un equipo específico
    Recupere los logs que contienen la palabra 'error' para los grupos de procesos (PROCESS_GROUP) que son propiedad del equipo backend (etiqueta 'owner:backend').
  5. Consulta 5: Eventos comerciales (Bizevents) por aplicación
    Recupere los últimos eventos comerciales (bizevents) generados, pero limite esta búsqueda solo a las aplicaciones monitoreadas de tipo APPLICATION (Web o Móvil).

Exportación a Notebook y Panel de control

El objetivo aquí es guardar, documentar y visualizar el resultado de sus consultas para sus equipos.
  1. Creación del Notebook
    Ejecute sus consultas DQL en la aplicación Notebooks. Diseñe su documento y guárdelo respetando el estándar de nomenclatura: `formation-` (por ejemplo: `formation-martin`).
  2. Fijar en un Dashboard
    Cree un nuevo panel de control llamado `formation-`. Fije al menos 3 de sus resultados DQL en este panel de control.

Nivel de dificultad: (3/5)

Articles recommandés

Grafana Alloy: Perfilado Continuo con Pyroscope

Descubra cómo configurar el perfilado continuo (Continuous Profiling) en sus ...

Glossaire de la formation

Observabilidad

La capacidad de conocer el estado interno de un sistema a partir de los datos que emite.Estos datos se clasifican en 3 pilares: logs (registros)métric...

CI/CD

Integración Continua y Despliegue Continuo. Prácticas DevOps destinadas a automatizar las pruebas y el despliegue de aplicaciones para entregar de for...

Dynatrace

Plataforma de observabilidad completa basada en inteligencia artificial (Davis), que ofrece monitorización de aplicaciones (APM), infraestructura y ex...

APM (Application Performance Monitoring)

Monitorización del rendimiento de aplicaciones para identificar, diagnosticar y resolver problemas complejos relacionados con el rendimiento y la disp...

SLA (Service Level Agreement)

Contrato oficial concluido entre un proveedor de servicios y su cliente, definiendo el nivel de servicio esperado (disponibilidad, tiempo de respuesta...

SLO (Service Level Objective)

Objetivo interno cuantificado definido por el equipo técnico (SRE) sobre el nivel de fiabilidad de un servicio (ej: 99.9% de disponibilidad). Relación...

SLI (Service Level Indicator)

Métrica cuantitativa real que mide el nivel de servicio proporcionado en producción (ej: tasa de éxito de solicitudes, latencia media). Relación: El S...

DEM (Digital Experience Monitoring)

Monitorización de la Experiencia Digital. Engloba las tecnologías que permiten rastrear y optimizar la experiencia de los usuarios finales en las apli...

RUM (Real User Monitoring)

Monitorización de Usuarios Reales. Técnica de observabilidad pasiva que captura y analiza cada interacción de los usuarios con una aplicación web o mó...

Synthetic Monitoring

Monitorización Sintética. Técnica de observabilidad activa que utiliza scripts automatizados (bots) para simular el recorrido de los usuarios y verifi...

Trazas distribuidas

Técnica (proveniente del pilar de Trazas) que permite seguir el recorrido completo de una solicitud a través de múltiples microservicios para identifi...

Métricas

Medidas numéricas recopiladas a intervalos regulares (ej: CPU, RAM, tiempo de respuesta) utilizadas para evaluar el estado de salud general de un sist...

AIOps (Artificial Intelligence for IT Operations)

Uso de la inteligencia artificial y el aprendizaje automático para automatizar y mejorar las operaciones informáticas (ej: detección de anomalías, red...

OpenTelemetry

Framework de código abierto que proporciona estándares, APIs y SDKs para recopilar y exportar datos de observabilidad (trazas, métricas, logs) de mane...