Analisi Log con Loki
Guida all'analisi dei log con Loki e Grafana Explore: query LogQL, filtri per servizio e tenant, correlazione richieste e retention policy.
Guida all'analisi dei log con Loki e Grafana Explore: query LogQL, filtri per servizio e tenant, correlazione richieste e retention policy.
Guida completa alle dashboard Grafana di Impronto Enterprise: dashboard predefinite, custom Moleculer, query PromQL e creazione nuovi pannelli.
Piano di disaster recovery e procedure di backup/restore per tutti i componenti della piattaforma Impronto Enterprise.
Guida completa allo scaling orizzontale e verticale della piattaforma Impronto Enterprise: HPA, risorse, MongoDB, Redis e strategie per nodo.
Architettura del sistema di health check a 3 livelli per i microservizi Impronto Enterprise: startup, liveness, readiness, health.mixin.js e endpoint HTTP.
Procedure di manutenzione per MongoDB Atlas, PostgreSQL DWH e Redis Cloud nella piattaforma Impronto Enterprise.
Guida all'ottimizzazione delle prestazioni della piattaforma Impronto Enterprise: MongoDB, Redis, NATS, Moleculer e Node.js.
Procedura operativa per diagnosticare e risolvere latenza p99 superiore a 5 secondi nelle action Moleculer
Procedura operativa per la gestione dell'interruzione del transporter NATS che blocca la comunicazione inter-servizio
Procedura operativa per diagnosticare e risolvere pod in stato CrashLoopBackOff nel namespace pos-enterprise
Procedura operativa per diagnosticare pod che non superano la readiness probe nel namespace pos-enterprise
Procedura operativa per diagnosticare e risolvere pod terminati per Out Of Memory nel namespace pos-enterprise
Procedura operativa per diagnosticare e risolvere un tasso di errore superiore al 5% nei microservizi pos-enterprise
Procedura operativa per il ripristino completo dell'API Gateway quando tutti i pod sono non disponibili
Procedura operativa per la gestione di pod con CPU throttling e consumo elevato nel namespace pos-enterprise
Procedura operativa per la gestione di PersistentVolumeClaim con spazio disco in esaurimento nel namespace pos-enterprise
Procedura operativa per la gestione di pod con consumo di memoria elevato in avvicinamento al limite OOM
Configurazione e gestione del sistema di alerting di Impronto Enterprise: Alertmanager, PrometheusRule, routing, silencing e integrazione con infrastructure-monitor.
Architettura completa dello stack di monitoring della piattaforma Impronto Enterprise: Prometheus, Grafana, Loki, Tempo, Alertmanager.
Catalogo dei problemi infrastrutturali comuni della piattaforma Impronto Enterprise con procedure diagnostiche e risoluzioni.