20 docs tagged with "infrastructure"

Analisi Log con Loki

Guida all'analisi dei log con Loki e Grafana Explore: query LogQL, filtri per servizio e tenant, correlazione richieste e retention policy.

Dashboard Grafana: Guida Completa

Guida completa alle dashboard Grafana di Impronto Enterprise: dashboard predefinite, custom Moleculer, query PromQL e creazione nuovi pannelli.

Disaster Recovery e Backup

Piano di disaster recovery e procedure di backup/restore per tutti i componenti della piattaforma Impronto Enterprise.

Guida allo Scaling della Piattaforma

Guida completa allo scaling orizzontale e verticale della piattaforma Impronto Enterprise: HPA, risorse, MongoDB, Redis e strategie per nodo.

Health Check e Probes: Architettura

Architettura del sistema di health check a 3 livelli per i microservizi Impronto Enterprise: startup, liveness, readiness, health.mixin.js e endpoint HTTP.

Manutenzione Database

Procedure di manutenzione per MongoDB Atlas, PostgreSQL DWH e Redis Cloud nella piattaforma Impronto Enterprise.

Ottimizzazione delle Prestazioni

Guida all'ottimizzazione delle prestazioni della piattaforma Impronto Enterprise: MongoDB, Redis, NATS, Moleculer e Node.js.

Runbook: Latenza Elevata delle Action

Procedura operativa per diagnosticare e risolvere latenza p99 superiore a 5 secondi nelle action Moleculer

Runbook: NATS Transporter Down

Procedura operativa per la gestione dell'interruzione del transporter NATS che blocca la comunicazione inter-servizio

Runbook: Pod in CrashLoopBackOff

Procedura operativa per diagnosticare e risolvere pod in stato CrashLoopBackOff nel namespace pos-enterprise

Runbook: Pod Not Ready

Procedura operativa per diagnosticare pod che non superano la readiness probe nel namespace pos-enterprise

Runbook: Pod OOM Killed

Procedura operativa per diagnosticare e risolvere pod terminati per Out Of Memory nel namespace pos-enterprise

Runbook: Tasso di Errore Elevato

Procedura operativa per diagnosticare e risolvere un tasso di errore superiore al 5% nei microservizi pos-enterprise

Runbook: Tutti i Gateway Pod Down

Procedura operativa per il ripristino completo dell'API Gateway quando tutti i pod sono non disponibili

Runbook: Utilizzo CPU Elevato

Procedura operativa per la gestione di pod con CPU throttling e consumo elevato nel namespace pos-enterprise

Runbook: Utilizzo Disco Elevato

Procedura operativa per la gestione di PersistentVolumeClaim con spazio disco in esaurimento nel namespace pos-enterprise

Runbook: Utilizzo Memoria Elevato

Procedura operativa per la gestione di pod con consumo di memoria elevato in avvicinamento al limite OOM

Sistema di Alerting: Configurazione e Gestione

Configurazione e gestione del sistema di alerting di Impronto Enterprise: Alertmanager, PrometheusRule, routing, silencing e integrazione con infrastructure-monitor.

Stack di Monitoring: Panoramica

Architettura completa dello stack di monitoring della piattaforma Impronto Enterprise: Prometheus, Grafana, Loki, Tempo, Alertmanager.

Troubleshooting Infrastrutturale

Catalogo dei problemi infrastrutturali comuni della piattaforma Impronto Enterprise con procedure diagnostiche e risoluzioni.