Contract type: Permanent
Salary Commisurato all'esperienza
Workplace: Provincia di Monza e della Brianza, Italia, 2 gg smart working/settimana
Per Azienda multinazionale del settore retail - zona Milano Nord/Brianza stiamo cercando un* Site Reliability Engineer.
Responsabilità
La responsabilità principale del SRE sarà garantire l’affidabilità, la disponibilità, le prestazioni e la scalabilità dei servizi in produzione, bilanciando la velocità di sviluppo. Il ruolo introduce concetti ingegneristici nella gestione dell’infrastruttura e delle operazioni, adottando strumenti e pratiche tipiche dello sviluppo software come il versionamento, i test automatici e l’Infrastructure as Code (IaC)
Tra le attività che la persona dovrà seguire/coordinare ci sono:
- Raccogliere e analizzare log, metriche e tracce distribuite. Individuare anomalie, degradazioni di servizio e colli di bottiglia in tempo reale.
- Definire e monitorare indicatori come SLI SLO e SLA.
- Implementare strategie per aumentare l’affidabilità e la disponibilità dei servizi.
- Gestire gli incidenti, coordinare l’escalation e comunicare efficacemente durante la crisi.
- Effettuare deploy e gestire di servizi cloud (compute, storage, rete, IAM, sicurezza).
- Progettare sistemi resilienti e scalabili. Eseguire test di carico e tuning delle prestazioni. Gestire la crescita sostenibile dei servizi.
- Automatizzare pipeline di delivery. Utilizzare strategie di deploy progressive come canary release, blue/green deployment, e rollback automatici in caso di problemi.
- Definire e versionare l’infrastruttura tramite codice. Automatizzare la creazione e la gestione di ambienti complessi in modo dichiarativo.
Il profilo ideale ha le seguenti caratteristiche:
- Abilità comunicative eccellenti con gli stakeholder a tutti i livelli: revisione tra pari, comunicazione chiara ed efficace, reportistica per il livello C.
- Ben organizzato e pianificato
- Appassionato di innovazioni tecniche e apprendimento continuo.
Requisiti
- Almeno 2 anni di esperienza, in un ruolo analogo.
- Background in ambito DevOps.
- Conoscenza fluente dell'inglese, sia parlato che scritto (necessaria per collaborare con team tecnologici internazionali e rappresentanti di altri Paesi).
Ambiente tecnico
- Prometheus, Grafana, Datadog, Google Cloud Monitoring, Open-Telemetry
- Aws, Azure, Google cloud (richiesta conoscenza di almeno uno dei tre)
- Python, Bash, Go
- Flux CD, GitHub Actions
- Terraform, Ansible
- Vault, GCP Secret Manager
Cosa offriamo
- Team di progetto locale e condivisione con il network globale.
- Crescita delle competenze (diversità di progetti, linguaggi e tecnologie).
- Formazione interna ed esterna disponibile.
- Flessibilità dell'organizzazione lavorativa (2 giorni/settimana di smart working dopo il periodo di inserimento).
- Orario di lavoro flessibile.
- Piano di Azionariato Interno.
- Wellbeing benefits
Sede di Lavoro: Milano Nord/Brianza
#LI-Hybrid