Nous recherchons un SRE DevOps confirmé pour intervenir dans le cadre d’un projet technologique avancé autour de l’observabilité, de l’automatisation et de l’intelligence artificielle. La mission porte sur l’optimisation d’agents IA utilisés pour l’analyse des alertes et l’amélioration des processus de Root Cause Analysis.

Missions principales

  • Déployer, superviser et optimiser des agents IA dédiés à l’analyse des incidents et des alertes.
  • Garantir la fiabilité du système et maintenir un haut niveau d’observabilité sur les environnements de production.
  • Investiguer les incidents, analyser les alertes et améliorer les pipelines de Root Cause Analysis.
  • Automatiser et fiabiliser les environnements cloud, CI/CD et conteneurisés.
  • Mettre en place et exploiter les outils de monitoring, d’alerting et d’APM.
  • Collaborer avec les équipes techniques afin d’améliorer les runbooks, le troubleshooting et les workflows automatisés.

Profil recherché

  • Expérience confirmée en SRE / DevOps, avec une forte culture production, incident management et automatisation.
  • Très bonne maîtrise des environnements AWS, Kubernetes, Docker, Linux, CI/CD et outils d’automatisation.
  • Solide expertise en observabilité : Prometheus, Alertmanager, Grafana, Thanos, Elastic et outils APM.
  • Expérience avec les LLM, les agents IA, le RAG, l’orchestration d’agents et les workflows automatisés.
  • Connaissance appréciée de Strands Agents, AWS Bedrock, Knowledge Base, MCP, LangChain, LlamaIndex ou AutoGen.

Infos pratiques

Lieu : Paris centre
Langues : anglais obligatoire
Télétravail : 2 jours par semaine
Date de début: ASAP
Durée: 6 mois renouvelable
Format : mission freelance / prestation

Submit your application

Attach a CV file. Accepted file types are DOC, DOCX, PDF, HTML, and TXT.

We are uploading your application. It may take a few moments to read your resume. Please wait!