Site Reliability Engineer (m/f/n)

25 200 - 26 040 PLN/ mies.
MidFull-time
#326112·Dodano 19 dni temu·28
Źródło: Shimi
Aplikuj teraz

Tech Stack / Keywords

KubernetesCI/CDDataDogAzure DevOps

Firma i stanowisko

SHIMI Sp. z o.o.


Wymagania

  • 5+ lat doświadczenia jako SRE / Production / Platform Engineer
  • Realne doświadczenie w środowiskach produkcyjnych
  • Bardzo dobra znajomość incident management i RCA
  • Umiejętność budowania praktycznego, a nie teoretycznego monitoringu
  • Azure DevOps – Boards, Repos, Pipelines
  • Kubernetes – troubleshooting, scaling, operacje produkcyjne
  • Datadog – metrics, logs, dashboardy, alerting
  • Azure Portal – operacje środowiskowe i konfiguracja
  • CI/CD – optymalizacja pipeline’ów, testy, quality gates

Nice to have:

  • Grafana

Preferowane:

  • Doświadczenie z AI / LLM pipelines i ich obserwowalnością
  • Budowa multi-app monitoring platforms
  • Praca w skalowanych środowiskach Kubernetes (AKS lub podobne)

Obowiązki

  • Budowa i utrzymanie centralnego operacyjnego “control tower” dla aplikacji i pipeline’ów AI
  • Projektowanie i wdrażanie monitoringu, alertów i dashboardów (sygnały, progi, routing, runbooki)
  • Incident response: triage, koordynacja, root cause analysis, post-mortems i działania prewencyjne
  • Standaryzacja telemetrii pipeline’ów (success/failure, latency, throughput, bottlenecks)
  • Optymalizacja CI/CD – jakość releasów, testy automatyczne, reliability gates
  • Współpraca z zespołami engineeringowymi w celu zmniejszenia liczby powtarzalnych incydentów

Oferta

  • Forma współpracy: B2B
  • Stawka: 150 - 155 PLN/H
  • Tryb: 100% zdalny
SHIMI sp. z o.o.

SHIMI sp. z o.o.

55 aktywnych ofert

Zobacz wszystkie oferty
Aplikuj teraz