Site Reliability Engineer (m/f/n)
25 200 - 26 040 PLN/ mies.
MidFull-time
#326112·Dodano 19 dni temu·28
Źródło: ShimiTech Stack / Keywords
KubernetesCI/CDDataDogAzure DevOps
Firma i stanowisko
SHIMI Sp. z o.o.
Wymagania
- 5+ lat doświadczenia jako SRE / Production / Platform Engineer
- Realne doświadczenie w środowiskach produkcyjnych
- Bardzo dobra znajomość incident management i RCA
- Umiejętność budowania praktycznego, a nie teoretycznego monitoringu
- Azure DevOps – Boards, Repos, Pipelines
- Kubernetes – troubleshooting, scaling, operacje produkcyjne
- Datadog – metrics, logs, dashboardy, alerting
- Azure Portal – operacje środowiskowe i konfiguracja
- CI/CD – optymalizacja pipeline’ów, testy, quality gates
Nice to have:
- Grafana
Preferowane:
- Doświadczenie z AI / LLM pipelines i ich obserwowalnością
- Budowa multi-app monitoring platforms
- Praca w skalowanych środowiskach Kubernetes (AKS lub podobne)
Obowiązki
- Budowa i utrzymanie centralnego operacyjnego “control tower” dla aplikacji i pipeline’ów AI
- Projektowanie i wdrażanie monitoringu, alertów i dashboardów (sygnały, progi, routing, runbooki)
- Incident response: triage, koordynacja, root cause analysis, post-mortems i działania prewencyjne
- Standaryzacja telemetrii pipeline’ów (success/failure, latency, throughput, bottlenecks)
- Optymalizacja CI/CD – jakość releasów, testy automatyczne, reliability gates
- Współpraca z zespołami engineeringowymi w celu zmniejszenia liczby powtarzalnych incydentów
Oferta
- Forma współpracy: B2B
- Stawka: 150 - 155 PLN/H
- Tryb: 100% zdalny
SHIMI sp. z o.o.
55 aktywnych ofert