Skilleto

Site Reliability Engineer ⚙️

ApiTree s.r.o.

Site Reliability Engineer (SRE)

Požadované znalosti/dovednosti

začátečník
pokročilý
expert

Jazykové požadavky

začátečník
pokročilý
expert

Angličtina (B2)

V ApiTree se zaměřujeme na vývoj aplikací na míru, konzultace a rádi sdílíme své zkušenosti. 🤝 Naší silnou stránkou je samostatnost, smysl pro detail, a hluboké technické know-how. Máme roky praxe s robustními systémy v bankovnictví, pojišťovnictví, energetice, telekomunikacích, ale i v dalších odvětví.

Pro revoluční startup se sídlem v New Yorku a Tel Avivu hledáme Site Reliability Engineera, který bude pomáhat při vývoji průkopnické interní platformy pro správu talentů, která změnila HR tech průmysl a nyní pomáhá některým z největších a nejvíce inovativních společností na světě stát se připravenými na budoucnost.

Klíčové odpovědnosti:

Řízení incidentů:

Vedení řízení incidentů od jejich zjištění až po vyřešení, zajištění včasné komunikace a minimalizace dopadu na zákazníky.
Koordinace spolupráce s pohotovostními týmy (DevOps a R&D) při řešení kritických problémů a poskytování rychlých řešení.
Působení jako manažer incidentů během velkých událostí, poskytování aktualizací a zajištění dodržování zavedených protokolů pro řízení incidentů.

Root Cause Analýza

Provádění analýzy (RCA) po incidentech a vytváření zpráv s doporučeními pro zlepšení.

Monitoring a upozorňování:

Zlepšování a údržba systémů pro monitoring a upozorňování v reálném čase, aby bylo možné včas odhalit problémy na platformách.
Spolupráce s vývojovými a DevOps týmy na zlepšení viditelnosti systémů a zvýšení přehlednosti.

Automatizace:

Identifikace opakujících se úkolů v procesu řízení incidentů a jejich automatizace pro snížení manuálního zásahu a zkrácení doby odezvy.
Implementace nástrojů a procesů pro zlepšení odolnosti systému a snížení četnosti incidentů.

Kvalifikace:

Prokazatelné zkušenosti v oblasti Site Reliability Engineering nebo podobné roli se zaměřením na řízení incidentů.
Silné porozumění protokolům pro reakci na incidenty, analýze kořenových příčin a procesům po incidentu.
Zkušenosti s nástroji pro monitorování a upozorňování, jako jsou Prometheus, Grafana, Coralogix nebo jejich ekvivalenty.
Znalost správy cloudů (výhodou je AWS) a hluboké porozumění praktikám škálování a spolehlivosti.
Znalost CI/CD pipeline a nástrojů pro automatizaci (např. Jenkins, Terraform, Github Actions).
Silné komunikační dovednosti, schopnost jasně formulovat technické problémy jak technickým, tak netechnickým zainteresovaným stranám.
Zkušenosti s prací v pohotovostním režimu a vedením zásahů při incidentech.
Výborná angličtina, schopnost plynulé komunikace s kolegy v zahraničí.

Proč právě ApiTree?

Přidej se k nám a pracuj v parádní kanceláři přímo v srdci Prahy, na Náměstí Míru ⛪️
Užij si flexibilní pracovní dobu – přizpůsobíme se, ať už vstáváš za svítání 🌤️ nebo ponocuješ 🌙
V našem týmu vládne přátelská atmosféra – vítáni jsou i pejsci 🐾
Čekají tě teambuildingy, společné akce mimo kancelář, ale i nejrůznější školení a přednášky
A samozřejmě, nikdy ti nebude chybět šálek skvělé kávy ☕ nebo vychlazené limči 🍹
Multisportka není problém 🏋️

Zaujalo tě to? Neváhej nás kontaktovat!👋

Kateřina, ApiTree

Informace o pozici

Skilleto score
Přihlaste se pro zobrazení
Typ úvazku
Kontrakt na plný úvazekCZK 173,600 - CZK 217,000 za měsíc
(CZK 8,000 - CZK 10,000 za den)
Je lepší HPP nebo OSVČ?Porovnejte obě varianty na Countly.cz
Vhodné pro
Mediorní uchazeče, Seniorní uchazeče
Předpokládaná alokace
Na dobu neurčitou
Lokalita
Česká republika
Homeoffice
až 3 dny v týdnu
Práce plně na dálku
není možná
Typ společnosti
Přímý zaměstnavatel
Velikost firmy
menší firma (do 50 zaměstnanců)
Zveřejněno
13.02.2025 08:27

Site Reliability Engineer ⚙️

Požadované znalosti/dovednosti

Jazykové požadavky

Klíčové odpovědnosti:

Kvalifikace:

Informace o pozici

Skilleto score

Typ úvazku

Vhodné pro

Předpokládaná alokace

Lokalita

Homeoffice

Práce plně na dálku

Typ společnosti

Velikost firmy

Zveřejněno