Отвечать за стабильность работы сервисов. У нас миллионы пользователей в МП и наша задача сделать так, чтобы они всегда могли воспользоваться сервисом без каких-либо проблем
Совместно с разработчиками построение отказоустойчивой инфраструктуры и архитектуры сервиса. Реализация HPA, VPA, кластеризация решений, резервирование компонент, проработка стратегий обработки отказов и т.д.
Управление CI/CD. Между кодом в репозитории и сервисом на проде должно быть максимум одно нажатие кнопки, а может и не быть совсем
Построение комплексной системы мониторинга сервиса. Мы стараемся делать наши сервисы так, чтобы ночью и спать спокойно, а в праздники и выходные отдыхать. Но для того чтобы быть уверенными, что у нас все хорошо нам нужен качественный мониторинг и алертинг
Технологическое развитие инфраструктуры проекта. Внедрение лучших практик и современных подходов в реализации DevOps проектов. Поиск и внедрение современных технологий в проект
Разбор ошибок, выявление проблем с производительностью, поиск причин возникновения сбоев и проработка мероприятий для их недопущения
Что от тебя нужно:
Желательно опыт работы в высоконагруженных проектах
Знание и понимание подходов к реализации инфраструктуры коммерческих проектов
Опыт работы с AWS или другими облачными провайдерами.
Понимание принципов IasC
Хороший опыт работы с Linux-системами
Базовый опыт работы с Kubernetes и миграции сервисов в него
Понимание принципов построение CI/CD
Умение траблшутинга проблемы
Умение взаимодействовать с отделами разработки и тестирования
Дополнительно:
знание Terraform
понимание как работает Helm и написание Helm chart
понимание в оптимизации, настройке и траблшутинге PostgreSQL
скриптовые языки для автоматизации DevOps задач
Что мы предлагаем:
Интересные задачи в крутом проекте
Современный офис в центре столицы, в 4-х минутах от м. Краснопресненская (можем рассмотреть варианты удаленного сотрудничества)