Что нужно делать:
Анализ и решение типовых и нетиповых технических проблем, установка обновлений;
Закрытие 1-2 линии технической поддержки;
Составление технической документации;
Разработка и внедрение инструментов автоматизации процессов развертывания и тестирования систем, проектов и окружений;
Участие в разработке технических решений для подключения новых сервисов и разработка предложений по оптимизации существующих;
Тесное взаимодействие с командами разработки, изучение жизненных циклов проектов и стеков технологий;
Консультации и помощь командам по практикам и инструментам DevOps и SRE.
Нужно иметь опыт:
Опыт работы на аналогичной позиции от 3-х лет;
Администрирования Linux-систем;
Знание и опыт применения SRE практик;
Знание Kubernetes и Swarm: Ожидается хорошее понимание и опыт работы с контейнеризацией при помощи Kubernetes и/или Docker Swarm. Кандидат должен быть способен эффективно управлять и масштабировать распределенными приложениями, используя эти технологии;
Опыт в программировании: Ищем кандидатов со знанием одного или нескольких языков программирования, таких как Python, Go, Java или других, а также с пониманием основных принципов разработки программного обеспечения. Опыт в разработке микросервисов будет преимуществом;
Желание развивать и применять практики DevOps: Мы ценим кандидатов, которые стремятся автоматизировать процессы разработки и доставки программного обеспечения, используя инструменты и практики DevOps. Опыт в использовании CI/CD инструментов, таких как Jenkins, GitLab CI или CircleCI, будет важным преимуществом;
Опыт в мониторинге: Кандидат должен иметь опыт работы с инструментами мониторинга и отладки, такими, как Prometheus, Grafana, ELK (Elasticsearch, Logstash, Kibana) и другими. Умение эффективно исследовать и устранять проблемы в производственных средах, а также настраивать оповещения и метрики, будет необходимо;
Проактивный поиск проблем: Мы ищем кандидатов, способных активно искать и находить уязвимости и проблемы в системе, обладающих аналитическим мышлением и умением предупреждать проблемы до их возникновения.
Основной технологический стек:
Maven/NPM
PostgreSQL
Elasticsearch
Camunda BPMN
Docker Swarm
Jenkins
Gitlab
Ansible
Kubernetes
Y
andex.Cloud
Jira
Confluence