Чем нужно будет заниматься:
Развитие подходов к мониторингу и инструментов
Подготовка мониторинга и алертинга по запросам от смежных команд
Подготовка описания по метрикам и дашбордов для команд разработки, тестирования, технической поддержки
Создание и развитие внутренних инструментов отдела мониторинга (боты\автоматизации\кастомные системы сбора метрик), кодовая база преимущественно на Python
Написание\поддержка актуальной документации по инструментам и решениям отдела мониторинга
Администрирование сервисов и инструментов в отдела
Оказание менторской поддержки 1-2 дежурному инженеру (после ИС).
Откликайся на вакансию, если у тебя есть
Работа должна быть в удовольствие, поэтому мы предлагаем
Преимущества работы в аккредитованной IT-компании
Стильное рабочее пространство рядом с м. Кутузовская
Возможность выбрать удаленку или офис, время начала работы
ДМС с первого рабочего дня для тебя и твоего питомца (ведь мы обожаем животных!)
Забота о психологическом здоровье и компенсация затрат на платформе «Ясно»
Полезные завтраки, фреши и перекусы в офисе каждый день
Занятия в офисном спортзале и компенсация твоих личных затрат на спорт
Оплата участия в конференциях, скидки на изучение английского, доступ к обучающим ресурсам
Личный Бадди для быстрой адаптации в первые месяцы работы
Вечеринки с артистами в офисе и проходки на их концерты!
Возможность слушать музыку на работе, потому что музыка и есть твоя работа
Опыт работы с системами мониторинга от 3-х лет
Понимание принципов построения систем мониторинга As-a-S
Знание особенностей архитектуры и взаимодействия компонентов мониторинга на базе TSDB Prometheus (thanos\victoria metrics), конфигурирования, написания кастомных экспортеров
Опыт работы с системами сбора, анализа и визуализации логов. Стеки могут быть разными, важно общее понимание интеграций и способность применить к большому спектру задач: Elasticsearch, Logstash, Fluentd, Rsyslog, Graylog, InfluxDB, Grafana, Kibana, EQL\KQL запросы
Знание и умение использования профильных команд для администрирования и конфигурирования ОС и прикладных приложений, умение использовать базовые команды\утилиты, написание sh скриптов
Умение работать с системами управления кодом (git), базовое понимание устройства ci\cd
Python - понимание принципов ООП, чтение кода, понимание устройства структуры и используемых технологий, функциональное программирование
Понимание микросервисной инфраструктуры, устройства и кластеризации.
Наш текущий стек технологий
Grafana (v9.*) + OnCall(wip)
Prometheus (HA, thanos operator)
AlertManager + Karma
BlackBox + UptimeKuma
Jaeger
ELK stack (opendistro)
Jira\Confluence
AirFlow
N8N