SRE Week
Школы анализа данных
Открытый онлайн-интенсив от ШАДа и Яндекса. Эксперты поделятся опытом работы с большими нагруженными системами и покажут, как действовать в аварийных ситуациях.
Интенсив завершён, но все лекции ждут вас на YouTube‑канале Яндекс Образования!
Поговорим о работе с высоконагруженными сервисами
Для кого
Интенсив подойдёт разработчикам и студентам вузов, которые умеют программировать и интересуются SRE (Site Reliability Engineering).
Что узнают участники
•Чем на практике занимаются SRE-инженеры и почему уметь писать код — это правда важно.
•Как ломаются большие системы и как их траблшутить.
•Как диагностировать поломки на одной машине и в распределённой системе.
•Зачем нужны дежурства и что делать сразу после аварии.
Как всё устроено
•Все занятия проходят в предзаписи на YouTube. Во время трансляции под видео можно задавать вопросы.
•Трансляции можно смотреть и без прохождения отбора, но для получения сертификата нужно выполнить отборочные задания и итоговую работу.
•Отбор на определение базовых навыков пройдёт в Яндекс Контесте и займёт около часа.
•Если вы прошли отбор, на почту придёт доступ к итоговому заданию.
Этапы интенсива
Регистрация на интенсив
3 июня — 16 июня
Прохождение отбора на Яндекс Контесте
3 июня — 22 июня
Лекции и заключительный семинар
17 июня — 22 июня
Доступ к итоговой работе — для тех, кто прошёл отбор
19 июня — 3 июля
Выдача сертификатов
3 июля — 10 июля
Что в программе
На интенсиве вы изучите часть того, что проходят студенты ШАДа на семестровом курсе по инфраструктуре больших данных. Лекции длятся от 1 до 3-х часов, семинары идут по 30 минут.
Введение. Как ломаются большие системы. Разбираем статистику поломок сервисов
•руководитель службы разработки динамических таблиц YTsaurus
Характеристики аппаратного обеспечения: CPU, память, диски и сеть
•руководитель службы разработки динамических таблиц YTsaurus
Обзор утилит диагностики в командной строке Linux
•руководитель службы разработки динамических таблиц YTsaurus
Распределённые системы и observability. Инфраструктурные компоненты и средства диагностики распределённых систем
•руководитель службы разработки динамических таблиц YTsaurus
Практика работы SRE. Чем приходится заниматься руками: SLO, capacity planning, алерты, дежурства, incident management, postmortem actions
•руководитель службы разработки динамических таблиц YTsaurus
Семинары
Настройка параметров ядра Linux
•DevOps-инженер по высоконагруженной доставке сетевого трафика до сервисов Яндекса
Performance troubleshooting на практике
•руководитель группы системной разработки внутреннего Облака
Остались вопросы?
мы обязательно ответим!