SRE Week

Школы анализа данных

  • Открытый онлайн-интенсив от ШАДа и Яндекса. Эксперты поделятся опытом работы с большими нагруженными системами и покажут, как действовать в аварийных ситуациях.

  • Интенсив завершён, но все лекции ждут вас на YouTube‑канале Яндекс Образования!

Поговорим о работе с высоконагруженными сервисами

  • Для кого

    Интенсив подойдёт разработчикам и студентам вузов, которые умеют программировать и интересуются SRE (Site Reliability Engineering).

     

     

  • Что узнают участники

    • Чем на практике занимаются SRE-инженеры и почему уметь писать код — это правда важно.
    •  

    • Как ломаются большие системы и как их траблшутить.
    •  

    • Как диагностировать поломки на одной машине и в распределённой системе.
    •  

    • Зачем нужны дежурства и что делать сразу после аварии.

     

     

Что в  программе

На интенсиве вы изучите часть того, что проходят студенты ШАДа на семестровом курсе по инфраструктуре больших данных. Лекции длятся от 1 до 3-х часов, семинары идут по 30 минут.

17.06

Введение. Как ломаются большие системы. Разбираем статистику поломок сервисов

Руслан Савченко

руководитель службы разработки динамических таблиц YTsaurus

18.06

Характеристики аппаратного обеспечения: CPU, память, диски и сеть

Руслан Савченко

руководитель службы разработки динамических таблиц YTsaurus

19.06

Обзор утилит диагностики в командной строке Linux

Руслан Савченко

руководитель службы разработки динамических таблиц YTsaurus

20.06

Распределённые системы и observability. Инфраструктурные компоненты и средства диагностики распределённых систем

Руслан Савченко

руководитель службы разработки динамических таблиц YTsaurus

21.06

Практика работы SRE. Чем приходится заниматься руками: SLO, capacity planning, алерты, дежурства, incident management, postmortem actions

Руслан Савченко

руководитель службы разработки динамических таблиц YTsaurus

22.06

Семинары

Настройка параметров ядра Linux

Александр Костриков

DevOps-инженер по высоконагруженной доставке сетевого трафика до сервисов Яндекса

Performance troubleshooting на практике

Антон Суворов

руководитель группы системной разработки внутреннего Облака

FAQ

Остались вопросы?

Напишите нам,

мы обязательно ответим!