infra.conf'26

Инженерные истории
со смыслом. Всё про создание
и эксплуатацию высоконагруженных
систем и инфраструктуры
4 июня 2026
Москва, TAU,
офлайн и онлайн
Зарегистрироваться
Приём докладов окончен

4 июня уже в третий раз встречаемся на конференции от Yandex Infrastructure. В этом году мы обсудим темы, которые касаются инфраструктуры и высоких нагрузок, инструменты разработки и практики управления разработкой, базы данных и стораджи, принципы и практики обеспечения надёжности и доступности, управление инцидентами и многое другое. А также поговорим про построение и особенности эксплуатации инфраструктуры в эпоху ML. Регистрация уже открыта — оставляйте заявку на удобный формат участия: лично в Москве и онлайн.

Предыдущие конференции

Ключевые темы этого года

  • Эффективность обучения и инференса моделей
  • Эффективность LLM. Новые архитектуры, фреймворки, RL, параллелизм, инференс и т.д.
  • ML-платформы и тулинг для ML-команд
  • Агентская инфраструктура
  • Системы и подходы к менеджменту GPU-кластеров
  • Инфраструктура подготовки данных
  • Архитектура больших стораджей: хранение данных, адаптация для обучения моделей
  • Масштабирование: шардирование и автошардирование, инструменты шардирования реляционных СУБД, мультирегиональное развёртывание
  • Надёжность хранения: распределённые транзакции, восстановление и самовосстановление, резервное копирование
  • Оптимизация под железо: утилизация дисков, CPU и сети в СУБД, GPU для обработки запросов
  • Индексы: «деревья», индексы, векторный поиск, полнотекстовый поиск в СУБД
  • Выполнение SQL: движки, реализация операторов SQL, оптимизаторы запросов, адаптивная оптимизация
  • Тестирование надёжности и производительности: катастрофоустойчивость, бенчмарки
  • DBA и autotune: оптимизация, использование инструментов автонастройки, LLM-ассистенты для DBA
  • СУБД для аналитики: колоночное хранение и выполнение, массивно-параллельное выполнение запросов
  • Data Lake: ETL/ELT, Data Catalog, Data Lineage
  • Потоковая обработка данных: очереди, системы стриминга

Практики управления разработкой:

  • Локальная разработка — контейнеризация (Docker, Podman), мини‑кластеры (Kind, Minikube), локальные базы данных
  • CI/CD — конвейеры, параллелизация тестов, артефакторные хранилища, деплой в Kubernetes отладка и профилирование — распределённая трассировка, анализ памяти/CPU, логирование в микросервисах
  • Code collaboration — Git-флоу, review-инструменты, хуки pre-commit, генерация документации
  • Платформенные решения (Internal Developer Platform, IDP) — самообслуживание, стандартизация конфигураций, абстракции над инфраструктурой

Комплексный подход к пониманию состояния системы через логи, метрики, трейсы и события:

  • Сбор и агрегация данных — OpenTelemetry, Prometheus, ELK, OpenSearch, векторные агрегаторы (Vector, Fluent Bit)
  • Корреляция сигналов — связывание логов, метрик и трейсов для диагностики инцидентов
  • Алерты и SLO/SLI — пороги, шумоподавление, инцидент‑менеджмент, постмортемы
  • Распределённая трассировка — контекст запросов, анализ задержек, выявление узких мест
  • Observability для Kubernetes — мониторинг подов, узлов, сетевых политик, storage‑классов

Принципы и практики обеспечения надёжности и доступности, автоматизация, управление инцидентами:

  • SLO/SLA/SLI — определение метрик, бюджеты ошибок, компромисс между новизной и стабильностью
  • Планирование ёмкости — нагрузка, пики, автоскейлинг, резервирование ресурсов
  • Инциденты и восстановление — playbooks, war rooms, постмортем‑анализ, Blameless Culture
  • Автоматизация рутины, самовосстановление систем, Chaos Engineering

Технологии и практики управления сетевым трафиком в распределённых системах — от базовой балансировки до интеллектуальной маршрутизации на уровне приложений (L7):

  • Архитектура Service Mesh — принцип Sidecar Proxy, разделение ответственности, интеграция с Kubernetes
  • Управление трафиком на L7 — маршрутизация, канареечные развёртывания (canary) и A/B‑тестирование, балансировка нагрузки, тайм-ауты, Retry, Circuit Breaker, Rate Limiting
  • Наблюдаемость на уровне L7 — сбор метрик, распределённая трассировка, логирование
  • Эксплуатация и масштабирование — нагрузка на прокси, мультикластерные и мультиоблачные сценарии, миграция

Программный комитет

Программу конференции готовят ключевые инженеры, разработчики и руководители разных команд Яндекса, большинство из них — с опытом в индустрии более 15 лет.
  • Олег Бондарь
    CPO YDB
  • Иван Пузыревский
    Директор по технологиям, Yandex Cloud
  • Николай Пирогов
    Руководитель Deploy Platfrom, Yandex Infrastructure
  • Михаил Костин
    CPO Object Storage, Yandex Infrastructure
  • Аркадий Альшан
    ML Lead, Yandex Infrastructure
  • Александр Кошелев
    Руководитель Internal Developer Platform, Yandex Infrastructure
  • Евгений Антонов
    Ведущий технический менеджер проектов, Yandex Infrastructure
  • Марат Сибгатулин
    Руководитель подразделения Cloud Network Infrastructure, Yandex Infrastructure
  • Тимур Торубаров
    Руководитель службы инструментов репозитория, Yandex Infrastructure
  • Антон Кортунов
    Руководитель подразделения Hardware, Yandex Infrastructure
  • Андрей Глазков
    Руководитель подразделения Yandex Global Network, Yandex Infrastructure
  • Руслан Савченко
    Руководитель службы разработки динамических таблиц, Yandex Infrastructure
  • Кирилл Глушенков
    Руководитель группы разработки сетевой инфраструктуры и мониторинга, Yandex Infrastructure
  • Ильдар Каримов
    Технический менеджер продукта, Yandex Infrastructure

Координатор

Саша Галкина
DevRel Yandex Infrastructure

Программа формируется. А пока предлагаем посмотреть доклады с infra.conf 2025 и подписаться на наш Telegram-канал, чтобы не пропустить важные новости и анонсы.

Видеоотчёт с infra.conf’25