infra.conf'26
со смыслом. Всё про создание
и эксплуатацию высоконагруженных
систем и инфраструктуры
офлайн и онлайн

4 июня уже в третий раз встречаемся на конференции от Yandex Infrastructure. В этом году мы обсудим темы, которые касаются инфраструктуры и высоких нагрузок, инструменты разработки и практики управления разработкой, базы данных и стораджи, принципы и практики обеспечения надёжности и доступности, управление инцидентами и многое другое. А также поговорим про построение и особенности эксплуатации инфраструктуры в эпоху ML. Регистрация уже открыта — оставляйте заявку на удобный формат участия: лично в Москве и онлайн.
Предыдущие конференции
infra.conf 2024
Ключевые темы этого года
- Эффективность обучения и инференса моделей
- Эффективность LLM. Новые архитектуры, фреймворки, RL, параллелизм, инференс и т.д.
- ML-платформы и тулинг для ML-команд
- Агентская инфраструктура
- Системы и подходы к менеджменту GPU-кластеров
- Инфраструктура подготовки данных
- Архитектура больших стораджей: хранение данных, адаптация для обучения моделей
- Масштабирование: шардирование и автошардирование, инструменты шардирования реляционных СУБД, мультирегиональное развёртывание
- Надёжность хранения: распределённые транзакции, восстановление и самовосстановление, резервное копирование
- Оптимизация под железо: утилизация дисков, CPU и сети в СУБД, GPU для обработки запросов
- Индексы: «деревья», индексы, векторный поиск, полнотекстовый поиск в СУБД
- Выполнение SQL: движки, реализация операторов SQL, оптимизаторы запросов, адаптивная оптимизация
- Тестирование надёжности и производительности: катастрофоустойчивость, бенчмарки
- DBA и autotune: оптимизация, использование инструментов автонастройки, LLM-ассистенты для DBA
- СУБД для аналитики: колоночное хранение и выполнение, массивно-параллельное выполнение запросов
- Data Lake: ETL/ELT, Data Catalog, Data Lineage
- Потоковая обработка данных: очереди, системы стриминга
Практики управления разработкой:
- Локальная разработка — контейнеризация (Docker, Podman), мини‑кластеры (Kind, Minikube), локальные базы данных
- CI/CD — конвейеры, параллелизация тестов, артефакторные хранилища, деплой в Kubernetes отладка и профилирование — распределённая трассировка, анализ памяти/CPU, логирование в микросервисах
- Code collaboration — Git-флоу, review-инструменты, хуки pre-commit, генерация документации
- Платформенные решения (Internal Developer Platform, IDP) — самообслуживание, стандартизация конфигураций, абстракции над инфраструктурой
Комплексный подход к пониманию состояния системы через логи, метрики, трейсы и события:
- Сбор и агрегация данных — OpenTelemetry, Prometheus, ELK, OpenSearch, векторные агрегаторы (Vector, Fluent Bit)
- Корреляция сигналов — связывание логов, метрик и трейсов для диагностики инцидентов
- Алерты и SLO/SLI — пороги, шумоподавление, инцидент‑менеджмент, постмортемы
- Распределённая трассировка — контекст запросов, анализ задержек, выявление узких мест
- Observability для Kubernetes — мониторинг подов, узлов, сетевых политик, storage‑классов
Принципы и практики обеспечения надёжности и доступности, автоматизация, управление инцидентами:
- SLO/SLA/SLI — определение метрик, бюджеты ошибок, компромисс между новизной и стабильностью
- Планирование ёмкости — нагрузка, пики, автоскейлинг, резервирование ресурсов
- Инциденты и восстановление — playbooks, war rooms, постмортем‑анализ, Blameless Culture
- Автоматизация рутины, самовосстановление систем, Chaos Engineering
Технологии и практики управления сетевым трафиком в распределённых системах — от базовой балансировки до интеллектуальной маршрутизации на уровне приложений (L7):
- Архитектура Service Mesh — принцип Sidecar Proxy, разделение ответственности, интеграция с Kubernetes
- Управление трафиком на L7 — маршрутизация, канареечные развёртывания (canary) и A/B‑тестирование, балансировка нагрузки, тайм-ауты, Retry, Circuit Breaker, Rate Limiting
- Наблюдаемость на уровне L7 — сбор метрик, распределённая трассировка, логирование
- Эксплуатация и масштабирование — нагрузка на прокси, мультикластерные и мультиоблачные сценарии, миграция
Программный комитет
CPO YDB- Директор по технологиям, Yandex Cloud
Руководитель Deploy Platfrom, Yandex Infrastructure- CPO Object Storage, Yandex Infrastructure
- ML Lead, Yandex Infrastructure
- Руководитель Internal Developer Platform, Yandex Infrastructure
Ведущий технический менеджер проектов, Yandex Infrastructure
Руководитель подразделения Cloud Network Infrastructure, Yandex Infrastructure- Руководитель службы инструментов репозитория, Yandex Infrastructure
Руководитель подразделения Hardware, Yandex Infrastructure- Руководитель подразделения Yandex Global Network, Yandex Infrastructure
- Руководитель службы разработки динамических таблиц, Yandex Infrastructure
- Руководитель группы разработки сетевой инфраструктуры и мониторинга, Yandex Infrastructure
Технический менеджер продукта, Yandex Infrastructure
Координатор
- Почта: galkinaal@yandex-team.ru
- Telegram: @nu_saash
Программа формируется. А пока предлагаем посмотреть доклады с infra.conf 2025 и подписаться на наш Telegram-канал, чтобы не пропустить важные новости и анонсы.