О заказчике
Компания, предоставляющая услуги дата-центра: хостинг, IaaS, colocation и сопутствующие сервисы.
Для одного из крупных конечных клиентов возникла необходимость перейти на более современное и надёжное решение с поддержкой гибридной модели
(часть ресурсов в публичном облаке, часть — on-premise).
Исходная ситуация
На момент обращения у клиента был развёрнут кластер на базе Cisco HyperFlex, который имел критичные недостатки:
1. Перестал поддерживаться вендором;
2. Ограничивал возможности по расширению и обновлению;
3. Имел растущие риски по стабильности системы;
4. Требовал всё больших усилий на поддержку.
Старая система не позволяла перейти на актуальные версии VMware vSphere, а также испытывала дефицит по ресурсам хранения.
У клиента возникли регулярные сложности с надёжностью, а обслуживание инфраструктуры занимало всё больше времени и затрат.
Компания понимала, что система «доживает последние годы» и давно планировала переход на новое решение, но из-за внешних обстоятельств проект откладывался.
Осенью 2024 года, когда ситуация стала критической, было принято решение о модернизации.
Цели и задачи
Перед командами Tela и заказчика стояли следующие задачи:
- Заменить устаревший кластер на современное и поддерживаемое решение;
- Обеспечить отказоустойчивость и высокую доступность сервисов;
- Повысить производительность и масштабируемость;
- Интегрировать инфраструктуру в гибридную модель: публичное облако ↔ on-premise;
- Упростить администрирование и мониторинг;
- Внедрить разделение прав доступа между заказчиком, подрядчиком и конечным клиентом.
- руководитель проекта
- архитектор по инфраструктурным системам
- инженер по инфраструктурным системам
- координатор проекта
- архитектор решений
- команда инженеров ЦОД
- архитектор по облачным системам
- сетевой архитектор
Решение. Архитектура и компоненты
Чтобы закрыть задачи клиента, мы разработали и развернули новую кластерную инфраструктуру, которая сочетает в себе простоту эксплуатации, гибкость и отказоустойчивость.
Что вошло в новую инфраструктуру:
01 - Серверы и база кластера.В качестве узлов кластера использованы Huawei FusionServer 2288H V5 (форм-фактор 2U). Такое решение обладает следующими преимуществами:
-
Каждый сервер выполняет сразу две роли: хранение данных и вычисления.
-
Можно отказаться от отдельной СХД, тк. нагрузка распределяется по всем узлам.
02 - Виртуализация и управление. В основе системы развёрнута платформа виртуализации VMware vSphere (актуальная версия), которая обладает следующими преимуществами:
-
Нативная интеграция: мониторинг, аналитика и управление доступны «из коробки», без дополнительных инструментов.
-
Возможность назначать разные политики хранения для каждой виртуальной машины:
- для критичных сервисов - выдерживание отказа от 3-х узлов
- для некритичных сервисов - экономичный профиль
03 - Гибридное облако. Установлен VMware vCloud Director, как коннектор между публичным облаком заказчика и локальной инфраструктурой (on-prem) конечного клиента.
Теперь заказчик может:
-
Разворачивать тестовые среды в облаке и платить только за фактическое использование;
-
Переносить постоянные сервисы на локальные мощности для экономии;
-
Легко «перекидывать» нагрузку между облаком и on-premise при изменении потребностей.
04 - Сеть и безопасность. Используется L2/L3 сетевой контур дата-центра заказчика; в ходе проекта выполнено разделение трафика согласно зонам ответственности.
В процессе проекта мы настроили дополнительные ключи доступа и разграничили роли:
- часть прав у подрядчика (Tela)
-
часть - у провайдера
-
часть - у конечного заказчика.
05 - Масштабирование.
-
Архитектура позволяет линейно увеличивать производительность и объём хранения, достаточно добавить новые серверы.
-
Нет привязки к конкретному вендору (отсутствие vendor lock-in), можно расширять кластер за счёт других x86-серверов.
СХЕМА КЛАСТЕРА
На картинке ниже представлена разработанная схема нового кластера:
Тайминг проекта
Осень 2024 - Подготовка/проектирование; фиксация ограничений старой платформы.
Декабрь 2024 - Поставка оборудования.
Январь-февраль 2025 - Развёртывание, базовая настройка, тесты.
Весна 2025 - Исполнение доп. требований по безопасности, разделению прав и трафика; настройка vCloud Director.
Июль 2025 - Завершение тестирования и ввод в эксплуатацию.
Результаты проекта
Итоговая архитектура представляет собой кластер из четырёх узлов ESXi с двумя дисковыми группами на каждом и изолированными сетями для управления, миграции и vSAN-трафика.
→ 0% незапланированных простоев за 6 месяцев эксплуатации;
→ Снижение обращений в техподдержку за счёт стабильности и упрощённого администрирования (по сравнению с прежней системой);
→ Повышение производительности и устойчивости инфраструктуры;
→ Возможность линейного масштабирования за счёт добавления новых серверов без существенных затрат;
→ Экономия времени и ресурсов за счёт упрощённого управления: мониторинг и аналитика доступны «из коробки» в рамках VMware;
→ Экономия на облаке: пиковые и временные задачи — в публичном IaaS,
прогнозируемая постоянная нагрузка — на on-prem.
Уникальные преимущества системы
- Отсутствие «vendor lock-in»: можно добавлять новые серверы в кластер без привязки к конкретному вендору
- Прогнозируемое линейное масштабирование
- Нативная интеграция с инструментами VMware для мониторинга и управления
- Гибкая настройка политик хранения для отдельных сервисов и ВМ
- Гибридное облако: балансировка нагрузки между площадками.