В рамках перехода на отечественные решения виртуализации перед многими компаниями встает задача миграции с VMware на платформы, сертифицированные ФСТЭК. В данной статье рассматриваем кейс внедрения ECP VeiL и VeiL VDI, в ходе которого вендору — АО «НИИ «Масштаб» (входит в холдинг «Росэл» Госкорпорации Ростех) удалось меньше чем за месяц обеспечить бесшовный переход на российскую платформу виртуализации, устранить скрытые сетевые проблемы и сократить количество необходимого оборудования. Опыт проекта может быть полезен компаниям, столкнувшимся с аналогичными вызовами.
В условиях цифрового суверенитета и жестких требований регуляторов все больше организаций сталкиваются с необходимостью перехода на отечественные решения в сфере виртуализации. Этот вопрос особенно актуален для компаний, обрабатывающих персональные данные и относящихся к критической инфраструктуре.
АО «НИИ «Масштаб», являясь разработчиком системы виртуализации и компонента VDI, одним из первых почувствовал надвигающийся тренд импортозамещения и положил начало собственной разработке еще в 2014 году. В настоящее время компания активно выстраивает взаимодействие с отечественными производителями программного обеспечения, вычислительных систем и систем хранения данных, а также развивает канал продаж, в том числе региональный.
Важную роль в развитии продукта играет команда технической поддержки и внедрения. Несмотря на то, что производитель старается не выходить за рамки продукта, специалистам приходится сталкиваться с различными трудностями, возникающими на стороне заказчиков, особенно при миграции уже работающих систем на решения VeiL, и искать пути решения.
Показательным примером служит проект миграции одного из заказчиков на платформу виртуализации ECP VeiL, в соответствии с которым требовалось осуществить переход с VMware на средство виртуализации, имеющее сертификат ФСТЭК по 4 уровню доверия. При этом эта задача должна была быть реализована максимально оперативно, чтобы не сорвать сроки по исполнению Указа Президента РФ №166 «О мерах по обеспечению технологической независимости и безопасности критической информационной инфраструктуры Российской Федерации».
Во время работы возник ряд сложностей. С одной стороны, во время тестирования было невозможно полностью повторить работу и функциональность продуктивного сегмента. У заказчика оставались сомнения по поводу бесшовности перехода на новое ПО (время простоя сервисов не должно было превышать 10 минут), а также были переживания по поводу стабильности работы новой системы. С другой стороны, на время перехода под рукой не оказалось буферного серверного оборудования для создания точной копии продуктива на новой системе виртуализации. Это стало критичным нюансом, потому как из-за опасений, озвученных выше, заказчик не хотел разваливать существующий кластер. К тому же такой способ существенно увеличил бы время развертывания новой инфраструктуры.
Чтобы обеспечить быструю бесшовную миграцию и гарантировать стабильность новой системы, специалисты НИИ «Масштаб» обратились к партнеру, производящему серверы на базе OСP (Open Compute Project), который предоставил заказчику буферные мощности. При этом современная компонентная база позволила повторить инфраструктуру заказчика на меньшем количестве единиц оборудования. Ранее проведенное тестирование на совместимость позволило не сомневаться в скорости развертывания и надежности новой инфраструктуры.
Следующим шагом стала планомерная миграция виртуальных машин в новую инфраструктуру. Переезд виртуальных машин осуществлялся путем создания копий виртуальных машин (ВМ) в формате .ovf, копирования их на новую инфраструктуру и настройки синхронизации между боевой и новой системами для поддержания актуальности данных. Особенно тщательно проверялись виртуальные машины, в которых работали высоконагруженные базы данных, размеры которых превышали 0.5 Тб. С каждой из перенесенных ВМ проводилось тестирование на предмет отработки высокой доступности, живой миграции, создания резервных копий и снимков состояния.
В процессе работы обнаружилась неочевидная, но весьма неприятная вещь в сети заказчика, которая сильно уменьшала производительность работы SAN. Оказалось, что при развертывании на старых серверах, MTU на сетевых интерфейсах составляет 1446 байт. Проведя ряд экспериментов, от вполне стандартных значений в 1500 байт, до Jumboframe, обнаружилось, что часть сетевых карт не потянула такой режим работы, и весь удар пришёлся на CPU, загрузив их на 100% без полезной нагрузки. В итоге значение MTU в 1500 байт оказалось оптимальным.
В общей сложности от постановки задачи до сдачи в опытную эксплуатацию новой инфраструктуры прошло чуть менее месяца. Параллельно заказчик проводил подготовку к аттестации объекта. Убедившись, что ECP VeiL справляется с возложенными на него функциями, продуктив чувствует себя нормально, эксперты НИИ «Масштаб» приступили к разбору старой инфраструктуры. Теперь всю работу по установке ECP VeiL нужно было повторить на серверах заказчика. В этот раз можно было полноценно воспользоваться живой миграцией, заведя все сервера в один кластер. Эксперты настроили slave-контроллер на одном из старых серверов и после успешной миграции на сервера заказчика его переключили в режим «мастер».
В результате проекта заказчик менее чем за месяц успешно перешел на отечественную платформу виртуализации ECP VeiL, полностью выполнив требования регуляторов и обеспечив непрерывность критических сервисов. Кроме того, заказчику понравилось оборудование, использованное в качестве буфера. Его планируется учесть в будущем бюджетном плане, а старые сервера использовать для реализации VDI инфраструктуры на основе VeiL VDI.
Подробнее на странице.