Проблема, о которой мало говорят
Когда речь заходит об ИИ-инфраструктуре, обычно обсуждают производительность чипов, скорость обучения моделей или стоимость вычислений. Но есть одна тема, которая остаётся в тени, хотя напрямую влияет на масштабируемость всей отрасли, – это охлаждение.
Современные ускорители для ИИ выделяют огромное количество тепла. Если его не отводить эффективно, оборудование перегревается, снижает производительность или выходит из строя. Классическое воздушное охлаждение с этим уже не справляется: слишком много энергии уходит на работу вентиляторов, а эффективность падает с ростом плотности размещения серверов.
Поэтому индустрия постепенно переходит на жидкостное охлаждение. Вода отводит тепло гораздо лучше воздуха, но у этого подхода есть свои сложности: нужно постоянно пополнять систему из-за испарения, фильтровать воду и контролировать её качество. Всё это увеличивает эксплуатационные расходы и усложняет обслуживание.
Что сделал Oracle
Oracle внедрил в своих дата-центрах для ИИ систему охлаждения, работающую по принципу замкнутого контура. Проще говоря, вода циркулирует внутри системы, напрямую охлаждая чипы, и при этом не испаряется. Её заливают один раз, после чего она просто циркулирует, отводя тепло.
Технически это называется «прямое жидкостное охлаждение чипов по замкнутому циклу без испарения» (direct-to-chip closed-loop non-evaporative liquid cooling). Суть в том, что жидкость подаётся прямо к процессорам и ускорителям, забирает тепло и возвращается обратно в систему, не контактируя с внешней средой. Нет испарения – нет необходимости доливать воду.
Зачем это нужно
Первое и самое очевидное – экономия ресурсов. Традиционные системы охлаждения в крупных дата-центрах могут потреблять миллионы литров воды в год. Замкнутая система этого не требует: один раз залил – и вода работает годами.
Второе – снижение эксплуатационных расходов. Не нужно постоянно контролировать уровень жидкости, фильтровать её или обрабатывать химикатами. Система становится проще в обслуживании.
Третье – актуальность для регионов с ограниченным доступом к воде. Дата-центры часто строят там, где есть дешёвая электроэнергия, но могут быть проблемы с водными ресурсами. Замкнутая система снимает это ограничение.
И наконец, вопрос плотности размещения оборудования. Жидкостное охлаждение позволяет упаковать больше серверов на квадратный метр, так как оно эффективнее отводит тепло. А если система ещё и не требует постоянного пополнения, это значительно упрощает проектирование и эксплуатацию.
Это уникальная технология?
Нет, Oracle – не единственная компания, использующая жидкостное охлаждение. Microsoft, Google, Meta и другие крупные игроки экспериментируют с разными вариантами. Кто-то погружает серверы в диэлектрическую жидкость, кто-то использует водяные контуры с внешними чиллерами.
Но замкнутая безыспарительная система – это конкретное решение, в котором сделан акцент именно на автономности и минимизации обслуживания. Oracle подчёркивает, что их подход требует заливки воды только один раз, и это ключевое отличие от систем, нуждающихся в регулярном пополнении.
Что это значит для индустрии
Сама по себе технология охлаждения – это не прорыв в области ИИ. Она не делает модели умнее и не ускоряет обучение напрямую. Но она решает инфраструктурную проблему, которая становится всё более критичной.
По мере роста вычислительных мощностей, необходимых для обучения и запуска больших моделей, охлаждение превращается из второстепенного вопроса в один из ключевых факторов, определяющих стоимость и доступность ИИ-сервисов. Если дата-центр потребляет меньше воды и энергии на охлаждение, это снижает итоговую стоимость вычислений.
Для разработчиков и компаний, арендующих облачные мощности, это может означать более предсказуемые цены и меньше ограничений, связанных с доступностью ресурсов в конкретных регионах.
Открытые вопросы
Oracle не раскрывает всех деталей своей системы. Неясно, какие именно теплоносители используются, как организован контур и какова долговечность компонентов. Это важно, так как любая замкнутая система со временем может столкнуться с деградацией жидкости, коррозией или накоплением примесей.
Также неизвестно, насколько эффективно эта технология масштабируется. Одно дело – внедрить её в единичном дата-центре, другое – развернуть по всему миру с учётом разных климатических условий и нормативных требований.
Однако сам факт того, что корпорации всё активнее инвестируют в альтернативные методы охлаждения, показывает: вопрос инфраструктуры становится столь же важным, как и вопрос алгоритмов. И решения, которые сегодня кажутся техническими деталями, завтра могут определить, кто сможет позволить себе обучение и запуск моделей следующего поколения.