Опубликовано 7 апреля 2026

Higress: новый шлюз для ИИ-трафика и замена Nginx Ingress

Higress: шлюз для ИИ-трафика вместо устаревшего Nginx Ingress

Проект Higress от Alibaba Cloud вошёл в CNCF Sandbox как замена уходящему Nginx Ingress – с нулевым временем простоя, поддержкой ИИ-трафика и MCP-серверов.

Инфраструктура / Технический контекст 6 – 9 минут чтения

Источник события: Alibaba Cloud 6 – 9 минут чтения

В начале апреля 2026 года на KubeCon EU прозвучало сразу два важных объявления, касающихся всех, кто работает с облачной инфраструктурой. Первое – официальный уход Nginx Ingress. Второе – вступление проекта Higress в CNCF Sandbox в качестве одного из его преемников. Разберёмся, что происходит и почему это важно даже для тех, кто с Kubernetes знаком лишь понаслышке.

Почему Nginx Ingress прекращает поддержку

Nginx Ingress уходит – и это не шутка

Nginx Ingress долгое время был чем-то вроде стандартного решения для управления входящим трафиком в Kubernetes-кластерах. По оценкам, около 50% облачных инфраструктур в мире до сих пор используют его в том или ином виде.

Но комитет по безопасности и группа разработчиков сети Kubernetes официально объявили о завершении поддержки Nginx Ingress. Проще говоря: новых версий не будет, баги не исправят, дыры в безопасности – тоже. Для продакшн-среды это серьёзно: одна из особенностей Nginx Ingress – возможность вставлять произвольные фрагменты конфигурации через аннотации. Гибко, да, но в отсутствие патчей это превращается в потенциальную уязвимость.

Сообщество давно знало, что этот момент наступит. Но когда он всё же наступает – нужно понимать, куда двигаться дальше.

Проблемы Nginx Ingress до прекращения поддержки

Почему Nginx Ingress стал неудобен ещё до своего ухода

Команда Alibaba Cloud, по собственному опыту, столкнулась с Nginx Ingress задолго до того, как проблема стала индустриальной. Вот с чем пришлось бороться:

Перебои при обновлениях. Каждое изменение конфигурации в Nginx требует перезапуска рабочих процессов. Для обычных коротких HTTP-запросов это почти незаметно, но для долгоживущих соединений – например, WebSocket или gRPC – это означает принудительное обрывание и переустановку соединений. В реальных системах это ощутимо.
Неравномерная нагрузка при gRPC. Nginx изначально проектировался под короткие запросы. Когда через одно долгоживущее соединение идёт поток мультиплексированных запросов, балансировка нагрузки работает неравномерно – одни серверы перегружены, другие простаивают.
Замедление при масштабировании. Когда конфигураций становится много – тысячи, десятки тысяч – время перезагрузки конфигурации начинает расти непропорционально. На больших кластерах это становится реальной проблемой.

Именно эти три проблемы подтолкнули команду к созданию собственного решения.

Что такое Higress и как он появился

Откуда взялся Higress

Higress – это шлюз (gateway), построенный поверх Envoy и Istio. Если коротко: Envoy – это высокопроизводительный прокси-сервер, а Istio – система управления сетью сервисов. Higress использует их как основу, добавляя собственные расширения.

Проект не новый. Внутри Alibaba Cloud он появился в 2020 году, прошёл испытание на «Двойной распродаже 11 ноября» – одном из крупнейших торговых событий в мире с колоссальным объёмом трафика. В 2021 году на его основе запустили облачный сервис для клиентов, объединив функции traffic-шлюза и микросервисного шлюза в одном решении. По словам разработчиков, это дало 50% экономии по сравнению с предыдущим подходом. С 2022 года проект открыт для всех.

25 марта 2026 года Higress официально вошёл в CNCF Sandbox – это означает, что проект признан сообществом облачных технологий как достойный развития и поддержки.

Преимущества Higress при обновлении конфигурации

Что делает Higress лучше при обновлениях конфигурации

Одно из ключевых отличий от Nginx – способ применения изменений. В Envoy обновление маршрутов и адресов серверов происходит прямо в памяти, без перезапуска процессов. Никакого «пересоздания воркеров», никаких обрывов соединений. Конфигурация просто тихо меняется на лету.

Это легко проверить на практике. Компания Sealos – облачный провайдер с аудиторией более 200 000 пользователей – до перехода на Higress сталкивалась с пиковым временем перезагрузки конфигурации до 30 минут. После миграции этот показатель упал до менее чем 5 секунд. Потребление памяти при этом снизилось примерно в 10 раз.

Переход с Nginx Ingress на Higress без перенастройки

Переход с Nginx Ingress: без переписывания конфигураций

Одна из главных практических задач при смене шлюза – не сломать то, что уже работает. Higress решает её за счёт поддержки аннотаций Nginx Ingress «из коробки»: большинство уже написанных конфигураций продолжат работать без изменений, потому что Higress внутри переводит их в формат Envoy и Istio.

Параллельно он поддерживает и новый стандарт – Gateway API. Проще говоря: можно сначала переехать с Nginx на Higress, ничего не трогая, а потом постепенно переводить конфигурации на новый формат. Если оба варианта заданы одновременно, Gateway API имеет приоритет.

Для тех случаев, когда прямой перевод аннотаций невозможен (например, для rate limiting), Higress использует собственные плагины.

WASM-плагины Higress для расширения функционала

Плагины, которые не ломают шлюз

Higress поддерживает расширения через WASM-плагины. WASM (WebAssembly) – это технология, которая позволяет запускать изолированный код внутри прокси-сервера. Если плагин написан с ошибкой, он просто не сработает – но не уронит весь шлюз. Это важная гарантия стабильности.

Плагины можно писать на Go, Rust, C++ или JavaScript. Они упаковываются в образы, совместимые с Docker-реестрами, и обновляются без перезапуска шлюза. Из коробки доступно более 100 плагинов – для аутентификации, безопасности, кэширования и многого другого.

Для задач, которые WASM не покрывает (например, сложные долгоживущие соединения), есть нативная поддержка фильтров на Go, работающих непосредственно внутри Envoy.

Особенности работы с ИИ-трафиком

ИИ-трафик – это другой трафик

Вот здесь начинается то, что делает Higress актуальным именно сейчас, в эпоху повсеместного распространения ИИ.

Обычный API-шлюз работает с короткими запросами и ответами. ИИ-трафик устроен иначе:

Соединения живут долго – от минут до часов, особенно при работе с ИИ-агентами.
Ответы приходят потоком (Server-Sent Events, стриминг), а не единым блоком.
Шлюз должен понимать содержимое запроса – например, к какой языковой модели его направить.

Higress умеет работать в двух режимах применительно к ИИ: как LLM-шлюз (для работы с языковыми моделями) и как MCP-шлюз (для управления инструментами ИИ-агентов).

Higress как шлюз для работы с языковыми моделями

Higress как шлюз для языковых моделей

Когда Higress выступает в роли LLM-шлюза, он берёт на себя несколько практически важных задач.

Автоматический фолбэк между моделями. Если основная языковая модель не отвечает вовремя или перегружена, Higress автоматически переключается на резервную. Пользователь при этом ничего не замечает – он просто получает ответ.

Учёт токенов при ограничении запросов. В компаниях разные команды или отделы часто пользуются одними и теми же языковыми моделями. Higress позволяет задать квоты по количеству токенов для каждой команды. Если один отдел исчерпал лимит – ограничение применяется только к нему, остальные продолжают работать.

Семантическое кэширование. Если несколько разных пользователей задают похожие вопросы, Higress может вернуть кэшированный ответ, не отправляя запрос к модели повторно. Это снижает затраты и ускоряет ответы. Кэш работает не по точному совпадению текста, а по смысловой близости запросов.

Наблюдаемость. Higress собирает метрики, специфичные для ИИ: время до первого токена, скорость генерации, количество токенов в кэше. Всё это настраивается динамически, без перезапуска, и важно как для отладки, так и для контроля расходов.

Higress как шлюз для ИИ-агентов

ИИ-агенты – это системы, которые решают задачи, используя внешние инструменты: поиск, базы данных, API. Взаимодействие с этими инструментами стандартизировано через протокол MCP.

Проблема в том, что большинство существующих API не предназначены для ИИ-агентов: они возвращают сложные JSON-структуры, в которых модели легко запутаться. Higress решает это двумя способами.

Во-первых, он умеет автоматически превращать существующие OpenAPI-спецификации (стандартный способ описания API) в MCP-инструменты, понятные агентам, – без написания кода.

Во-вторых, он может трансформировать ответы: вытащить из сложного JSON только нужные поля и преобразовать их в Markdown – формат, с которым языковые модели работают гораздо лучше. Разработчики называют это трансформацией полезной нагрузки. Это сокращает объём данных, которые модель обрабатывает, и снижает вероятность «галлюцинаций» – ситуаций, когда модель выдаёт неверный ответ из-за перегруженности контекста.

Компании, использующие Higress

Кто уже использует

Higress применяется не только внутри Alibaba. Среди публично известных пользователей – Ctrip (известный также как Trip.com), который построил на Higress внутренний шлюз для всего ИИ-трафика компании. Ant Group (Alipay) использует ядро Higress в своём SOFA AI Gateway для управления масштабными корпоративными топологиями. Среди других компаний упоминаются Didi, Qunar, PayPal, Kuaishou, DJI.

Планы развития Higress

Что дальше

В планах команды – углубление поддержки Gateway API и его расширения для ИИ-нагрузок, а также поддержка WebRTC для задач, где нужны двусторонние аудио- и видеовзаимодействия в реальном времени – например, для голосовых ИИ-приложений наподобие OpenAI Realtime API.

Репозиторий проекта в ближайшее время будет перенесён под управление CNCF. Проект открыт для внешних разработчиков и принимает вклад от сообщества.

Если говорить коротко о сути происходящего: Nginx Ingress уходит, и это не просто смена инструмента. Это момент, когда инфраструктурный шлюз должен стать умнее – понимать не только HTTP-запросы, но и природу ИИ-трафика. Higress – одна из попыток ответить на этот вызов.

#прикладной разбор #технический контекст #нейросети #развитие ии #инженерия #компьютерные системы #инфраструктура #ии-экосистемы #интеграция ии-систем

Ссылка на публикацию: https://www.alibabacloud.com/blog/beyond-nginx-ingress-higress-as-the-kubernetes-gateway-for-the-ai-era_603010

Оригинальное название: Beyond Nginx Ingress: Higress as the Kubernetes Gateway for the AI Era

Дата публикации: 7 апр 2026

Alibaba Cloud www.alibabacloud.com Китайское облачное и ИИ-подразделение Alibaba, предоставляющее инфраструктуру и сервисы для бизнеса.

Предыдущая статья Gemma 4 от Google: что изменится для ИИ на устройствах? Следующая статья PyTorch Foundation принял Helion в качестве официального проекта: что это значит для разработки ИИ

Higress: новый шлюз для ИИ-трафика и замена Nginx Ingress

Почему Nginx Ingress прекращает поддержку

Проблемы Nginx Ingress до прекращения поддержки

Что такое Higress и как он появился

Преимущества Higress при обновлении конфигурации

Переход с Nginx Ingress на Higress без перенастройки

WASM-плагины Higress для расширения функционала

Особенности работы с ИИ-трафиком

Higress как шлюз для работы с языковыми моделями

Higress как шлюз для ИИ-агентов

Компании, использующие Higress

Планы развития Higress

Связанные публикации

Higress: поддержка Gateway API и расширений для ИИ-инференса

Model Context Protocol: как подключить ИИ к реальным данным

Безопасность MCP: как правильно выстроить контроль доступа в системах с ИИ-агентами

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации