Опубликовано 7 февраля 2026

Perplexity показала, как обучать модели с триллионом параметров на базе AWS

Команда Perplexity адаптировала фреймворк для обучения сверхбольших нейросетей под облачную инфраструктуру Amazon. Это позволило устранить жесткую зависимость от проприетарного оборудования NVIDIA и использовать стандартные сетевые решения.

Инфраструктура / Технический контекст 4 – 5 минут чтения
Источник события: Perplexity AI 4 – 5 минут чтения

Команда Perplexity опубликовала статью о том, как им удалось адаптировать технологию обучения моделей с триллионом параметров для работы на облачной платформе AWS. Если коротко: они взяли существующий подход, который был жестко завязан на оборудование NVIDIA, и переписали его так, чтобы он эффективно работал на стандартной сетевой инфраструктуре Amazon.

Проблемы обучения моделей с триллионом параметров

Что за проблема с триллионом параметров

Современные большие языковые модели продолжают расти. Если пару лет назад модель на 100–200 миллиардов параметров считалась огромной, то сейчас речь идет уже о триллионе и более. Проблема в том, что такие модели физически не помещаются в память одного GPU – даже самого мощного.

Поэтому их приходится «размазывать» по множеству устройств. Но когда счет видеокарт идет на сотни или тысячи, возникает другая сложность: им нужно постоянно обмениваться данными друг с другом. И если эта связь работает медленно, весь процесс обучения превращается в бесконечное ожидание.

Стандартные решения для обучения больших моделей

Как это обычно решают

NVIDIA предлагает для таких задач технологию под названием NVLink. Это специальная высокоскоростная шина, которая связывает GPU внутри одного сервера или между серверами. Она работает быстро, но есть нюанс: это проприетарное решение, которое требует определенного «железа» и плохо совместимо с другими платформами.

Существует открытый фреймворк Megatron-LM от NVIDIA, который умеет обучать огромные модели, распределяя их по множеству GPU. Однако он изначально рассчитан именно на NVLink. Если у вас нет доступа к этой технологии – вы, грубо говоря, вне игры.

Что сделала Perplexity

Команда Perplexity решила устранить эту зависимость. Они переписали часть Megatron-LM так, чтобы фреймворк мог работать через AWS EFA (Elastic Fabric Adapter) – это сетевая технология Amazon, обеспечивающая быструю связь между серверами в облаке. EFA использует стандартный протокол, который не привязан к конкретному производителю оборудования.

Теперь модели с триллионом параметров можно обучать на стандартных облачных инстансах AWS, не требуя специфического оборудования от NVIDIA. Это делает процесс более гибким: можно арендовать мощности у Amazon, обучить модель и не беспокоиться о том, что инфраструктура привязана к одному вендору.

Преимущества подхода Perplexity для обучения нейросетей

Почему это важно 🤔

Во-первых, это снижает барьер входа. Если раньше для обучения сверхбольших моделей требовалось либо покупать дорогостоящие серверы с поддержкой NVLink, либо арендовать их у узкого круга провайдеров, то теперь можно использовать общедоступную облачную инфраструктуру.

Во-вторых, это вопрос переносимости (портативности). Когда фреймворк работает только с одной технологией, вы фактически становитесь ее заложником. Если завтра появится более выгодное предложение от другого облачного провайдера – перенести туда процесс обучения будет сложно или вовсе невозможно. Решение Perplexity делает разработку менее зависимой от конкретного поставщика.

В-третьих, это открывает новые возможности для исследователей и небольших команд, у которых нет бюджета на эксклюзивное оборудование, но есть доступ к крупным облачным платформам.

Техническая реализация адаптации Megatron-LM

Что под капотом

Не вдаваясь в глубокие технические детали: основная работа заключалась в замене коммуникационного слоя. Megatron-LM использует NCCL (NVIDIA Collective Communications Library) – библиотеку для обмена данными между GPU. Эта библиотека оптимизирована под NVLink и может демонстрировать низкую производительность на других типах соединений.

Команда Perplexity адаптировала фреймворк для эффективного использования AWS EFA. По их словам, это потребовало переосмысления некоторых алгоритмов распределения данных и синхронизации, но в итоге удалось добиться производительности, достаточной для обучения моделей масштаба триллиона параметров.

Ограничения решения Perplexity для AWS

Ограничения и вопросы

Важно понимать, что это не универсальное решение всех проблем. Perplexity не утверждает, что их подход быстрее или эффективнее, чем обучение через NVLink. Скорее, речь идет о компромиссе: вы получаете большую гибкость и независимость от оборудования, но, возможно, жертвуете частью «чистой» производительности.

Также остается открытым вопрос о том, насколько легко этот подход масштабируется на другие облачные платформы. AWS EFA – это все еще проприетарное решение одного конкретного провайдера. Если кто-то захочет повторить аналогичный трюк на Google Cloud или Azure, потребуется дополнительная адаптация под их сетевые протоколы.

Наконец, статья Perplexity – это скорее описание концепции и архитектурного подхода, а не готовый открытый инструмент. Пока неясно, планирует ли компания выкладывать код в публичный доступ или он останется внутренней разработкой.

Влияние на индустрию обучения больших языковых моделей

Что это значит для индустрии

Работа Perplexity доказывает, что зависимость от закрытых технологий – не приговор. Даже в таких ресурсоемких задачах, как обучение моделей с триллионом параметров, можно найти пути к большей открытости и кроссплатформенности.

Это особенно актуально сейчас, когда стоимость обучения нейросетей продолжает расти, а конкуренция между облачными гигантами усиливается. Возможность выбирать платформу, не будучи привязанным к конкретному «железу», может стать решающим фактором для многих разработчиков.

Посмотрим, последуют ли другие компании этому примеру и насколько широко подобный подход приживется в индустрии в ближайшие годы.

Оригинальное название: Enabling Trillion-Parameter Models on AWS EFA
Дата публикации: 6 фев 2026
Perplexity AI research.perplexity.ai Американская компания, разрабатывающая ИИ-поисковую систему с ответами на основе источников.
Предыдущая статья SenseTime представила SenseNova-SI-1.3 – модель с продвинутым пространственным интеллектом Следующая статья Model Context Protocol: как подключить ИИ к реальным данным

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

ИИ: События

RDMA для языковых моделей: когда серверы учатся общаться напрямую

Технический контекст Инфраструктура

Команда Perplexity AI продемонстрировала, как технология прямой передачи данных между серверами помогает языковым моделям работать быстрее и эффективнее, устраняя «узкие места» в сетевой инфраструктуре.

Perplexity AIresearch.perplexity.ai 7 фев 2026

ИИ: События

Как масштабировать vLLM и не допустить ошибок нехватки памяти

Технический контекст Инфраструктура

Команда AI21 Labs поделилась опытом оптимизации vLLM – популярного инструмента для развертывания языковых моделей, который при масштабировании часто сталкивается с критическими ошибками из-за дефицита оперативной памяти.

AI21 Labswww.ai21.com 6 фев 2026

Инженеры Mistral AI рассказали, как выслеживали утечку памяти в популярной системе для запуска языковых моделей vLLM и что им помешало.

Mistral AImistral.ai 21 янв 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться