Искусственный интеллект потребляет энергию в масштабах, которые уже сложно игнорировать, ставя под вопрос саму логику бесконечного роста.
ИИ: События
Monarch: как PyTorch решает задачу управления суперкомпьютером
Технический контекст • Инфраструктура
PyTorch представил Monarch – инструмент для упрощения запуска и отладки задач распределённого обучения на больших кластерах GPU.
ИИ: События
Higress: шлюз для ИИ-трафика вместо устаревшего Nginx Ingress
Технический контекст • Инфраструктура
Проект Higress от Alibaba Cloud вошёл в CNCF Sandbox как замена уходящему Nginx Ingress – с нулевым временем простоя, поддержкой ИИ-трафика и MCP-серверов.
Исследователи выяснили, что языковые модели способны оптимизировать выполнение запросов к базам данных и делают это значительно эффективнее привычных статистических методов.
ИИ: События
Red Hat и NVIDIA показали рекордные результаты в тестах производительности ИИ
Инфраструктура
Red Hat и NVIDIA совместно добились лидирующих показателей в независимом тесте MLPerf Inference v6.0, охватывающем задачи распознавания изображений, речи и рассуждений.
ИИ: События
Когда одного GPU мало, а денег на второй нет: новый подход к запуску ИИ в продакшене
Инфраструктура
Два новых open-source проекта предлагают способ запускать несколько ИИ-моделей на одном GPU с динамическим управлением памятью и без потери производительности.
ИИ: События
Люди, которые заставляют GPU работать по-настоящему быстро: внутри команды Together AI
Инфраструктура
Как небольшая исследовательская группа превращает теоретические возможности видеочипов в реальную производительность ИИ-систем – история команды Together AI.
ИИ: События
Когда падает один GPU, система не должна падать целиком
Технический контекст • Инфраструктура
Команды Mooncake и Volcano Engine встроили в фреймворк SGLang механизм эластичного параллелизма экспертов, позволяющий выдержать частичные сбои без перезапуска.
ИИ: События
AMD на MLPerf Inference 6.0: миллион токенов в секунду и первый выход в видеогенерацию
Технический контекст • Инфраструктура
AMD представила результаты MLPerf Inference 6.0: новые рекорды производительности, первые тесты видеогенерации и масштабирование до кластерного уровня на GPU Instinct MI355X.