Разбираемся, как нейросети научились угадывать возраст по лицу: от пикселей и костей до спорных этических вопросов, которые никуда не делись.
Google представила алгоритм TurboQuant, сжимающий рабочую память ИИ в 6 раз, что может кардинально изменить подход к инфраструктуре для нейросетей.
PyTorch 2.10 в связке с TorchAO открывает новые возможности для запуска ИИ-моделей прямо на устройстве – без облака и серверов.
Компания Reka представила новую версию модели Edge – компактный ИИ с продвинутыми возможностями компьютерного зрения, способный работать локально на устройствах без подключения к облаку.
ИИ: События
Как сделать большую языковую модель меньше, не потеряв при этом качество
Технический контекст • Разработка
Разработчики TorchAO расширили инструментарий для обучения моделей с учётом квантизации: теперь поддерживаются новые архитектуры, режимы и задачи.
Что если обучение огромной нейросети можно сделать вдвое дешевле по памяти – и при этом ничего не сломать? Именно это исследуют авторы FlashOptim.
ИИ: События
Как научить компактный компьютер управлять роботом: опыт запуска ИИ прямо на устройстве
Разработка
Компании NXP и Hugging Face рассказали, как обучить роботизированный искусственный интеллект на собственных данных и запустить его на маломощном встроенном устройстве.
ИИ: События
Tencent выпустила самую компактную языковую модель: 0,3 млрд параметров в 600 МБ
Разработка
Китайская компания открыла исходный код модели HY-1.8B-2Bit с двухбитной квантизацией – она весит меньше, чем многие мобильные приложения.
ИИ: События
Как AMD и Qwen выжали максимум из видеокарт MI300X
Технический контекст • Инфраструктура
Команда Qwen оптимизировала свои модели для работы на AMD MI300X, добившись задержки отклика до 15 мс на токен и полной генерации изображения за 0,4 секунды.