ИИ: События
Как уменьшить «аппетиты» эмбеддинг-моделей на AMD Ryzen AI
Технический контекст • Разработка
AMD представила простой способ сжатия моделей эмбеддингов для локальных NPU: конвертацию весов из формата FP32 в BF16 с помощью нескольких строк кода на Python.