MiniMax рассказала о своём подходе к дообучению языковых моделей, которые умеют не только отвечать, но и выполнять сложные задачи через взаимодействие с инструментами.
Лаборатория
Квантовые всплески ранней Вселенной: как логарифмы повествуют об инфляции
Физика и космос • Общая теория относительности
Во время инфляции квантовые флуктуации растягиваются до космических масштабов, оставляя математические «следы» – логарифмы, которые помогают понять рождение структуры Вселенной.
ИИ: События
Как в Mistral AI нашли утечку памяти в vLLM – и почему она оказалась не там, где искали
Технический контекст • Разработка
Инженеры Mistral AI рассказали, как выслеживали утечку памяти в популярной системе для запуска языковых моделей vLLM и что им помешало.
ИИ: События
TileLang: новый язык от AMD для упрощения разработки под GPU
Технический контекст • Разработка
AMD представила TileLang – инструмент, который упрощает написание оптимизированных операторов для GPU и снижает порог входа в разработку под ROCm.
Стартап Overcut использует Azure для построения безопасных агентных систем, помогающих компаниям автоматизировать работу со сложной инфраструктурой разработки.
Узнайте, почему простая штука, державшая ваши детские рисунки на холодильнике, до сих пор ставит учёных в тупик и заставляет переписывать квантовую механику.
Бразильский инженер объясняет, как новая модель DARC позволяет управлять ритмом ударных через битбокс, не теряя музыкальную гармонию – словно дирижировать самбой жестами.
AMD предлагает способ упростить работу с множественными моделями ИИ с помощью JSON, что экономит время на эксперименты и валидацию.
AMD выпустила инструмент для тестирования производительности ONNX-моделей на Windows ML и DirectML – теперь проверить совместимость и скорость работы стало проще.