Тематика #работа с аудио

ИИ: События

Тайфун на EACL 2026: как продвигается исследование аудио-языковых моделей

Исследования

Две исследовательские работы команды Typhoon приняты на конференцию EACL 2026: они посвящены оценке речевых моделей и работе с длинными аудиозаписями.

Typhoonopentyphoon.ai 21 мар 2026

ИИ: События

Маленькая модель, которая слышит лучше: как из мультимодального ИИ сделать эффективный аудиоэмбеддер

Исследования

Исследователи показали, как превратить крупную мультимодальную модель в компактный аудиоинструмент, превосходящий конкурентов при обучении на объёме данных в 25 раз меньше.

Jina AIjina.ai 20 мар 2026

ИИ: События

Yandex AI Studio научила агентов искать по файлам, включая видео и аудио

Продукты

Yandex AI Studio обновила инструмент поиска по файлам: теперь ИИ-агенты могут работать с таблицами, аудио и видео, находя нужное в корпоративных базах знаний.

Yandex Cloudyandex.cloud 19 мар 2026

ИИ: События

Как ИИ учится «слышать» важное: извлечение данных из живой речи в реальном времени

Разработка

Разбираемся, как современные системы распознавания речи научились выделять из разговора конкретные данные – телефоны, адреса и почту – прямо на лету.

AssemblyAIwww.assemblyai.com 19 мар 2026

ИИ: События

Universal-3 Pro от AssemblyAI: одна модель шесть языков без переключений

Продукты

AssemblyAI выпустила модель Universal-3 Pro с поддержкой шести языков и переключением между ними прямо в середине речи без ручных настроек.

AssemblyAIwww.assemblyai.com 18 мар 2026

ИИ: События

AssemblyAI запустила потоковое разделение голосов в реальном времени

Продукты

AssemblyAI представила технологию, которая умеет в реальном времени определять, кто из участников разговора говорит – даже в многолюдных встречах.

AssemblyAIwww.assemblyai.com 17 мар 2026

ИИ: События

Hume AI открыла исходный код TADA – модели, которая синхронизирует текст и звук

Разработка

Hume AI выпустила в открытый доступ TADA – речевую модель, которая покадрово выравнивает текст и аудио, делая синтез речи быстрым и предсказуемым.

Hume AIwww.hume.ai 10 мар 2026

ИИ: События

ElevenLabs запустила инструмент для создания аудиокниг прямо в браузере

Продукты

Новая функция в ElevenCreative позволяет превратить текст в готовую аудиокнигу без посещения студии звукозаписи и привлечения профессиональных дикторов.

ElevenLabselevenlabs.io 10 фев 2026

ИИ: События

Bulbul V3: индийская модель для озвучивания на 15 языках

Продукты

Индийский стартап Sarvam AI представил Bulbul V3 – модель синтеза речи, поддерживающую 15 языков и способную клонировать голоса по короткому аудиообразцу.

Sarvamwww.sarvam.ai 9 фев 2026