Опубликовано 10 февраля 2026

Инкрементальные вычисления в аналитике больших данных и их преимущества

Когда данных слишком много: как инкрементальные вычисления меняют подход к аналитике

Команда AnalyticDB представила StreamingView – движок для работы с постоянно обновляемыми данными, который исключает необходимость пересчитывать весь массив информации при каждом изменении.

Исследования 3 – 5 минут чтения

Источник события: Alibaba Cloud 3 – 5 минут чтения

Чем больше данных обрабатывают ИИ-системы, тем острее встаёт вопрос: как работать с информацией, которая постоянно меняется? Если каждый раз пересчитывать всё с нуля, процесс становится медленным и дорогим. Если же игнорировать обновления – результаты быстро устаревают.

Исследователи из команды AnalyticDB for PostgreSQL предложили решение этой проблемы и описали его в статье для конференции VLDB. Речь идёт о технологии StreamingView – встроенном движке инкрементальных вычислений, который позволяет обновлять аналитические результаты постепенно, по мере поступления новых данных, а не перестраивать их целиком.

Что такое инкрементальные вычисления и зачем они нужны

Представьте, что вы ведёте таблицу с продажами интернет-магазина. Каждую минуту в неё добавляются новые заказы. Вам нужно видеть актуальную статистику: сколько товаров продано за день, какова выручка по категориям и какие регионы лидируют.

Классический подход – каждый раз пересчитывать всю таблицу заново. Но если в ней миллионы строк, это занимает много времени и требует значительных вычислительных ресурсов. Инкрементальный подход работает иначе: система запоминает предыдущий результат и обновляет только ту его часть, которая изменилась. Пришёл новый заказ – он добавился к итогу. Один заказ отменили – сумма уменьшилась.

Звучит логично, но реализовать это на практике – особенно для сложных запросов с фильтрами, группировками и объединениями таблиц – непросто.

Материализованные представления и инкрементальное обновление данных

Материализованные представления: когда скорость важнее свежести

В базах данных есть понятие материализованного представления. Это заранее вычисленный результат запроса, который хранится как отдельная таблица. Вместо того чтобы каждый раз выполнять сложный запрос, система просто возвращает готовый ответ – это происходит мгновенно.

Проблема в том, что если исходные данные изменились, материализованное представление нужно обновить. И здесь начинаются сложности. Традиционные системы либо обновляют такие представления по расписанию (например, раз в час), либо пересчитывают их полностью при каждом изменении. Первый вариант выдаёт устаревшие данные, второй – слишком медленный и ресурсоёмкий.

StreamingView предлагает третий путь: обновлять материализованные представления инкрементально и делать это в режиме реального времени.

Принципы работы технологии StreamingView в AnalyticDB

Как это работает внутри AnalyticDB

StreamingView встроен напрямую в AnalyticDB for PostgreSQL. Это означает, что он работает с данными там же, где они хранятся, без необходимости переносить их в отдельную систему обработки. Это критически важно, так как перемещение больших объёмов информации между системами – одна из главных причин задержек в аналитике.

Движок отслеживает изменения в исходных таблицах и постепенно применяет их к материализованным представлениям. Если добавилась новая строка – она учитывается в итоговом результате. Если строка удалена или изменена – корректировка происходит без полного пересчёта.

При этом система умеет работать со сложными SQL-запросами, включающими несколько таблиц, агрегации и фильтры. То есть инкрементальность применяется не только к простым суммам, но и к запросам, которые в обычных условиях требуют тяжеловесных вычислений.

Роль инкрементальных вычислений в обработке данных для ИИ

Зачем это нужно в эпоху ИИ

ИИ-системы оперируют огромными массивами данных, которые постоянно пополняются. Логи пользователей, события в приложениях, данные с датчиков, обновления каталогов – всё это требует быстрого и актуального анализа.

Классическая аналитика строилась на предположении, что данные относительно статичны: загрузили, обработали, получили отчёт. Но современные приложения генерируют информацию непрерывно. И если каждый раз заново пересчитывать аналитические дашборды или обучающие датасеты для моделей, система просто не будет успевать за потоком.

Инкрементальные вычисления решают эту проблему: они позволяют поддерживать актуальность результатов без лишних затрат ресурсов. В контексте ИИ это особенно важно, поскольку модели часто требуют свежих данных для переобучения или валидации, а задержки в их получении могут снижать точность прогнозов.

Перспективы развития технологий инкрементальных вычислений

Что дальше

StreamingView – не единственная попытка внедрить инкрементальные вычисления, но она интересна тем, что технология работает внутри самой базы данных, а не требует отдельной инфраструктуры. Это упрощает архитектуру и снижает накладные расходы на передачу данных.

Публикация на VLDB – это академическое признание подхода, однако востребованность решения на практике покажет время. Инкрементальные вычисления – это всегда компромисс между точностью, скоростью и сложностью реализации. Они эффективны там, где данные меняются часто, но предсказуемо. Если же изменения хаотичны или затрагивают большую часть данных, выигрыш может быть не столь заметным.

Тем не менее направление активно развивается. И чем больше данных будет обрабатывать ИИ, тем актуальнее будет становиться вопрос: как делать это не просто быстро, но и максимально эффективно.

#аналитика #технический контекст #инженерия #компьютерные системы #инфраструктура #данные #инкрементальные вычисления #обработка потоковых данных

Ссылка на публикацию: https://www.alibabacloud.com/blog/vldb-paper-deep-dive-as-ai-advances-data-analysis-enters-the-era-of-incremental-computation_602877

Оригинальное название: VLDB Paper Deep Dive: As AI Advances, Data Analysis Enters the Era of Incremental Computation

Дата публикации: 10 фев 2026

Alibaba Cloud www.alibabacloud.com Китайское облачное и ИИ-подразделение Alibaba, предоставляющее инфраструктуру и сервисы для бизнеса.

Предыдущая статья Microsoft и Cognizant внедряют агентный ИИ в страховой бизнес Следующая статья Oracle встраивает ИИ-агентов в систему управления цепочками поставок

Инкрементальные вычисления в аналитике больших данных и их преимущества

Что такое инкрементальные вычисления и зачем они нужны

Материализованные представления и инкрементальное обновление данных

Принципы работы технологии StreamingView в AnalyticDB

Роль инкрементальных вычислений в обработке данных для ИИ

Перспективы развития технологий инкрементальных вычислений

Связанные публикации

Почему автономному ИИ нужна платформа данных, а не просто большая модель

Как GenAI и OpenTelemetry меняют Observability: тренды мониторинга систем в 2026 году

Как упаковать космический сигнал в чемодан: математика против данных

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации