Опубликовано

Cursor запустил агента, который кодирует неделями без остановки

Команда Cursor поделилась результатами своих экспериментов с автономными агентами, способными непрерывно работать над кодом в течение нескольких недель.

Источник события: Cursor AI Время чтения: 3 – 4 минуты

Разработчики Cursor поделились результатами своих экспериментов с автономными агентами для программирования. Если коротко: они запускали ИИ-помощников, которые работали над кодом самостоятельно в течение нескольких недель подряд.

Что значит «автономный» в данном случае?

Обычно мы представляем ИИ-помощников по программированию как инструменты, которые предлагают фрагменты кода или дописывают функцию по запросу. Вы пишете комментарий – он генерирует код. Вы нажимаете Tab – он подставляет нужную строку.

Здесь речь о другом формате. Агент получает задачу и дальше работает над ней сам: пишет код, тестирует, исправляет ошибки, разбирается в зависимостях, читает документацию. Человек в этот момент может вообще не участвовать. Агент работает днями или даже неделями, пока не решит задачу или не упрётся в ограничение.

Зачем вообще это нужно?

Есть задачи, которые требуют не столько интеллектуальной глубины, сколько времени и терпения. Например, рефакторинг большой кодовой базы, миграция на новую версию библиотеки, исправление множества мелких багов или написание тестов для устаревшего кода (legacy-кода).

Людям такая работа даётся тяжело: она монотонна, требует внимания к деталям, но не особо творческая. Если агент может взять это на себя и работать круглосуточно без усталости – это меняет экономику разработки.

Какие сложности возникают при таком подходе?

Запустить агента на пять минут – одно дело. Запустить на неделю – совсем другое. Появляются проблемы, которых нет в коротких сессиях:

  • Агент может уйти в сторону и начать решать не ту задачу.
  • Он может застрять в цикле: пытаться исправить одну и ту же ошибку снова и снова.
  • Контекст накапливается, и модель может начать «забывать» начальные условия.
  • Нужно научить агента понимать, когда стоит остановиться и попросить помощи, а когда – продолжать.

Cursor не раскрывает всех технических деталей, но упоминает, что работа над этими проблемами – ключевая часть их экспериментов. По сути, они пытаются создать систему, которая не просто выполняет команды, а умеет планировать, корректировать курс и оценивать результат.

Что это меняет для разработчиков?

Если такие агенты станут надёжными, это сильно изменит процесс работы. Не в смысле «заменят программистов» – скорее, сдвинут фокус. Вместо того чтобы писать каждую строку вручную, разработчик будет больше заниматься архитектурой, постановкой задач и проверкой результатов.

Проще говоря, роль человека сместится ближе к менеджменту и контролю качества, а рутинная реализация уйдёт к агентам. Это не отменяет необходимость понимать код – наоборот, требует более глубокого понимания, чтобы правильно направлять агента и оценивать его работу.

Насколько это реально сейчас?

Cursor называет это экспериментами, а не готовым продуктом. Это значит, что пока рано говорить о массовом внедрении. Скорее всего, агенты работают в контролируемых условиях, на специально подобранных задачах, с ограничениями по доступу к критичным системам.

Но сам факт, что агент может работать неделями, не ломаясь и не требуя постоянного вмешательства, – это серьёзный прогресс. Ещё год назад такое казалось далёкой перспективой.

Открытые вопросы

Остаётся много неясного. Например:

  • Насколько хорошо агент справляется с задачами, требующими понимания бизнес-логики?
  • Как он ведёт себя, когда сталкивается с неоднозначностью в требованиях?
  • Можно ли доверить ему работу с production-кодом (кодом, используемым в рабочем окружении) или пока это только для экспериментальных проектов?
  • Какова стоимость таких вычислений, если агент работает неделями?

Cursor пока не отвечает на эти вопросы публично. Возможно, потому что сами ещё разбираются.

Что дальше?

Вероятно, мы увидим больше подробностей в ближайшие месяцы. Если эксперименты окажутся успешными, Cursor может интегрировать часть этой функциональности в свой редактор.

Это не единственная команда, работающая в этом направлении. Devin, Sweep и другие проекты также исследуют автономных агентов для программирования. Cursor, учитывая их позицию на рынке и доступ к ресурсам, имеет хорошие шансы сделать это первыми в массовом продукте.

Пока же стоит наблюдать и готовиться к тому, что процесс разработки может измениться быстрее, чем мы ожидали.

Ссылка на публикацию: https://cursor.com/blog/scaling-agents
Оригинальное название: Scaling long-running autonomous coding
Дата публикации: 14 янв 2026
Cursor AIcursor.com Американский ИИ-редактор кода, помогающий разработчикам писать и анализировать программы.
Предыдущая статья Как упростить запуск ONNX-моделей на Windows с помощью WinML Следующая статья Как проверить точность модели пунктуации: практический метод от AMD

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

ИИ: События

Вам может быть интересно

Перейти ко всем событиям

Другие события из мира искусственного интеллекта, которые помогают увидеть общую картину и понять, как меняется направление развития технологий.

Hugging Face запустил Community Evals – платформу, на которой разработчики могут самостоятельно тестировать языковые модели и делиться результатами, не полагаясь на закрытые рейтинги.

Команда Perplexity AI продемонстрировала, как технология прямой передачи данных между серверами помогает языковым моделям работать быстрее и эффективнее, устраняя «узкие места» в сетевой инфраструктуре.

Разбираемся, как слой оркестрации помогает объединить разрозненные инструменты и сервисы в единую экосистему, способную работать без постоянного ручного контроля.

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться