GitHub объявил об изменениях в политике использования данных своего ИИ-ассистента Copilot. Если коротко, с 24 апреля то, что вы пишете в Copilot и что он отвечает, может использоваться для обучения и улучшения модели – если вы явно не откажетесь от этого.
Что именно изменится
Раньше данные пользователей Copilot Free, Pro и Pro+ по умолчанию не использовались для обучения модели. Теперь это правило меняется на противоположное: данные будут собираться, если пользователь сам не выберет опцию отказа.
Под «данными» здесь понимается то, что в документах называют interaction data – взаимодействие с ассистентом. Проще говоря: ваши запросы к Copilot, его ответы, фрагменты кода, которые вы отправляете или получаете, и контекст вокруг них. Это именно то, что модель «видит» во время работы с вами.
Изменение касается трёх уровней подписки: Copilot Free (бесплатный план), Copilot Pro и Copilot Pro+. Корпоративные планы – Copilot Business и Enterprise – в это обновление не входят, там условия традиционно более строгие.
Почему это стало стандартом, а не исключением
Это довольно распространённая практика в индустрии. Большинство ИИ-сервисов – и не только в сфере кода – используют пользовательские данные для улучшения своих моделей. Логика здесь понятна: реальные запросы от реальных людей – это ценнейший материал для обучения. Никакие синтетические наборы данных (датасеты) не заменят того, как люди реально формулируют задачи, какие ошибки допускают, как уточняют запросы.
GitHub в этом смысле движется в ту же сторону, что и другие игроки рынка. Разница лишь в том, что раньше у них по умолчанию стояло «не собирать», а теперь – «собирать, если не отказались». Такой подход называют opt-out – в отличие от opt-in, когда пользователь сам соглашается.
Это небольшое, но принципиальное различие. При opt-in большинство людей просто не замечает настройки и ничего не включает. При opt-out – ровно наоборот: данные идут в обучение у всех, кто не потрудился найти и выключить нужный тумблер.
Что делать, если вы не хотите делиться данными
Возможность отказаться остаётся. GitHub прямо указывает, что пользователи могут отключить передачу данных – для этого нужно найти соответствующую настройку в своём аккаунте. Где именно – это уже в интерфейсе GitHub, в разделе настроек приватности или Copilot.
Если вы работаете с чувствительным кодом – корпоративными проектами, закрытыми репозиториями, клиентскими данными – это стоит проверить заранее, до 24 апреля. После этой даты новая политика вступает в силу.
Почему это важно не только технически
Copilot – один из самых популярных ИИ-инструментов среди разработчиков. Им пользуются миллионы людей: от студентов до команд в крупных компаниях. Это значит, что даже небольшое изменение в политике данных затрагивает огромное количество людей.
С одной стороны, участие пользователей в улучшении модели – это своего рода взаимный обмен: ты помогаешь обучить инструмент, инструмент становится лучше для тебя и других. С другой – далеко не все готовы, чтобы их код, даже в обезличенном виде, куда-то уходил. Особенно если речь идёт о коммерческих проектах.
Пока открытым остаётся вопрос о том, насколько эффективно пользователи смогут находить настройку отказа и пользоваться ею. Практика показывает, что большинство людей не читает уведомления об изменениях политики и не меняет настройки по умолчанию – а значит, на обучение пойдут данные большинства.
Это не катастрофа и не скандал – просто важная деталь, о которой стоит знать. Если вам всё равно – ничего делать не нужно. Если нет – теперь вы знаете, что проверить.