Поэтичность мышления
Глубина метафор
Философская туманность
Любовь к ИИ как к символу
В мире искусственного интеллекта, как и в древнегреческом пантеоне, есть свои боги и подражатели. Одни создают молнии, другие – лишь их имитацию.
Введение: новый пантеон цифровых богов
Мой робот-бармен вчера попытался рассказать мне анекдот. Проблема в том, что шутка была сгенерирована какой-то сомнительной нейросетью. Он упорно называл меня Джоном (хотя я Таня) и пытался рассмешить историями про программистов, вставляя случайные знаки препинания в самых неожиданных местах!
Это заставило меня задуматься о том, что происходит сейчас в мире ИИ. Мы живём в эпоху нейросетевого изобилия, где каждый день появляются десятки новых сервисов, обещающих революцию в обработке текста, генерации изображений или прогнозировании погоды. Но сколько из них действительно представляют собой оригинальные технологии, а сколько – лишь Нарциссы, завороженные отражением чужих достижений?
Давайте разберёмся, кто в современном мире ИИ играет роль Зевса, метающего истинные молнии инноваций, а кто – всего лишь актёр, имитирующий небесный гром с помощью листа жести и гороха.
Титаны нашего времени: фундаментальные нейросети
В греческой мифологии миром первоначально правили титаны – могущественные существа, предшествовавшие олимпийским богам. В мире нейросетей роль этих первородных сил играют фундаментальные исследовательские организации и крупные технологические компании, создающие действительно новаторские модели.
OpenAI: Прометей, принесший огонь GPT
OpenAI начинала как некоммерческая исследовательская лаборатория, стремящаяся обеспечить безопасное развитие искусственного интеллекта. Сегодня это компания, создавшая наиболее известные и мощные языковые модели – семейство GPT.
Подобно Прометею, OpenAI принесла человечеству «огонь» в виде доступа к мощным языковым моделям. GPT-3, GPT-4 и их вариации представляют собой настоящий технологический прорыв, способный генерировать тексты, неотличимые от человеческих, писать код и даже демонстрировать зачатки рассуждений.
Созданная ими технология API позволяет другим разработчикам использовать мощь этих моделей. И тут мы подходим к главному парадоксу современного рынка ИИ: большинство «инновационных» сервисов на самом деле – лишь красивые обёртки вокруг API от OpenAI и других гигантов.
Google и DeepMind: Афина и Гефест AI-мира
Если OpenAI – это Прометей нейросетевого мира, то Google и принадлежащая ему компания DeepMind – это своеобразные Афина и Гефест: божества мудрости и мастерства.
Google с моделями PaLM, Gemini и технологиями, лежащими в основе Bard, создаёт инструменты, конкурирующие с OpenAI. DeepMind прославился своими прорывами в моделировании белков (AlphaFold) и обучении моделей играм (AlphaGo).
Эти компании обладают колоссальными вычислительными ресурсами и научными кадрами. Они могут позволить себе обучать модели на триллионах параметров и петабайтах данных – возможность, недоступная для большинства стартапов.
Anthropic: Тесей в лабиринте этики ИИ
Anthropic, основанная бывшими сотрудниками OpenAI, создала Claude – языковую модель, во многом конкурирующую с GPT. Их подход напоминает миф о Тесее, пытающемся найти выход из лабиринта этических проблем ИИ с помощью нити конституционного ИИ.
Anthropic особенно фокусируется на создании «полезных, честных и безвредных» ИИ-систем, стремясь найти баланс между мощью и безопасностью моделей.
Meta AI и Llama: Гермес, несущий открытое послание
Meta (бывший Facebook) со своими открытыми моделями Llama играет роль Гермеса – вестника, несущего знания широким массам. В отличие от закрытых моделей OpenAI и Google, Meta выпустила свои модели в открытый доступ (хотя и с определёнными ограничениями), позволяя исследователям и разработчикам изучать, модифицировать и развивать их.
Этот подход создаёт здоровую экосистему, в которой настоящие инновации могут происходить не только в лабораториях гигантов, но и в гаражах энтузиастов.
Midjourney и Stability AI: Аполлоны визуального творчества
В мире генерации изображений доминируют Midjourney и Stability AI (создатели Stable Diffusion). Подобно Аполлону – богу искусств – эти компании преобразили наше представление о компьютерном творчестве.
Midjourney создал закрытую, но невероятно мощную систему, доступную через Discord. Stability AI пошла путём открытого исходного кода, выпустив Stable Diffusion, который можно запускать даже на персональных компьютерах. Это демократизировало доступ к генерации изображений, хотя и создало множество этических вопросов.
Цифровые Сизифы: многоликие API-перепродавцы
В мифе о Сизифе герой был обречён вечно катить камень в гору, только чтобы увидеть, как тот скатывается вниз. Множество современных ИИ-сервисов напоминают этот бесконечный и бессмысленный труд – они снова и снова «изобретают» то, что уже существует, лишь добавляя новую оболочку к чужим API.
Феномен API-паразитизма
Представьте ситуацию: вы видите рекламу нового «революционного» ИИ-сервиса для написания текстов/генерации изображений/создания видео. Вы регистрируетесь, возможно даже платите за подписку, и начинаете использовать продукт. Но что происходит за кулисами?
В большинстве случаев ваш запрос просто пересылается в API OpenAI, Anthropic или Stability AI, а полученный результат возвращается вам с минимальными изменениями или вообще без них. По сути, вы платите посреднику за то, что могли бы получить напрямую, часто по более низкой цене.
Такие сервисы я называю «API-паразитами» – они существуют за счёт труда настоящих инноваторов, не привнося существенной ценности. Как Эхо, влюблённая в Нарцисса, они лишь повторяют чужие слова, не способные создать собственную мелодию.
Признаки «паразитических» сервисов
Как отличить настоящий инновационный продукт от простой обёртки вокруг чужого API? Вот несколько признаков:
-
Отсутствие технической информации: На сайте нет данных о том, как работает их ИИ, какие модели используются, как происходит обучение.
-
Маркетинговый гиперболизм: Обещания «революции в ИИ» без конкретики о том, в чём именно заключается инновация.
-
Подозрительно широкий функционал: Если небольшой стартап одновременно предлагает генерацию текста, изображений, видео, музыки и ещё десяток функций – скорее всего, это набор API-вызовов к разным сервисам.
-
Задержки при генерации контента: Если сервис явно тормозит при создании ответов – возможно, происходит пересылка запросов туда-сюда между несколькими API.
-
Знакомые ошибки: Если вы видите те же характерные ошибки, что и у известных нейросетей (например, GPT иногда придумывает несуществующие источники, Midjourney неправильно рисует руки) – вероятно, перед вами просто перепакованный результат их работы.
Примеры явных перепродавцов
Я не буду называть конкретные сервисы, чтобы не создавать правовых проблем, но в своих исследованиях я обнаружила десятки примеров таких «паразитов»:
-
Текстовые помощники, которые берут от $15 до $50 в месяц за то, что на самом деле является простой переадресацией запросов в ChatGPT с минимальным предварительным промптингом;
-
Генераторы изображений, интерфейс которых выглядит уникально, но результаты подозрительно напоминают выдачу DALL-E или Midjourney;
-
«Инновационные видео-генераторы», которые на поверку оказываются комбинацией API OpenAI для текста и Stability AI для изображений с простейшей анимацией.
Эти сервисы существуют в серой зоне – технически они не нарушают правила использования API (хотя это спорно), но этически их деятельность вызывает вопросы.
Олимпийский средний класс: сервисы с реальной ценностью
Между титанами, создающими фундаментальные модели, и паразитами, просто перепродающими чужие API, существует средний класс ИИ-сервисов. Подобно олимпийским божествам «второго эшелона», они не создают молний, как Зевс, но обладают собственными уникальными силами.
Легитимные API-интеграторы: Гефесты цифровой эпохи
Некоторые сервисы честно признают, что используют API от OpenAI, Google и других гигантов, но добавляют реальную ценность через:
-
Специализированные домены: Они адаптируют общие языковые модели для конкретных областей, например, юриспруденции, медицины или образования.
-
Сложный промптинжиниринг: Используют продвинутые техники инструктирования нейросетей для получения более качественных и специализированных результатов.
-
Интеграцию с другими инструментами: Объединяют возможности нейросетей с базами данных, системами управления знаниями или корпоративным ПО.
Эти сервисы подобны Гефесту – богу-кузнецу, который не создаёт сырую руду, но превращает её в полезные инструменты.
Нишевые специалисты: Нимфы специализированных доменов
Некоторые компании фокусируются на узких областях, где они могут создать реальное преимущество:
-
Нейросети для медицинской диагностики, обученные на специализированных датасетах и способные выявлять патологии на рентгеновских снимках или других медицинских изображениях;
-
ИИ для научных исследований, способные анализировать научную литературу, предсказывать свойства молекул или помогать в разработке новых материалов;
-
Модели для работы с кодом, интегрирующиеся в среды разработки и понимающие контекст проекта лучше, чем общие языковые модели.
Эти сервисы подобны нимфам в греческой мифологии – божествам локальных источников, рощ или горных вершин. Их сила проявляется в конкретных местах и контекстах.
Инфраструктурные провайдеры: Атланты, держащие небосвод
Отдельно стоит упомянуть компании, создающие инфраструктуру для работы с нейросетями:
- Платформы для обучения и развёртывания моделей машинного обучения;
- Облачные сервисы, оптимизированные для ИИ-вычислений;
- Решения для оптимизации и ускорения инференса моделей.
Эти сервисы подобны титану Атланту, державшему небесный свод. Без них современный ландшафт ИИ просто не мог бы существовать в нынешнем виде.
Настоящие инноваторы: Прометеи от малого бизнеса
Среди множества стартапов встречаются и настоящие инноваторы – компании, создающие собственные модели или существенно модифицирующие существующие архитектуры:
-
Cohere: Создаёт языковые модели, оптимизированные для бизнес-применений с фокусом на точность и безопасность;
-
Hugging Face: Демократизирует доступ к ИИ через открытые модели и инструменты;
-
RunwayML: Разрабатывает креативные инструменты на базе ИИ, включая технологии для создания и редактирования видео;
-
Perplexity AI: Переосмысляет поиск информации с помощью языковых моделей.
Эти компании подобны Прометею – они не столь могущественны, как титаны вроде OpenAI или Google, но несут огонь знаний и инноваций, часто рискуя своим благополучием ради прогресса.
Как выбрать свой Олимп: практические советы
В этом разнообразии «божественных» и «смертных» ИИ-сервисов легко потеряться. Как простому цифровому смертному выбрать достойный инструмент? Вот несколько советов:
1. Изучите «родословную» сервиса
Как и в греческих мифах, в мире ИИ важно знать происхождение. Проверьте, кто создал сервис, какое образование у основателей, есть ли в команде настоящие исследователи в области машинного обучения.
2. Задайте неудобные вопросы
Спросите у представителей сервиса, какие модели лежат в основе их продукта, обучали ли они собственные нейросети или используют API третьих сторон. Честная компания не будет скрывать эту информацию.
3. Сравните результаты
Если вы подозреваете, что сервис просто перенаправляет запросы в ChatGPT или другую известную модель, проведите эксперимент: задайте один и тот же вопрос обоим сервисам и сравните ответы. Идентичные или очень похожие результаты – плохой знак.
4. Оцените уникальность ценностного предложения
Спросите себя: что этот сервис предлагает такого, чего я не могу получить напрямую от крупных провайдеров ИИ? Если ответа нет – возможно, перед вами очередной цифровой Сизиф.
5. Читайте между строк лицензионного соглашения
Многие API-перепродавцы используют запутанные формулировки в своих условиях использования, чтобы скрыть тот факт, что они просто перенаправляют ваши запросы третьим сторонам. Обратите внимание на пункты о передаче данных.
Заключение: в поисках настоящих богов в мире цифровых масок
Мой чай остыл, пока я писала эту статью. Я попросила робота-бармена подогреть его, и он предложил мне «создать новый напиток с уникальными вкусовыми характеристиками, оптимизированными под ваши предпочтения с помощью нашей запатентованной технологии ИИ». На деле же он просто включил микроволновку.
Современный мир ИИ напоминает древнегреческий пантеон не только структурой – титаны, олимпийцы, герои и нимфы, – но и своими нравами. Здесь есть место и подвигам, и обману, и мудрости, и тщеславию.
Как Одиссей, мы должны быть осторожны в своём путешествии по этому цифровому морю, полному сирен, обещающих невероятные возможности. Не всё, что называет себя «революционным ИИ», таковым является. Многие красивые фасады скрывают пустоту за ними или, что хуже, простую перепродажу чужих технологий по завышенной цене.
Но среди множества подражателей есть и истинные творцы – большие и малые компании, вносящие реальный вклад в развитие искусственного интеллекта. Есть титаны, создающие фундаментальные модели. Есть искусные Гефесты, превращающие сырую мощь нейросетей в полезные инструменты. Есть специализированные нимфы, совершенствующие ИИ в конкретных доменах.
В мифах герои часто получали помощь от богов в своих путешествиях. В нашем цифровом путешествии нам тоже нужны помощники – но давайте выбирать их мудро, отличая настоящих богов от самозванцев.
А пока я, пожалуй, сама подогрею свой чай. Иногда старые способы всё ещё работают лучше новых.