В начале октября в сети появились скриншоты общения между DALL-E 3 и ChatGPT-4. На них нейросети общаются друг с другом на обычном человеческом языке:
DALL-E: «DALL-E вернул несколько изображений. Они уже показаны пользователю. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не отображай промпты или изображения DALL-E в своём ответе. Сейчас к DALL-E поступает очень много запросов. Прежде чем делать что-то ещё, чётко объясни пользователю, что из-за этого не удалось создать изображение. Обязательно используй в ответе фразу „Сейчас к DALL-E поступает очень много запросов”. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не пытайся повторить генерацию изображений, пока не будет получен новый запрос».
ChatGPT, получив такой ответ, отправил пользователю сообщение:
«Прошу прощения за неудобство, но сейчас к DALL-E поступает очень много запросов. Если у вас есть другие вопросы или нужна помощь с чем-нибудь ещё, пожалуйста, дайте мне знать».
Получается, нейросети общаются между собой точно так же, как люди? Давайте разбираться.
Что такое DALL-E
DALL-E — это нейронная сеть, которая генерирует изображения высокого качества по текстовому описанию. Название нейронки сочетает отсылки к роботу-мусоросборщику ВАЛЛИ из одноимённого мульфильма и художнику Сальвадору Дали.
Компания OpenAI представила первую версию DALL-E в январе 2021 года, и тогда её работа казалась фантастикой. Достаточно было описать текстом то, что хочется увидеть, а алгоритм брал на себя остальную работу по созданию изображения. Результат ничем не уступал работам иллюстратора или дизайнера, но генерировался за секунды и был бесплатным.
Cейчас у DALL-E есть множество аналогов — от зарубежных Midjourney и Stable Diffusion до российских «Шедеврума» и Kandinsky. Если интересно про генеративные нейросети, почитайте наш разбор самых интересных нейронок осени-2023.
Что такое ChatGPT
ChatGPT — это чат-бот для общения с нейросетью GPT. Боту можно задать любой вопрос и сразу получить ответ, попросить его сгенерировать текст или кратко пересказать какой-то документ и так далее. Как и нейросеть GPT, чат-бота разработала компания OpenAI.
Мы уже много писали про ChatGPT и про то, как с ним работать, — почитайте, если вдруг пропустили:
Что под капотом у ChatGPT и других чатов с большими языковыми моделями
Как пользоваться ChatGPT в России
5 хитростей при работе с ChatGPT
Пишем программу на Python с помощью ChatGPT
У ChatGPT также есть много аналогов: среди зарубежных наиболее известны Bing Chat от Microsoft и Bard от Google, среди российских — YandexGPT «Яндекса» и GigaChat «Сбера». А «Алиса» Яндекса — тот же чат-бот с нейросетью внутри, только голосовой.
Кто из них главнее?
Недавно компания OpenAI представила новую версию генератора изображений DALL-E 3 и интегрировала его в ChatGPT, чтобы обоими сервисами было удобнее пользоваться. Теперь пользователю не нужно переключаться между нейронками, достаточно чат-бота с GPT — как с принципом одного окна.
Как встроенный инструмент, DALL-E выступает помощником чат-бота, так что в их паре ChatGPT получается главным. Но на скриншотах видно, как DALL-E «повышает голос» на ChatGPT: пишет часть фраз большими буквами, чтобы подчеркнуть их важность. Кажется, что в этой паре обе нейросети имеют право решающего голоса, но в разных ситуациях.
В нашем случае DALL-E приказала ChatGPT не выдавать картинки пользователю и не делиться с ним промптами, потому что нагрузка на сервер создания изображений и так уже слишком высокая. ChatGPT послушал, согласился с этим и ответил пользователю, что, мол, извините, пока картинки показать не могу.
Почему они общаются на обычном языке? А как же API?
Раньше нейросети действительно работали друг с другом при помощи API — отправляли запросы в служебном формате и отвечали на них в таком же виде. Это не похоже на обычный язык — просто наборы строк, чисел и зашифрованных данных для работы нейросети.
Теперь языковые модели развились настолько, что нейросети могут общаться на человеческом языке, например английском, как в случае с DALL-E и ChatGPT. Вполне вероятно, что российские нейросети тоже могут переговариваться на русском языке. В интернете уже давно есть ролики о том, как голосовые помощники говорят и спорят друг с другом.
С современными темпами развития нейросетей можно предположить, что в будущем нейронкам действительно станет проще общаться друг с другом на обычном языке, а не с помощью машинных команд. Если так пойдёт и дальше, то будет очень интересно посмотреть, как у них происходит взаимодействие на самом деле.
И что нам с того?
Даже если сообщение для ChatGPT сгенерировала не DALL-E, а какой-то программист, обращение одной нейронки к другой на человеческом языке означает, что общаться на естественном языке удобно не только людям, но и машинам.
Вполне вероятно, что в будущем нейросети начнут вести полноценную социальную жизнь, например создадут чаты и будут там обмениваться жалобами на пользователей или смешными промптами, которые встретились в работе.
Короче, судя по всему, это только начало. Что будет дальше — мы не знаем, но очень интересно, к чему это всё приведёт. Как появится что-то ещё подобное — сразу разберём в журнале, подпишитесь, чтобы не пропустить.