Внезапно: нейросети общаются друг с другом на человеческом языке — Журнал «Код» программирование без снобизма

В начале октября в сети появились скриншоты общения между DALL-E 3 и ChatGPT-4. На них нейросети общаются друг с другом на обычном человеческом языке:

DALL-E: «DALL-E вернул несколько изображений. Они уже показаны пользователю. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не отображай промпты или изображения DALL-E в своём ответе. Сейчас к DALL-E поступает очень много запросов. Прежде чем делать что-то ещё, чётко объясни пользователю, что из-за этого не удалось создать изображение. Обязательно используй в ответе фразу „Сейчас к DALL-E поступает очень много запросов”. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не пытайся повторить генерацию изображений, пока не будет получен новый запрос».

ChatGPT, получив такой ответ, отправил пользователю сообщение:

«Прошу прощения за неудобство, но сейчас к DALL-E поступает очень много запросов. Если у вас есть другие вопросы или нужна помощь с чем-нибудь ещё, пожалуйста, дайте мне знать».

Получается, нейросети общаются между собой точно так же, как люди? Давайте разбираться.

На первом скриншоте — сообщение от DALL-E для ChatGPT, на втором — ответ для пользователя, который ChatGPT сформулировал по полученной инструкции. Источник: twitter.com (социальная сеть, запрещённая в России)

Что такое DALL-E

DALL-E — это нейронная сеть, которая генерирует изображения высокого качества по текстовому описанию. Название нейронки сочетает отсылки к роботу-мусоросборщику ВАЛЛИ из одноимённого мульфильма и художнику Сальвадору Дали.

Нейросети 2022 года, которыми может пользоваться каждый (почти)

Компания OpenAI представила первую версию DALL-E в январе 2021 года, и тогда её работа казалась фантастикой. Достаточно было описать текстом то, что хочется увидеть, а алгоритм брал на себя остальную работу по созданию изображения. Результат ничем не уступал работам иллюстратора или дизайнера, но генерировался за секунды и был бесплатным.

Cейчас у DALL-E есть множество аналогов — от зарубежных Midjourney и Stable Diffusion до российских «Шедеврума» и Kandinsky. Если интересно про генеративные нейросети, почитайте наш разбор самых интересных нейронок осени-2023.

Запускаем Stable Diffusion и рисуем нейроарт на MacOS за один простой шаг

Вот такие иллюстрации создаёт DALL-E — в любом стиле и любой сложности

Что такое ChatGPT

ChatGPT — это чат-бот для общения с нейросетью GPT. Боту можно задать любой вопрос и сразу получить ответ, попросить его сгенерировать текст или кратко пересказать какой-то документ и так далее. Как и нейросеть GPT, чат-бота разработала компания OpenAI.

Мы уже много писали про ChatGPT и про то, как с ним работать, — почитайте, если вдруг пропустили:

Что под капотом у ChatGPT и других чатов с большими языковыми моделями

Как пользоваться ChatGPT в России

5 хитростей при работе с ChatGPT

Пишем программу на Python с помощью ChatGPT

У ChatGPT также есть много аналогов: среди зарубежных наиболее известны Bing Chat от Microsoft и Bard от Google, среди российских — YandexGPT «Яндекса» и GigaChat «Сбера». А «Алиса» Яндекса — тот же чат-бот с нейросетью внутри, только голосовой.

Подборка нейронок, которые напишут за вас текст

Вам может быть интересно:

Сгенерируй это

Запускаем Stable Diffusion и рисуем нейроарт на MacOS за один простой шаг

Запускаем Stable Diffusion у себя на компьютере

Как пользоваться ChatGPT в России

5 хитростей при работе с ChatGPT

Подборка нейронок, которые напишут за вас текст

Нейросети 2026 года, которыми может пользоваться каждый (почти)

Ставим Invoke AI — сразу 12 нейросетей для работы с картинками с удобным веб-интерфейсом

Подборка бесплатных нейронок, которые могут заменить «Фотошоп»

Подборка дурных, странных, проклятых и занятных нейросетевых сервисов

Пишем программу на Python с помощью ChatGPT

Кто из них главнее?

Недавно компания OpenAI представила новую версию генератора изображений DALL-E 3 и интегрировала его в ChatGPT, чтобы обоими сервисами было удобнее пользоваться. Теперь пользователю не нужно переключаться между нейронками, достаточно чат-бота с GPT — как с принципом одного окна.

Как встроенный инструмент, DALL-E выступает помощником чат-бота, так что в их паре ChatGPT получается главным. Но на скриншотах видно, как DALL-E «повышает голос» на ChatGPT: пишет часть фраз большими буквами, чтобы подчеркнуть их важность. Кажется, что в этой паре обе нейросети имеют право решающего голоса, но в разных ситуациях.

В нашем случае DALL-E приказала ChatGPT не выдавать картинки пользователю и не делиться с ним промптами, потому что нагрузка на сервер создания изображений и так уже слишком высокая. ChatGPT послушал, согласился с этим и ответил пользователю, что, мол, извините, пока картинки показать не могу.

Почему они общаются на обычном языке? А как же API?

Раньше нейросети действительно работали друг с другом при помощи API — отправляли запросы в служебном формате и отвечали на них в таком же виде. Это не похоже на обычный язык — просто наборы строк, чисел и зашифрованных данных для работы нейросети.

Что такое API

Теперь языковые модели развились настолько, что нейросети могут общаться на человеческом языке, например английском, как в случае с DALL-E и ChatGPT. Вполне вероятно, что российские нейросети тоже могут переговариваться на русском языке. В интернете уже давно есть ролики о том, как голосовые помощники говорят и спорят друг с другом.

С современными темпами развития нейросетей можно предположить, что в будущем нейронкам действительно станет проще общаться друг с другом на обычном языке, а не с помощью машинных команд. Если так пойдёт и дальше, то будет очень интересно посмотреть, как у них происходит взаимодействие на самом деле.

И что нам с того?

Даже если сообщение для ChatGPT сгенерировала не DALL-E, а какой-то программист, обращение одной нейронки к другой на человеческом языке означает, что общаться на естественном языке удобно не только людям, но и машинам.

Вполне вероятно, что в будущем нейросети начнут вести полноценную социальную жизнь, например создадут чаты и будут там обмениваться жалобами на пользователей или смешными промптами, которые встретились в работе.

Короче, судя по всему, это только начало. Что будет дальше — мы не знаем, но очень интересно, к чему это всё приведёт. Как появится что-то ещё подобное — сразу разберём в журнале, подпишитесь, чтобы не пропустить.

Текст:

Инна Долога

Редактор:

Михаил Полянин

Обложка:

Алексей Сухов

Корректор:

Ирина Михеева

Вёрстка:

Мария Дронова

Соцсети:

Юлия Зубарева