
Плакат для экопарка «Цепкий хобот» нейросеть нарисовала точно по моему описанию, за один раз. Лучше живого художника, так как кожаный художник десять раз переспросил бы, потом позвонил бы голосом, потом бы всё равно что-нибудь напутал, а потом недовольно сопел бы в ответ на мою терпеливую реплику «сделайте, пожалуйста, так, как написано в техническом задании». Кстати, последний раз, когда мне надо было нарисовать нечто подобное, у меня был бюджет в 100 тысяч рублей, и… я не смог найти исполнителя: двое художников-фрилансеров нужного мне уровня вначале взяли было заказ, но потом по очереди кормили меня завтраками на протяжении двух-трёх месяцев, так что в итоге я потерял терпение, и задача ушла в архив.
На днях случилось нечто тектоническое. Гугловская нейросеть «Джемини 2.5 Про» обошла в рейтинге разумности прошлого лидера от компании ОпенАИ (ссылка). Цитирую: «на арене по всем языкам и почти по всем срезам модель [от Гугла] впереди, зачастую — с отрывом».
Гонка идёт напряжённая, ставки высоки. Проигрывать ОпенАИ не хочет — зарезервированные бюджеты приближаются к сотням миллиардам долларов, если не к триллионам, и у ОпенАИ нет надёжного тыла в виде гигантской корпорации за спиной. Поэтому ОпенАИ ничего не оставалось делать, кроме как выложить на стол приберегаемый козырь: говорящий Фотошоп. Теперь роботу можно просто сказать, что надо сделать, и он через минуту-другую выдаст готовый, не нуждающийся в доработке напильником результат. Качество — четыре с плюсом или пять с минусом, то есть на уровне крепких рекламных агентств с адекватными бюджетами.
Вот запрос, по которому робот выдал мне приложенный к посту плакат со слоном:
Привет, бро! Нарисуй, пожалуйста, предупреждающий плакат. Надпись на плакате: «Хищные слоны! Носите свисток!». Изображение: беспечная красивая девушка, легко одетая, подверглась нападению небольшого двуногого слона. Двуногий слон схватил её и готовится укусить. Девушка отбивается, но тщетно, силы явно неравны. Фон: парк
Как видите, задание выполнение точно, придраться не к чему. И, продолжая тему изготовления рекламы, вот как робот отрабатывает стандартный клиентский заказ на рекламный баннер:
Нарисуй, пожалуйста, рекламный плакат для ларька с шавермой. Вот чтобы красивая девушка, вкусная шаверма, курица где-нибудь и надпись «Нет вкусней шавермы, чем от птицефермы». Всё должно быть весёлым там, сочным, радостным, даже солнечным.

Это был ваншот — попадание в цель с первого выстрела. Можно немного позанудничать и сказать, что у плаката разрешение всего лишь 1000х1500 пикселей, чего мало для качественной печати, но это, во-первых, решаемая проблема, а во-вторых, сейчас всё равно деловая жизнь мигрирует в интернет. Для интернета такого разрешения достаточно (а для поста мне даже пришлось уменьшить картинки — увеличенные версии открываются по щелчку мыши).
Делать фотографии робот тоже может:
Нарисуй, пожалуйста, молодого Дональда Трампа в красной советской спортивной форме. Форма выглядит как красные шорты и красная футболка с круглым вырезом и короткими рукавами. Футболку опоясывает тонкая белая полоса, под круглым вырезом идут дугой буквы «СССР» (кириллицей). Дональд Трамп в хорошей физической форме и довольно улыбается. Фон — видавшая виды стена тренажёного зала с облупившейся шведской стенкой.

Тут робот был менее точен. Я просил белую полосу на футболке, а он сделал вместо этого белый пояс у шорт. Уровень понимания технического задания всё ещё не идеален (хотя и значительно лучше, чем у кожаных исполнителей). Но некоторые вещи при этом робот не умеет делать принципиально, сколько ему ни объясняй. Вот, например, торт-Юпитер:
Привет, бро! Нарисуй, пожалуйста, большой торт в виде планеты Юпитер, лежащий в круглой никелированной чаше на длинной ножке. Диаметр чаши подобран таким образом, что торт помещается в неё без зазора, как бы вырастает из неё, является её продолжением. Слева от торта стоит толстый мужчина в белом халате учёного, у мужчины зачёсанные назад седые волосы и тонкие гангстерские усы. Справа от торта стоит крепкая молодая румынка в синем обтягивающем комбинезоне пилота и в серых облегающих сапогах без фурнитуры. И учёный, и женщина-пилот держат в руках длинные ложки. Они улыбаются, предвкушая, как будут сейчас есть торт-Юпитер. Фон — стена космического корабля с большим иллюминатором, за иллюминатором — звёздное небо. Стиль: фотореализм.

Я предпринял несколько попыток, но мне так и не удалось заставить робота плотно уложить в чашу торт-шар: робот каждый раз оставлял зазор между стенками чаши и тортом.
Улучшать и дополнять фотографии робот может, но с некоторым искажением сюжетов и лиц. Сравните, например:

Возьми, пожалуйста, Ивана Грозного (приложен) более отдалённым планом, по пояс. Также добавь текстом восклицание: «Мало!», которое произносит суровый царь. Используй стилизованный псеводстарославянский шрифт.

На малознакомых моделях кажется, будто попадание идеальное — молодой Дональд Трамп и актёр Иван Черкасов (игравший Ивана Грозного) выглядят для меня в отрисованной версии как настоящие. Однако если вы попробуете прогнать через нейросеть фотографию более близкого вам человека, разницу вы заметите.
А вот ещё один Иван Грозный, но уже не фотореалистичный, а перерисованный по моей просьбе в модном стиле Ghibli. Было-стало:


Можно сделать и обратное превращение, из мультфильма в фотографию. Например:
Привет, бро. На приложенной картинке нарисованы трое животных. Переделай, пожалуйста, картинку в фото. Животные должны остаться шарообразными, то есть быть более-менее строгими мохнатыми шарами на ножках, вот как на картинке, только настоящими, реалистичными, как будто их сфотографировали в реальном мире. У животных при этом должны быть четыре конечности: «ноги» и «руки».
Обрати внимание, что у Нюши, которая сидит, четыре нормальных свиных ноги, которые заканчиваются копытами. У зайца и ежа «ноги» немного отличаются от «рук»


Тут мне пришлось уже сделать 4-5 подходов, так как нейросеть путалась с количеством ног. В итоге я прописал задание более чётко, и робот справился…
* * *
Впервые я увидел компьютерную лабораторию в 1986: мне было 8 лет, и мой отец, программист, привёл меня к себе на работу, чтобы дать практический урок программирования на Фортране. На стене одного из шкафов висел плакат с примитивным изображением, распечатанный на текстовой псевдографикой на быстром принтере. Подобные плакаты, уже пожухлые, висели на шкафах и в середине 1990-х, когда я уже закончил школу и сам устроился работать программистом. Дальше псевдотекст сменился на чёрно-белые картинки с офисным юмором, самым популярным из которых был плакат «Не сдавайся!» — с лягушкой и цаплей. Некоторые раскрашивали его карандашами: лягушку зелёным, нос цапли — красным. Ещё позже офисный люд начал печатать демотиваторы, зачастую сразу в цвете, так как цветные принтеры перестали быть экзотикой.
Теперь плакаты можно уже не только скачивать из интернета в готовом виде, но и делать самому. Например:
Давай сделаем мотивирующий плакат. На плакате — брутального вида лысый волк со шрамом. Он одет в кожаную куртку, спортивные штаны и стильные кроссовки, всё темных оттенков. Волк похож на актёра Джейсона Стетхема.
Рекламный слоган: «От лысых в комнате светлее»

Комиксы робот рисует… своеобразно. Скажу мягко — робот уже умеет делать комиксы, однако продукция нейросети требует пока что существенной доработки. Вот, например, я скормил роботу первые три строфы «Евгения Онегина» и попросил нарисовать чёрно-белый комикс на предложенный сюжет:

Картинки — в порядке, даже хороши, хоть робот и поленился вникнуть в суть происходящего. А вот над текстом надо серьёзно работать: или прописывать роботу задание более чётко, или править текст в редакторе самостоятельно.
Вместе с тем тут есть серьёзное ограничение — одна страница. Когда робот последовательно рисует несколько страниц, получается хуже. Дадим, к примеру, нейросети задание изобразить три кадра для будущей новеллы:
Давай рисовать комикс. Первый кадр (широкоэкранное соотношение сторон) — симпатичная аргонианская дева в костюме горничной убирает комнату в богатом доме. На стуле в ожидании конца уборки сидит дворянин, хомо сапиенс: гладко выбритый, в стильной домашней одежде.

Мне приходилось видеть и более симпатичных аргонианок — более приветливых как минимум — но допустим. Попытаемся продолжить.
Давай следующий кадр: действующие лица те же. Что-то происходит, и начинается лёгкий флирт: персонажи что-то друг другу говорят. Что именно — придумай сам.

Теперь третий кадр. Аргонианке явно нравится внимание хозяина, но она боится, что жена дворянина может застать их в неловком положении. Дворянин проявляет игривую настойчивость

С текстом всё ясно — тут робот растерян, текст надо просто переписывать заново. Ничего сложного, так как речевые пузыри уже есть. Однако обратите внимание на одежду. На дворянине теперь тёмная рубашка вместо светлой, а девушка сменила глухое платье на платье с неглубоким квадратным вырезом. Также у дворянина слегка потемнело лицо, что, впрочем, можно списать или на прилив крови, или на смену ракурса.
Возможно, хорошей повторяемости персонажей можно добиться, если детально описывать их облик, вплоть до каждого элемента одежды. Не уверен. Мне кажется, что пока просто рано: технология ещё не дозрела, надёжную генерацию комиксов мы увидим только в следующих версиях нейросети. Вот что у робота получается отлично уже сейчас, так это обложки. Например:
Нарисуй, пожалуйста, обложку комиксов в стиле 1960-х. Сюжет — приключения бродячей театральной труппы разумных обезьян

Ещё одним практичным применением могут стать инструкции. Они, как и комиксы, нуждаются в доработке напильником или в более подробном техническом задании — робот не всегда правильно улавливает идею заказчика с первой попытки:
Нарисуй иллюстрированный ризограф для дебилов с инструкцией как варить пельмени

Наконец, мощнейший инструмент обрели разработчики: создатели сайтов, видеоигр, приложений для смартфонов и тому подобного. Вот, к примеру, ещё один ваншот — идеальное выполнение поставленной задачи с первой попытки:
Привет, бро! Я собираюсь написать книгу про вымышленную расу круглоков. Сгенерируй мне, пожалуйста, круглокский алфавит. Он должен состоять из пиктограмм, каждая из которых проста в изображении и похожа скорее на стилизованный предмет материального мира (собака, облако, гора, стрела), нежели на букву или иероглиф. Пиктограммы должны быть причастны округлости, но могут иметь, там где это уместно по смыслу, и острые фрагменты.

Полагаю, всем ясно, что вышедшая на рынок киберкисть сделает с профессиональными дизайнерами среднего и низшего уровней мастерства. Однако из новостей можно сделать ещё два важных вывода — уже неочевидных.
1. Под каток роботизации попадут не только рисовальщики упаковки для печенья, но и художники-примитивисты, звёзды Рунета. Эстеты могут возражать, но я настаиваю: исполнительский уровень модных профессионалов примерно соответствует уровню робота, массовая аудитория разницы не ощутит. При этом их идеи (сюжеты, текст) — значительно слабее, чем идеи от огромного сообщества. Ничего личного, просто статистика: 10 тысяч простых пользователей породят значительно более смешной и цепляющий сюжет, чем один комиксёр.
2. Мы разглядываем сейчас яркую оболочку — сидим в восхищении среди бус и маленьких зеркал. Однако следует помнить, что новую игрушку ОпенАИ выкатил нам не просто так, а в ответ на технологический прорыв от Гугла, в ответ на новую думающую модель. Роботы становятся умнее, и последствия роста их интеллекта (да-да, уже интеллекта) будут такими, что мало не покажется никому.
Ну а пока технологический апокалипсис или технологическая сингулярность ещё не наступили, у нас есть время, чтобы порадоваться новым возможностям. Я чувствую себя как больной мутизмом, который долгие годы был вынужден теснить яркие образы внутри черепа, а потом обрёл способность говорить и, наконец-то, может поделиться своими мыслями. Мы избалованы прогрессом, однако это ведь настоящее чудо: объясняешь роботу, что нарисовать, а робот… рисует. Например:
* * *
Нарисуй, пожалуйста, рекламный постер. На картинке красивая молодая девушка с чёрными волосами в стальных доспехах с бордовой поддёвкой, тёмными глазами и меховым воротником. Женщина-воин держит в руке четвероногое животное (питомца), зелёного гоблина. На фоне — вход в пещеру с вывеской «Мир гоблинов» кривым гоблинским шрифтом. Женщина-воин выглядит счастливой, её новый питомец недоумевает, так как он пока ещё не понял, что произошло.
Мотивирующая надпись на постере (снизу): «Выбирай самого толстого и крикливого!»

* * *
Нарисуй, пожалуйста, двухголового мужчину. Одна голова Карл Маркс, вторая голова — Фридрих Энгельс. Мужчина широкоплеч (так как головы должны откуда-то расти). Он одет в сюртук и брюки. Мужчина имеет свирепые, пугающие выражения лиц. В руках он держит окровавленные серп и молот. Мотивирующая надпись на плакате (на русском языке): «Твоя собственность — это кража»

* * *
Карточный стол. Играют суровый мужчина в видавшем виды чиненом сером ватнике и лощёный рептилоид. Ставки очень высоки, в воздухе чувствуется напряжение. Мужчина коротко стрижен, русые волосы, небольшой шрам, тяжёлый подбородок. Кроме ватника мужчина носит серые военные брюки и вычищенные до блеска чёрные сапоги. Рептилоид жирен, но изящен, дорого одет, носит огромный перстень с рубином. На фоне — стена казино, на стене висит средних размеров карта мира. Широкоэкранное соотношение сторон.

* * *
Привет, бро. Нарисуй, пожалуйста, учительницу литературы в стиле Anne-Louis Girodet. Это молодая женщина, только после института. Она носит строгие очки, её чёрные волосы зачёсаны назад. Макияж естественный, его почти незаметно. Учительница сидит за столом (мы смотрим немного сверху), на столе хаотично лежат тонкие зелёные тетради учеников, пара шариковых ручек, указка, учебник, книга Пушкина. Учительница выглядит милой, но серьёзной и сосредоточенной. Её освещает яркий солнечный свет из окна, которое расположено где-то сбоку, за кадром. Настроение: весна

* * *
Нарисуй, пожалуйста. Женщина-собака, одетая в строгое офисное платье, сидит за обеденным столом, мордой к нам. Перед ней стоит тарелка с небольшим ломтем сырого мяса. Из-за края кадра (с нашей стороны) высовывается рука кролика, который предлагает женщине-собаке морковку. Женщина-собака отказывается от морковки характерным жестом поднятой ладони.

* * *
Рисунок цветными шариковыми ручками (четыре цвета): американский заднеприводный легковой автомобиль из разряда тех, которые привлекают внимание на улице. На заднем фоне, за машиной, тоже шариковыми ручками, но слабыми штрихами: огромное призрачное лицо подростка. Суть идеи картинки: подросток мечтает об автомобиле.

* * *
Средней упитанности женщина в открытом летнем платье сидит на табуретке и с интересом смотрит на лежащее в тарелке желеобразное пирожное в виде круглой птицы. Пирожное опасливо смотрит на женщину: пирожное понимает, что оно съедобно, поэтому ему немного страшно.

* * *
Помните, как вы ругали в комментариях ИИ-картинки, а я терпеливо отвечал: «Подождите год»? Мне кажется, ожидание было не напрасным.
PS. Если я невольно прогрел вас на подключение к роботу, и вы хотите попробовать нарисовать что-нибудь самостоятельно, то я знаю на сегодняшний день только один способ это сделать. Надо найти американский прокси или ВПН (именно американский), зарегистрироваться на chatgpt.com и оплатить 20 долларов за месячную подписку. Оформить это из России можно в пару кликов, но ссылки на конкретные сервисы я не дам: они или находятся в серой зоне, или требуют определённой технической подготовки, так что разбирайтесь с ними на свой страх и риск.