Как я и говорил, русские программисты достаточно сильны, чтобы на равных участвовать в гонке нейросетей. Сбер выложил в свободный доступ очередное обновление Кандинского, версию 2.2 (ссылка). Критическая планка взята — это уже взрослый уровень, без компромиссов. Обратите внимание на руки девушки — они почти в порядке. Свободный Стейбл Диффужн, которым я обычно пользуюсь, очень хорош, но прорисовывать пальцы не способен категорически, разве что с костылями, которые надо настраивать дополнительно. Платный Миджорни умеет уже рисовать и пальцы, но принципиальной разницы между последними версиями Кандинского и Миджорни я не вижу — отечественный продукт как минимум не хуже.
Кстати, вы обратили внимание, все эти иностранцы с натужными шутками про Сбер и Почту России куда-то делись. Сложно шутить про Сбер, которые сейчас технологически обгоняет любой другой банк планеты, в том числе и по качеству приложения для клиентов.
Интерфейс у рисовальной нейросети Сбера тоже удобный — в отличие от того же Миджорни, например, который работает через совершенно неприспособленный для этого Дискорд. Ставить на компьютер ничего не нужно, регистрироваться тоже не нужно. Вводим запрос, жмём кнопку «Создать», через 5-10 секунд получаем результат. Просто находка для тех, кто не хочет продираться через заросли ограничений Миджорни или Фотошопа, и у кого нет технического нахальства, чтобы с комфортом работать на Стейбл Диффужн.
Стиль можно выбирать слева, а можно задавать самому, прямо в запросе. Вот, например, кот в стиле прерафаэлитов:
Вот «фотография» того же кота:
А вот тот же кот ещё раз, но уже в стиле старого аниме:
Умеет сетка рисовать и других животных, причём на удивление неплохо:
Кстати, помните, я делал большой пост про аниме, с длинным списком рекомендаций от читателей (ссылка 1, ссылка 2)?
Я получил потом несколько писем, в которых меня благодарили за путёвку в мир японской анимации. Цепляло, конечно же, не всех, но некоторых — цепляло, и глубоко.
Вернёмся к Кандинскому от Сбера. Стиль генерации можно не только задавать словами в запросе, но и прямо выбирать из списка слева. Вот, к примеру, киберпанк:
Как видите, пояснение «кровь с молоком» робот воспринял буквально. Возможно, причина в том, что обучали робота на иностранных картинках, с описаниями на английском языке, в котором идиома «кровь с молоком» отсутствует. Или, может быть, робот просто читает слова по отдельности, я не знаю.
Стиль киберпанк вообще нейросетям хорошо удаётся — на мой вкус. Вот так наш президент может выглядеть, допустим, в 2073, после добавления электронных деталей в организм:
Дмитрия Медведева нейросеть рисовать отказалась — встроенная цензура зарубила ядерные грибы на фоне. С другими известными персонами Кандинский тоже знаком. Вот Дональд Трамп (выбран стиль аниме):
А вот Мэрилин Монро (стиль «рисунок карандашом»):
Если вы подумали про правило 34: да, обнажёнка в разумных пределах разрешена. Но качество досуговых картинок получается низким: сказывается явный недостаток тренировки. Видимо, среди образцов, которые скармливали Кандинскому, фривольных фото было мало. Наконец, умеет нейросеть рисовать и предметы (стиль «студийное фото»):
Меня часто спрашивают, почему я прикрепляю к моим постам картинки от нейросетей. Ответов несколько. Во-первых, мы живём в свободной стране, и закон не запрещает мне прикреплять картинки к своим постам. Во-вторых, картинки к постам — это традиция, которой уже 16 лет, и которую я не хочу прерывать. Наконец, картинки нужны мне для удобства: бросив взгляд на картинку, я сразу вспоминаю, о чём был старый пост.
Полагаю, мы находимся в самом начале большого пути, и через 5-10 лет нынешние возможности нейросетей будут выглядеть морально устаревшими — как выглядят морально устаревшими, например, клип 1986 года от Дайр Стрейтс или графика из третьего Варкрафта. Однако прямо сейчас, летом 2023, мне многие картинки от нейросетей нравятся. Я бы хотел уметь рисовать, чтобы делать подобные картинки самостоятельно, в точном соответствии с идеями, которые возникают у меня в голове, однако, наверное, учиться уже поздно — хотя бы потому, что роботы учатся гораздо быстрее меня.
← Ctrl ← Alt
Ctrl → Alt →
← Ctrl ← Alt
Ctrl → Alt →