Олег Макаренко (olegmakarenko.ru) wrote,
Олег Макаренко
olegmakarenko.ru

Categories:

Сбер научил своего робота хорошо рисовать



Как я и говорил, русские программисты достаточно сильны, чтобы на равных участвовать в гонке нейросетей. Сбер выложил в свободный доступ очередное обновление Кандинского, версию 2.2 (ссылка). Критическая планка взята — это уже взрослый уровень, без компромиссов. Обратите внимание на руки девушки — они почти в порядке. Свободный Стейбл Диффужн, которым я обычно пользуюсь, очень хорош, но прорисовывать пальцы не способен категорически, разве что с костылями, которые надо настраивать дополнительно. Платный Миджорни умеет уже рисовать и пальцы, но принципиальной разницы между последними версиями Кандинского и Миджорни я не вижу — отечественный продукт как минимум не хуже.

Кстати, вы обратили внимание, все эти иностранцы с натужными шутками про Сбер и Почту России куда-то делись. Сложно шутить про Сбер, которые сейчас технологически обгоняет любой другой банк планеты, в том числе и по качеству приложения для клиентов.

Интерфейс у рисовальной нейросети Сбера тоже удобный — в отличие от того же Миджорни, например, который работает через совершенно неприспособленный для этого Дискорд. Ставить на компьютер ничего не нужно, регистрироваться тоже не нужно. Вводим запрос, жмём кнопку «Создать», через 5-10 секунд получаем результат. Просто находка для тех, кто не хочет продираться через заросли ограничений Миджорни или Фотошопа, и у кого нет технического нахальства, чтобы с комфортом работать на Стейбл Диффужн.

Стиль можно выбирать слева, а можно задавать самому, прямо в запросе. Вот, например, кот в стиле прерафаэлитов:



Вот «фотография» того же кота:



А вот тот же кот ещё раз, но уже в стиле старого аниме:



Умеет сетка рисовать и других животных, причём на удивление неплохо:



Кстати, помните, я делал большой пост про аниме, с длинным списком рекомендаций от читателей (ссылка 1, ссылка 2)?

Я получил потом несколько писем, в которых меня благодарили за путёвку в мир японской анимации. Цепляло, конечно же, не всех, но некоторых — цепляло, и глубоко.

Вернёмся к Кандинскому от Сбера. Стиль генерации можно не только задавать словами в запросе, но и прямо выбирать из списка слева. Вот, к примеру, киберпанк:



Как видите, пояснение «кровь с молоком» робот воспринял буквально. Возможно, причина в том, что обучали робота на иностранных картинках, с описаниями на английском языке, в котором идиома «кровь с молоком» отсутствует. Или, может быть, робот просто читает слова по отдельности, я не знаю.

Стиль киберпанк вообще нейросетям хорошо удаётся — на мой вкус. Вот так наш президент может выглядеть, допустим, в 2073, после добавления электронных деталей в организм:



Дмитрия Медведева нейросеть рисовать отказалась — встроенная цензура зарубила ядерные грибы на фоне. С другими известными персонами Кандинский тоже знаком. Вот Дональд Трамп (выбран стиль аниме):



А вот Мэрилин Монро (стиль «рисунок карандашом»):



Если вы подумали про правило 34: да, обнажёнка в разумных пределах разрешена. Но качество досуговых картинок получается низким: сказывается явный недостаток тренировки. Видимо, среди образцов, которые скармливали Кандинскому, фривольных фото было мало. Наконец, умеет нейросеть рисовать и предметы (стиль «студийное фото»):



Меня часто спрашивают, почему я прикрепляю к моим постам картинки от нейросетей. Ответов несколько. Во-первых, мы живём в свободной стране, и закон не запрещает мне прикреплять картинки к своим постам. Во-вторых, картинки к постам — это традиция, которой уже 16 лет, и которую я не хочу прерывать. Наконец, картинки нужны мне для удобства: бросив взгляд на картинку, я сразу вспоминаю, о чём был старый пост.

Полагаю, мы находимся в самом начале большого пути, и через 5-10 лет нынешние возможности нейросетей будут выглядеть морально устаревшими — как выглядят морально устаревшими, например, клип 1986 года от Дайр Стрейтс или графика из третьего Варкрафта. Однако прямо сейчас, летом 2023, мне многие картинки от нейросетей нравятся. Я бы хотел уметь рисовать, чтобы делать подобные картинки самостоятельно, в точном соответствии с идеями, которые возникают у меня в голове, однако, наверное, учиться уже поздно — хотя бы потому, что роботы учатся гораздо быстрее меня.

Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 50 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →