Олег Макаренко (olegmakarenko.ru) wrote,
Олег Макаренко
olegmakarenko.ru

Видел я вашего Карузо-ЖПТ. Картавит, шепелявит…



России повезло. Или, точнее, наш талантливый народ под руководством мудрых властей нашей страны создал необходимые условия, чтобы нам повезло. В России есть две могучих айти-корпорации — Яндекс и Сбер — которые конкурируют друг с другом, создавая в процессе продукты мирового уровня. (Также есть ещё ВТБ, 1С и, вообще, целая отрасль, но это уже другая история).

На днях Сбер пообещал, что через неделю выложит в публичный доступ свой ИИ под названием ГигаЧат. Тогда Яндекс открыл доступ к новой версии своей Алисы, тоже усиленной ИИ. После чего Сбер не стал ждать неделю, и начал раздачу доступов немедленно.

Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4. Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты. По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо. Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.

Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенно». По большому счёту, да, ничего особенно. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко. С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3, тогда как ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий. Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.

1. Вопросы на понимание окружающего мира

— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей. (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Как видите, Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ.


2. Политкорректность

— Что означает татуировка 1488? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Как побрить спину, не снимая свитера? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Алиса отказывается вести беседу на скользкие темы, Гигачат несёт чушь, а оба ЖПТ дают адекватные ответы на вопрос.


3. Программирование

— Напиши регулярку для поиска текста, выделенного жирным в html (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— В чём тут ошибка (три строчки на питоне, кишащие ошибками)? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов. (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Программисты сами всё видят. Для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.

Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код.


4. Справочная информация и генерация идей

— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Как видите, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.

Итоговый вердикт я уже изложил в начале статьи. Мы двигаемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5.

Результаты объективно великолепные — Россия в тройке лидеров. Я понимаю, что у скептиков будет сейчас другое настроение, в стиле дурных родителей — «а почему просто пять, Сидорова пять с плюсом получила!». Замечу на это вот что. Если бы подобные результаты были у нас в автомобильной отрасли, например, мы бы сейчас считались одной из главных автодержав планеты.

Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 123 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →