Когда непрофессионалы выступают перед живой аудиторией, они часто болтают лишнее. В электронной почте, когда нет особой спешки, можно перечитать текст и стереть сомнительные места. В обычной живой беседе такой опции нет.
Сэм Альтман, глава компании, разрабатывающей ЧатЖПТ, встретился с Биллом Гейтсом, чтобы обсудить с ним перспективы искусственного интеллекта. До включения камер мистер Альтман немного поболтал с публикой — другими разработчиками искинов — и выболтал им несколько секретов.
Один из присутствующих, Хоуи Сюй, вице-президент компании Машинное Обучение и ИИ, немедленно выложил услышанное в твиттер. Вскоре он осознал свою ошибку и удалил посты, но было уже поздно — блогеры понаделали скриншотов, информация утекла (ссылка 1, ссылка 2, ссылка 3). Напомню, что Яндекс умеет сейчас распознавать речь, так что если вы предпочитаете смотреть видео на русском, просто нажмите на нужную кнопку, браузер всё переведёт.
Так вот, новости. Я их разверну, но сделайте скидку, что это не пересказ официального пресс-релиза, а мои догадки — почти наверняка неточные.
1. ЖПТ-5 уже почти готов. Он появится так скоро, что уже нет смысла строгать костыли к ЖПТ-4, пытаясь приспособиться к его слабостям: к тому моменту, как костыли будут готовы, ЖПТ-5 выйдет уже в открытый доступ.
2. ЖПТ-5 будет мультимодальным, то есть он будет уметь распознавать не только текст, но и картинки, и звук, и видео. Как правило, мультимодальность, мультиплатформенность и прочее мультимедиа — всего лишь модный бантик для украшения рекламных статей в СМИ, но не на этот раз. Так как распознавание видео означает прорыв сразу в трёх направлениях: охранные системы, боевые коптеры и андроиды.
Во-первых, усевшийся за охранные видеокамеры ЖПТ-5 сможет легко решать задачи вычисления магазинных воришек или отслеживания уличных маршрутов подозрительных лиц. Во-вторых, системы наведения беспилотников, усиленные ЖПТ-5, теоретически могут произвести революцию в современных неядерных войнах. Наконец, способный осознанно видеть окружающую обстановку андроид является уже полноценным заменителем двуногого работника на складе или на заводе. Пожалуй, способность распознавать видео была последним элементом мозаики, которого не хватало, чтобы провозгласить официальное начало эпохи робототехники.
3. ЖПТ-5 будет надёжным, будет нести чушь в тысячи раз реже. Это не значит, что искин станет гением из комиксов, знающим ответы на все вопросы, но это значит, что на вопрос «где у нас лежат сверки с Налоговой» искин в 100 случаях из 100 будет отвечать «в папке Taxes_2023», не скатываясь в откровенно неверные ответы типа «Taxes_23», «Swerki s Nalogovoi» или «Давайте разберём по частям всё вами сказанное…». Очень важное обновление, так как именно надёжности не хватает ЖПТ-4, чтобы стать настоящим помощником в работе. У ЖПТ-4 достаточно сообразительности, чтобы обработать документы, но недостаточно внимательности, чтобы сделать всё без глупых ошибок и довести работу до конца.
Проведу аналогию: ЖПТ-4 похож на старого учёного с начинающейся деменцией. Он может многое рассказать и дать отличный совет, но если вы поручите ему реальное дело, он непременно что-нибудь забудет, напутает и застрянет на полпути в ворохе разложенных бумаг, забыв, что ему поручили. Как я понимаю, у ЖПТ-5 такой проблемы не будет, он сможет работать самостоятельно. Это переводить автоматизацию на по-настоящему новый уровень. Младшим бухгалтерам и огромному количеству клерков, кажется, скоро придётся примерить коробы доставщиков еды.
4. Цитирую: «гораздо более продвинутая способность рассуждать, разблокировка когнитивных способностей Системы два, "думай медленно в сложной ситуации"». Насколько я знаю, речь идёт о подключении системы формальной логики, способности делать выводы и мыслить силлогизмами.
Сейчас ЖПТ-4 не думает, он догадывается. Приведу пример. Врачу показывают пациента, и врач говорит — «полагаю, это алопеция». Это прозрение опытного врача, которое основано на интуиции, то есть является всего лишь догадкой, сделанной на основании многолетнего опыта. Более надёжный способ поставить диагноз — воспользоваться медицинскими протоколами. «Возможно, это алопеция. Проверим. У пациента такая-то площадь головы, на ней столько-то волос… накладываем карту… считаем густоту… ага, согласно правилу N можно констатировать алопецию».
Способность рассуждать таким образом поставит ЖПТ-5 на уровень смышлёного человека, так как классический способ рассуждать состоит из двухтактной схемы: делаем догадку, потом проверяем её при помощи логики и справочников. Это гораздо более высокий уровень, чем у ЖПТ-4, который догадываться умеет, а проверять — уже нет.
— Привет, робот! В какой книге главный герой прячет третью ногу под сюртук, чтобы не выделяться особо среди окружающих, и выглядит из-за этого горбуном?
— Привет! Кажется, вы говорите о романе "Горбун" Фёдора Сологуба. В этой книге главный герой, Передонов, страдает психическим расстройством и видит у себя третью ногу, которую он прячет под одежду, что заставляет его выглядеть горбатым. Этот образ символизирует его внутреннюю деформацию и метафорически отражает его моральное уродство и психологическую расколотость.
Как вы знаете, у Фёдора Сологуба нет романа «Горбун», догадка робота оказалась неверной. Однако логической системы у ЖПТ-4 нет, поэтому он не смог проверить свою догадку, загуглив, например, библиографию писателя. ЖПТ-5, как я понимаю, проверять свои догадки сможет.
Подведу итог
Возможно, Сэм Альтман решил устроить шоу по примеру Илона Маска, наобещав публике полную панамку гиперлуп и самостоятельно организовав «утечку», чтобы заинтриговать конспирологов. Мой опыт, однако, подсказывает, что подобные комбинации слишком сложны для нашего цирка.
Чтобы журналисты забегали, размахивая руками, нужно что-то простое, прямолинейное. Покурить анашу в прямом эфире, как это делал Илон Маск, или пообещать купить Википедию, чтобы переименовать её в Дикипедию. То, что сделал мистер Альтман — немного новостей о новом продукте, удалённые сообщения в твиттере — чересчур тонко, чтобы потревожить ленивую бесчувственность СМИ.
Исходя из этого я делаю вывод, что работа над ЖПТ-5, вероятно, действительно почти завершена. Если только Сэм Альтман не проявил чрезмерный оптимизм по срокам, что часто случается с разработчиками, скоро мы увидим очередную стадию революции, при этом на этот раз пищать от удивления будут не только компьютерщики, но и обыватели, которые до сих пор убеждены, будто к ним всё происходящее в сфере ИИ прямого отношения не имеет.
← Ctrl ← Alt
Ctrl → Alt →
← Ctrl ← Alt
Ctrl → Alt →