Обзор новостей в сфере ИИ: 29 мая 2026 г

Скотт Ву из компании Cognition утверждает, что агенты искусственного интеллекта, занимающиеся программированием, не должны заменять людей ↗

Скотт Ву из Cognition опроверг идею о том, что Devin создан для полной замены программистов. Это несколько неуместная позиция, учитывая, что компания также заявляет о том, что Devin использует значительную часть собственного кода.

Его формулировка больше похожа на «помощь в программировании ИИ», чем на «вашу работу съел ноутбук-гоблин». Тем не менее, напряжение трудно не заметить — лучшие агенты, меньше оправданий для раздутых инженерных команд… или так гласит аргументация.

Этот стартап, использующий искусственный интеллект, будет бесплатно убирать ваш дом, чтобы обучить будущих роботов ↗

Компания Shift предлагает бесплатную уборку домов, но с одним нюансом, который одновременно удобен и немного тревожен: уборщики носят «волшебную шляпу» с камерой, чтобы компания могла собирать данные для обучения роботов.

Предложение простое: вы получаете чистую квартиру, а они — видеозапись домашних дел. Довольно выгодное предложение, пожалуй.

Компания Shift утверждает, что технология размывает конфиденциальные детали и анонимизирует видеоматериалы, но более широкий вопрос по-прежнему остается открытым: насколько люди готовы пожертвовать приватностью в своем доме ради удобства?

Компания Anthropic выпускает альбом Claude Opus 4.8 ↗

Компания Anthropic выпустила Claude Opus 4.8 с улучшениями в области кодирования, рабочих процессов агентов, логического мышления и профессиональной работы. Главное преимущество — надежность: меньше неподтвержденных утверждений, более удобное использование инструментов и расширенная самопроверка.

В Claude Code также реализованы динамические рабочие процессы, позволяющие модели планировать, запускать параллельные под-агенты, проверять результаты и отправлять отчеты. Звучит скучно, пока не поймешь, что это, по сути, управление проектами в плаще.

Цены остаются разделенными между стандартным и быстрым режимами, при этом Anthropic делает упор на контроль затрат усилий, чтобы пользователи могли выбирать между скоростью, качеством и расходом токенов.

Председатель совета директоров Foxconn заявил, что компания уверена в динамике роста, обусловленной развитием искусственного интеллекта ↗

Председатель совета директоров Foxconn заявил, что спрос на ИИ меняет привычный сезонный ритм компании. Старый спад поставок в середине года? По всей видимости, больше не является нормой.

Причина кроется в колоссальных инвестициях гигантов облачных вычислений в ИИ, которые Foxconn рассматривает как свою собственную рыночную возможность. Это аппаратная сторона бума ИИ, менее привлекательная, чем чат-боты, но именно здесь бьют все рекорды.

Foxconn уже является крупным производителем серверов для Nvidia, поэтому ее оптимизм по сути является проверкой состояния гонки за инфраструктуру в сфере искусственного интеллекта.

Общий алгоритм для проведения надежных оценок сторонними организациями ↗

Организация OpenAI опубликовала рекомендации по оценке ИИ сторонними компаниями, утверждая, что тесты должны содержать более четкую информацию о том, что оценивалось, как проводилось тестирование и что могут доказать результаты.

Главный вывод на удивление практичен: оценка передовых систем ИИ не может основываться исключительно на предположениях, принимаемых в соответствии с рейтинговыми таблицами. Оценщикам необходимо объяснить тестируемую систему, подсказки, меры безопасности, проверки достоверности и то, где заканчиваются утверждения.

Это важно, потому что по мере того, как модели становятся более агентными, поверхностные тесты могут создавать впечатление, что системы безопаснее или надежнее, чем они есть на самом деле. Небольшие затраты времени на документацию приводят к большим последствиям.

Часто задаваемые вопросы

Предназначены ли агенты искусственного интеллекта, такие как Девин, для замены программистов?

Скотт Ву рассматривает агентов ИИ как партнеров по программированию, а не как полную замену программистам-людям. Однако в статье указывается на противоречие: Девин также описывается как человек, внесший значительный вклад в собственный код Cognition. На практике это означает, что такие инструменты могут сократить объем рутинной инженерной работы, но при этом по-прежнему зависят от людей в плане принятия решений, руководства и ответственности.

Почему Shift предлагает бесплатную уборку дома для обучающих данных ИИ?

Компания Shift предлагает бесплатную уборку домов, поскольку ей нужны видеоданные о домашних делах в реальном мире для обучения будущих роботов. Уборщики во время работы носят «волшебную шляпу» с камерой, которая снимает видео, помогающее системам искусственного интеллекта понимать домашние задачи. Обмен очевиден: клиенты получают чистый дом, а компания — данные о частных жилых помещениях.

Как Shift обеспечивает конфиденциальность при сборе видеоматериалов по уборке дома?

В статье говорится, что компания Shift утверждает, что размывает конфиденциальные данные и анонимизирует видеозаписи. Это может снизить некоторые риски для конфиденциальности, но не устраняет более широкую проблему записи внутри домов людей. Для пользователей главный вопрос заключается в том, стоит ли удобство бесплатной уборки такого уровня сбора данных.

Что нового в Claude Opus 4.8?

В Claude Opus 4.8 описывается улучшение кодирования, рабочих процессов агентов, логического мышления и профессиональной работы. Обновление сосредоточено на повышении надежности, включая уменьшение количества неподтвержденных утверждений, более эффективное использование инструментов и расширенную самопроверку. Claude Code также получает динамические рабочие процессы, в рамках которых модель может планировать, запускать параллельные под-агенты, проверять результаты и сообщать о них.

Почему оптимизм по поводу бурного развития искусственного интеллекта в Foxconn имеет значение?

Уверенность Foxconn имеет значение, поскольку она отражает аппаратную составляющую бума ИИ. Председатель совета директоров компании заявил, что спрос на ИИ меняет свою обычную сезонную структуру, а инвестиции облачных гигантов в инфраструктуру создают значительные рыночные возможности. Поскольку Foxconn уже является крупным производителем серверов Nvidia, ее комментарии служат сильным сигналом о спросе на инфраструктуру для ИИ.

Что, по мнению OpenAI, делает оценки ИИ, проводимые сторонними организациями, заслуживающими доверия?

OpenAI утверждает, что при оценке ИИ необходимы более четкие объяснения того, какая система тестировалась, как она тестировалась и что на самом деле демонстрируют результаты. Это включает в себя подробности о подсказках, мерах безопасности, проверках достоверности и ограничениях любых утверждений. Этот момент особенно важен для моделей, основанных на агентном программировании, где поверхностные тесты могут создавать впечатление, что системы безопаснее или эффективнее, чем они есть на самом деле.

Товар добавлен в корзину