Приложение Т—Ж
В нем читать удобнее
Новости
4K

Anthropic и OpenAI в один день выпус­тили мощные модели для кодинга — Claude Opus 4.6 ​и GPT⁠-⁠5.3⁠-Codex

5
Anthropic и OpenAI в один день выпус­тили мощные модели для кодинга — Claude Opus 4.6 ​и GPT⁠-⁠5.3⁠-Codex
Аватар автора

Николай Абатуров

агент 007

Страница автора

5 февраля состоялся релиз моделей Claude Opus 4.6 от Anthropic и GPT⁠-⁠5.3⁠-Codex от OpenAI.

Обе модели — агентные: когда они получают задачу, не просто генерируют ответ, а выполняют цепочку действий — открывают файлы, запускают код, ищут в интернете, проверяют результат, исправляют ошибки и так далее, пока задача не будет решена.

В первую очередь они предназначены для программирования. Расскажу подробнее.

Главное о Claude Opus 4.6

Это самая продвинутая модель Anthropic. По данным компании, Claude Opus 4.6 прокачалась в написании кода. Она лучше планирует, держит фокус на сложных задачах, сама находит и исправляет свои ошибки.

Контекстное окно модели составляет миллион токенов. Это означает, что Opus 4.6 может держать в голове большие объемы информации и не забывать их.

Основная фишка — «команды ИИ-агентов». В таком режиме над задачей работает не одна сессия в Claude, а сразу несколько. Причем у каждого агента — свое контекстное окно. То есть они работают над конкретными заданиями и не залезают в чужие.

Задачу нужно объяснить «тимлиду» — агенту, который координирует весь процесс. Затем он сам решит, сколько «тиммейтов» запустить и как разделить между ними работу. Они могут «общаться» друг с другом и брать новые задачи.

Список всех запущенных агентов и их задач доступен в терминале. В любой момент можно вмешаться в их работу и написать любому «тиммейту», не обращаясь напрямую к «тимлиду».

Модель эффективна не только для кодинга. Claude Opus 4.6 также справляется с поиском информации и аналитикой. Модель может создавать с нуля или редактировать документы, таблицы и презентации.

В Anthropic улучшили работу с Excel, а еще добавили интеграцию с PowerPoint.

Поддерживает режим адаптивного мышления. Модель сама определяет, когда нужно включить «рассуждающий режим» для решения задачи, основываясь на контексте.

Научилась сжимать контекст. Когда модель понимает, что в диалоге стало слишком много информации, она запускает функцию компактизации, которая суммаризирует весь контекст. Пока только в бета-версии.

С помощью компактизации можно увеличить лимиты на общение с моделью при длительной задаче. Раньше модель начинала галлюцинировать и ошибаться, если контекст был слишком большой.

Opus 4.6 уже доступен на сайте claude.ai по платной подписке от 20 $⁣ (1 500 ₽)  в месяц, через API или в инструменте для разработчиков Claude Code. Бесплатно воспользоваться пока нельзя.

Главное о GPT⁠-⁠5.3⁠-Codex

GPT⁠-⁠5.3⁠-Codex показывает высокие результаты в кодинге. Она поставила рекорд в тесте SWE-Bench Pro по выполнению реальных задач программирования. Модель работает на 25% быстрее и эффективнее, использует меньше токенов, чем предыдущая версия, для решения тех же задач.

При этом модель может писать документацию, делать презентации, анализировать данные в таблицах, проводить исследования. OpenAI позиционирует ее как инструмент для любой профессиональной работы.

Может работать над задачей самостоятельно. Достаточно задать промпт, и GPT⁠-⁠5.3⁠-Codex отправится работать на несколько часов или даже дней. Она будет периодически отчитываться о прогрессе и спрашивать мнение пользователя. Можно вмешаться в любой момент, задавать вопросы или вносить коррективы, не дожидаясь финального результата.

Умеет создавать сайты и игры с нуля и за несколько дней. В качестве примеров работы OpenAI показала аркадную гонку и игру про дайвинг с разными уровнями и рабочими механиками.

Модель «разработала сама себя». OpenAI использовала ранние версии GPT⁠-⁠5.3⁠-Codex, чтобы она помогала отлаживать саму себя во время разработки.

GPT⁠-⁠5.3⁠-Codex доступна в платной подписке на ChatGPT от 20 $⁣ (1 500 ₽) месяц и инструменте для разработчиков Codex. Доступ к модели через API добавят позже. Бесплатно воспользоваться пока нельзя.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Николай АбатуровЧто вы выберете для программирования — Claude или ChatGPT?
    Вот что еще мы писали по этой теме
    Сообщество