07.02.26

Как я сравнил Opus 4.6 с Opus 4.5 и GPT-5.2 Codex

Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография

Sixio

Недавно вышел Opus 4.6, и мне стало любопытно — это просто минорное обновление или реально заметный шаг вперёд. Чтобы проверить это не на абстрактных примерах, а на практике, я решил напрямую сравнить его с Opus 4.5, а бонусом добавил GPT-5.2 — как модель с более «инженерной» репутацией.

Мне было важно не выяснить «кто лучший вообще», а посмотреть, как модели справляются с одной и той же реальной frontend-задачей. Поэтому условия были максимально честные: один и тот же промпт, одинаковая роль и никаких уточнений или правок по ходу.

Промпт

Video Storyboard & Frame Extractor

Ты — senior frontend-разработчик.
Создай одностраничный веб-сервис на React для работы с видео.

Задача сервиса. Пользователь загружает видеофайл и получает:

• Визуальную раскадровку видео
• Возможность скачать отдельные кадры

Технологии

• React + TypeScript
• Tailwind CSS
• Без UI-библиотек
• Всё работает полностью в браузере, без бэкенда

Функциональность

1. Загрузка видеофайла (MP4, WebM)
2. Встроенный плеер с превью
3. Генерация раскадровки (кадры каждые N секунд)
4. Скачивание кадров (PNG/JPEG)
5. Изменяемый интервал извлечения
6. Loading-состояния и обработка ошибок

Требования к коду

• Чёткая декомпозиция на компоненты
• Нативные <video> и <canvas>
• Строгая типизация TypeScript
• Поясняющие комментарии

Общие впечатления

Сразу важный момент: ни одна из моделей не провалилась.

Во всех трёх случаях логика была корректной, присутствовала декомпозиция, типы и комментарии. Разница оказалась не в том, может ли модель решить задачу, а в качестве исполнения и ощущении законченного продукта.

Все исходники тут.

GPT-5.2 — работает, но требует рефакторинга

Результат.

Оценка: 6/10.

GPT-5.2 выдал решение, которое работает, но явно нуждается в серьёзной переработке перед использованием.

Что получилось:

Функционал реализован полностью
Логика извлечения кадров корректна
TypeScript без критических ошибок

Критические проблемы

1. Монолитный App.tsx (326 строк — 60% всего кода!). Парадокс GPT-5.2: общего кода меньше всего (546 строк), но 326 из них в одном файле. Это как запихнуть всю квартиру в одну комнату — формально компактно, но жить невозможно.

2. Отсутствие модульности.

Нет разделения на utils
Компоненты только презентационные
Вся бизнес-логика в хуках компонента
Невозможно переиспользовать код

3. Неиспользуемый мусор. В проекте есть файлы counter.ts и main.ts, которые вообще не используются.

4. Базовый UI без полировки.

Минималистичный Tailwind
Нет анимаций и transitions
Обычный file input вместо drag-and-drop
UI выглядит как dev-tool, а не продукт

Вердикт. Подходит для быстрого прототипа, но требует полного рефакторинга перед использованием в production. Код сложно поддерживать и расширять.

OPUS 4.5 — архитектурный эталон, но слишком строгий

Результат.

Оценка: 8.7/10.

Opus 4.5 выдал решение уровня enterprise-архитектора — безупречная структура, отличная документация, но немного overengineered для такой задачи.

Архитектурные сильные стороны:

1. Идеальная модульность. Структура проекта:

src/
├── App.tsx # Только UI-логика (293 строки)
├── components/
│ ├── index.ts # Barrel exports
│ ├── ErrorMessage.tsx
│ ├── FrameControls.tsx
│ └──… (7 компонентов)
├── types/
│ └── index.ts # Все типы централизованы
└── utils/
└── videoUtils.ts # Вся бизнес-логика

2. Каждая функция имеет подробный JSDoc.

Что не хватает:

1. Базовый UI

Стандартный dark/light theme без кастомизации
Обычный <⁠input type="file">⁠ без drag-and-drop
Минимум внимания к визуальной привлекательности
Нет анимаций и микроинтеракций

2. Возможный overengineering. Для относительно простой задачи создана сложная архитектура с множеством абстракций. Это отлично для большого проекта, но избыточно для MVP.

Вердик. Отличный выбор для enterprise-проекта, где важна поддерживаемость и расширяемость. Код можно показывать на code review как эталон. Но UI требует серьёзной доработки.

P.s. А еще есть небольшой косяк в UI:)

OPUS 4.6 — заметно лучше

Результат.

Оценка: 9.5/10.

А вот Opus 4.6, ради которого всё сравнение и затевалось, действительно вообразил себя сеньором.

Главное открытие: модульность важнее общего объема. Общий объем кода:

GPT-5.2: 546 строк (всё в куче)
Opus 4.6: 1131 строка (модульно)
Opus 4.5: 1221 строка (очень модульно)

Размер главного файла (app.tsx):

Opus 4.6: 213 строк ✓ самый читаемый
Opus 4.5: 293 строки
GPT-5.2: 326 строк ✗ монолит

Парадокс: GPT-5.2 имеет меньше всего кода, но это потому, что вся логика свалена в один файл. Opus 4.6 имеет больше кода, но он правильно организован — каждый файл компактный и понятный.

Что делает его особенным:

1. Продуманная архитектура БЕЗ overengineering. Взял лучшее от Opus 4.5 (модульность, utils, типы), но упростил там, где это не критично.

2. Drag & Drop с визуальным фидбеком. Полноценный компонент загрузки DropZone.tsx: Opus 4.6 реально подумал об UI.

3. Современный дизайн с тёмной темой. О дизайне он тоже не забыл.

4. Адаптивный UI (mobile + desktop). Отдельные UX-паттерны для разных устройств — признак внимания к деталям.

5. Локализация done right. Склонение слова «кадр» в зависимости от числа:

Результат:

«Будет извлечено ~1 кадр»
«Будет извлечено ~2 кадра»
«Будет извлечено ~5 кадров»

Такие мелочи показывают, что модель думает о реальном пользовательском опыте.

6. Детали, которые имеют значение:

Сброс input для повторной загрузки того же файла:
e.target.value = ''; // Без этого нельзя загрузить тот же файл дважды
Sticky header с backdrop-blur:
<⁠header className="sticky top-0 bg-gray-900/80 backdrop-blur-sm">⁠
Прогресс-бар с градиентом:
className="bg-gradient-to-r from-violet-500 to-indigo-500"
style={{ width: `${progress}%` }}
/>⁠
Состояния кнопки с разными иконками:
{isProcessing? '⏳ Извлечение…':
status === 'done'? '↻ Пересобрать':
'📷 Создать раскадровку'}

Вердикт. Opus 4.6 — стал заметно лучше:

Пишет чистый, компактный код
Думает о продукте, а не только о задаче
Понимает UX и визуальный дизайн
Добавляет детали, которые делают разницу
Стал быстрее и лучше держит контекст

Что в итоге

Сравнение показало важную вещь: сегодня разница между моделями не в умении писать код, а в понимании продукта.

Все три модели знают React, TypeScript, Tailwind. Все правильно используют Video API и Canvas. Но:

GPT-5.2 пишет код, который работает
Opus 4.5 пишет код, который правильно структурирован
Opus 4.6 пишет код, которым приятно пользоваться

Opus 4.6 оказался ближе всего к мышлению senior-разработчика, который думает не только о том, чтобы задача работала, но и о том, как продуктом будут пользоваться люди.

Для меня это сравнение хорошо показало эволюцию AI-моделей: от «может написать код» к «понимает продукт и пользователя».

И в этом раунде новый Opus 4.6 уверенно вышел вперёд.

Теперь на очереди Codex 5.3, попробуем и сравним:)

Рассказать

Sixio

Вот что еще мы писали по этой теме