Как я сравнил Opus 4.6 с Opus 4.5 и GPT-5.2 Codex
Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография
Недавно вышел Opus 4.6, и мне стало любопытно — это просто минорное обновление или реально заметный шаг вперёд. Чтобы проверить это не на абстрактных примерах, а на практике, я решил напрямую сравнить его с Opus 4.5, а бонусом добавил GPT-5.2 — как модель с более «инженерной» репутацией.
Мне было важно не выяснить «кто лучший вообще», а посмотреть, как модели справляются с одной и той же реальной frontend-задачей. Поэтому условия были максимально честные: один и тот же промпт, одинаковая роль и никаких уточнений или правок по ходу.
Промпт
Video Storyboard & Frame Extractor
Ты — senior frontend-разработчик.
Создай одностраничный веб-сервис на React для работы с видео.
Задача сервиса. Пользователь загружает видеофайл и получает:
• Визуальную раскадровку видео
• Возможность скачать отдельные кадры
Технологии
• React + TypeScript
• Tailwind CSS
• Без UI-библиотек
• Всё работает полностью в браузере, без бэкенда
Функциональность
1. Загрузка видеофайла (MP4, WebM)
2. Встроенный плеер с превью
3. Генерация раскадровки (кадры каждые N секунд)
4. Скачивание кадров (PNG/JPEG)
5. Изменяемый интервал извлечения
6. Loading-состояния и обработка ошибок
Требования к коду
• Чёткая декомпозиция на компоненты
• Нативные <video> и <canvas>
• Строгая типизация TypeScript
• Поясняющие комментарии
Общие впечатления
Сразу важный момент: ни одна из моделей не провалилась.
Во всех трёх случаях логика была корректной, присутствовала декомпозиция, типы и комментарии. Разница оказалась не в том, может ли модель решить задачу, а в качестве исполнения и ощущении законченного продукта.
GPT-5.2 — работает, но требует рефакторинга
Оценка: 6/10.
GPT-5.2 выдал решение, которое работает, но явно нуждается в серьёзной переработке перед использованием.
Что получилось:
- Функционал реализован полностью
- Логика извлечения кадров корректна
- TypeScript без критических ошибок
Критические проблемы
1. Монолитный App.tsx (326 строк — 60% всего кода!). Парадокс GPT-5.2: общего кода меньше всего (546 строк), но 326 из них в одном файле. Это как запихнуть всю квартиру в одну комнату — формально компактно, но жить невозможно.
2. Отсутствие модульности.
- Нет разделения на utils
- Компоненты только презентационные
- Вся бизнес-логика в хуках компонента
- Невозможно переиспользовать код
3. Неиспользуемый мусор. В проекте есть файлы counter.ts и main.ts, которые вообще не используются.
4. Базовый UI без полировки.
- Минималистичный Tailwind
- Нет анимаций и transitions
- Обычный file input вместо drag-and-drop
- UI выглядит как dev-tool, а не продукт
Вердикт. Подходит для быстрого прототипа, но требует полного рефакторинга перед использованием в production. Код сложно поддерживать и расширять.
OPUS 4.5 — архитектурный эталон, но слишком строгий
Оценка: 8.7/10.
Opus 4.5 выдал решение уровня enterprise-архитектора — безупречная структура, отличная документация, но немного overengineered для такой задачи.
Архитектурные сильные стороны:
1. Идеальная модульность. Структура проекта:
src/
├── App.tsx # Только UI-логика (293 строки)
├── components/
│ ├── index.ts # Barrel exports
│ ├── ErrorMessage.tsx
│ ├── FrameControls.tsx
│ └──… (7 компонентов)
├── types/
│ └── index.ts # Все типы централизованы
└── utils/
└── videoUtils.ts # Вся бизнес-логика
2. Каждая функция имеет подробный JSDoc.
Что не хватает:
1. Базовый UI
- Стандартный dark/light theme без кастомизации
- Обычный <input type="file"> без drag-and-drop
- Минимум внимания к визуальной привлекательности
- Нет анимаций и микроинтеракций
2. Возможный overengineering. Для относительно простой задачи создана сложная архитектура с множеством абстракций. Это отлично для большого проекта, но избыточно для MVP.
Вердик. Отличный выбор для enterprise-проекта, где важна поддерживаемость и расширяемость. Код можно показывать на code review как эталон. Но UI требует серьёзной доработки.
P.s. А еще есть небольшой косяк в UI:)
OPUS 4.6 — заметно лучше
Оценка: 9.5/10.
А вот Opus 4.6, ради которого всё сравнение и затевалось, действительно вообразил себя сеньором.
Главное открытие: модульность важнее общего объема. Общий объем кода:
- GPT-5.2: 546 строк (всё в куче)
- Opus 4.6: 1131 строка (модульно)
- Opus 4.5: 1221 строка (очень модульно)
Размер главного файла (app.tsx):
- Opus 4.6: 213 строк ✓ самый читаемый
- Opus 4.5: 293 строки
- GPT-5.2: 326 строк ✗ монолит
Парадокс: GPT-5.2 имеет меньше всего кода, но это потому, что вся логика свалена в один файл. Opus 4.6 имеет больше кода, но он правильно организован — каждый файл компактный и понятный.
Что делает его особенным:
1. Продуманная архитектура БЕЗ overengineering. Взял лучшее от Opus 4.5 (модульность, utils, типы), но упростил там, где это не критично.
2. Drag & Drop с визуальным фидбеком. Полноценный компонент загрузки DropZone.tsx: Opus 4.6 реально подумал об UI.
3. Современный дизайн с тёмной темой. О дизайне он тоже не забыл.
4. Адаптивный UI (mobile + desktop). Отдельные UX-паттерны для разных устройств — признак внимания к деталям.
5. Локализация done right. Склонение слова «кадр» в зависимости от числа:
Результат:
- «Будет извлечено ~1 кадр»
- «Будет извлечено ~2 кадра»
- «Будет извлечено ~5 кадров»
Такие мелочи показывают, что модель думает о реальном пользовательском опыте.
6. Детали, которые имеют значение:
- Сброс input для повторной загрузки того же файла:
e.target.value = ''; // Без этого нельзя загрузить тот же файл дважды - Sticky header с backdrop-blur:
<header className="sticky top-0 bg-gray-900/80 backdrop-blur-sm"> - Прогресс-бар с градиентом:
className="bg-gradient-to-r from-violet-500 to-indigo-500"
style={{ width: `${progress}%` }}
/> - Состояния кнопки с разными иконками:
{isProcessing? '⏳ Извлечение…':
status === 'done'? '↻ Пересобрать':
'📷 Создать раскадровку'}
Вердикт. Opus 4.6 — стал заметно лучше:
- Пишет чистый, компактный код
- Думает о продукте, а не только о задаче
- Понимает UX и визуальный дизайн
- Добавляет детали, которые делают разницу
- Стал быстрее и лучше держит контекст
Что в итоге
Сравнение показало важную вещь: сегодня разница между моделями не в умении писать код, а в понимании продукта.
Все три модели знают React, TypeScript, Tailwind. Все правильно используют Video API и Canvas. Но:
- GPT-5.2 пишет код, который работает
- Opus 4.5 пишет код, который правильно структурирован
- Opus 4.6 пишет код, которым приятно пользоваться
Opus 4.6 оказался ближе всего к мышлению senior-разработчика, который думает не только о том, чтобы задача работала, но и о том, как продуктом будут пользоваться люди.
Для меня это сравнение хорошо показало эволюцию AI-моделей: от «может написать код» к «понимает продукт и пользователя».
И в этом раунде новый Opus 4.6 уверенно вышел вперёд.
Теперь на очереди Codex 5.3, попробуем и сравним:)


























