Думали, что нейро­сети уже давно гене­рируют фотореали­стичные изображе­ния? Посмотрите, что они умеют теперь
Нейросети
6K
Сгенерированное изображение — Midjourney

Думали, что нейро­сети уже давно гене­рируют фотореали­стичные изображе­ния? Посмотрите, что они умеют теперь

ИИ создают картинки, неотличимые от снимка с Айфона
12
Аватар автора

Даша Лейзаренко

писала текст

Страница автора
Аватар автора

Лев Переулков

генерировал картинки

Страница автора

Еще недавно нейросетевые изображения можно было узнать по характерной «пластиковой» текстуре — слишком гладкой и глянцевой.

Осенью 2025 года разработчики нейросетей научились избегать этих артефактов. Теперь результаты из Nano Banana Pro и других генераторов уже очень сложно отличить от снимков на телефон.

Расскажу подробнее и покажу, как это выглядит.

Как мы оказались в точке, где генерацию не отличить от настоящего фото

Раньше нейросети делали «реалистичные» картинки, но этот реализм был условным — глянцевым, будто с обложки модного журнала. Лица получались гладкими, как после ретуши, текстуры — слишком ровными и гладкими, свет — одинаковым по всей сцене. Глаз, привыкший к фото со смартфонов, сразу цеплялся за неестественную пластмассовость.

Постепенно разработчики избавлялись от этой ИИ-текстуры. Например, Higgsfleid выпустила модель Soul, которая могла генерировать именно снимки со смартфона, а не профессиональные студийные фото. Они выглядели менее качественно, зато более естественно.

Большой прорыв в фотореализме сделала Nano Banana Pro от Google, которая вышла 20 ноября 2025 года. Она первой научилась рассуждать прямо во время генерации картинки. Благодаря этому модель точнее следует запросу и избегает старых ошибок нейросетей. А главное — может имитировать фото на Айфон без глянцевой текстуры.

Вслед за Google ИИ-⁠разработчики стали наперебой выпускать похожие модели. 26 ноября Black Forest Labs представила Flux.2, где основной упор сделали на детализацию и корректное освещение. На следующий день Alibaba показала Z-Image (сайт недоступен из РФ), которая умеет создавать реалистичный шум, благодаря чему картинки выглядят так, будто их сняли на смартфон при хорошем свете.

Тогда же в соцсетях завирусились сгенерированные фото девушки (сайт недоступен из РФ), по которым четко виден прогресс в развитии нейросетей. На первом снимке есть ИИ-⁠текстура, а на втором — нет, распознать генерацию практически невозможно. Пользователи отмечали, что теперь рынок инфлюенсеров изменится навсегда, и никаким фотографиям в интернете больше нельзя доверять.

Как нейросети генерировали фотореализм раньше

Мы решили на своем опыте проверить, насколько сильно нейросети продвинулись в фотореализме. Для этого взяли несколько промптов и прогнали их через ChatGPT, старую Nano Banana и новую Nano Banana Pro в Gemini. Так мы хотели исключить вероятность того, что все реалистичные картинки из соцсетей — это черри-пик, когда пользователи перегенерируют изображение сто раз, чтобы получить один достойный результат.

Вот что получилось.

Селфи на смартфон. Мы попросили сгенерировать девушку, сидящую в автомобиле и держащую руку у лица. В таком примере нейросети могут по-разному поломать картинку — испортить детали одежды и аксессуаров, неправильно нарисовать руки, отражения, фон. Ну и главное — добавить глянцевую текстуру. У Nano Banana Pro ее действительно нет.

Промпт

Фото в зеркало. Еще один пример фото на смартфон, но на переднюю камеру. Здесь нейросети могут столкнуться с теми же проблемами, что и в обычным селфи, но добавляется новая сложность. Отражение в зеркале должно совпадать с тем, что видно в кадре напрямую.

Снова Nano Banana Pro сгенерировала максимально реалистичную картинку. Если бы она мельком попалась в ленте соцсетей, появилась ли мысль, что она создана ИИ?

Промпт

Еда. Нейросети всегда справлялись с едой куда лучше, чем с людьми. Но тут и ИИ-текстура обычно заметна сильнее. Модели генерируют очень отретушированные глянцевые снимки, поскольку в датасетах больше профессиональных фуд-фото, чем любительских.

Мы попросили разные модели сгенерировать гавайскую пиццу, дубайский шоколад, бабл-чай и руку с салфеткой. Это проверка сразу по нескольким направлениям: сложные текстуры, разные материалы и человеческая анатомия.

Промпт

Толпа — одна из показательных проблем для нейросетей, потому что в одной сцене нужно одновременно сделать десятки уникальных лиц, сохранить разнообразие поз и одежды, правильно передать глубину.

Раньше нейросетевые толпы людей выглядели словно NPC из видеоигры. Но теперь Nano Banana Pro может сделать всех уникальными. Чтобы распознать генерацию, придется долго присматриваться.

Промпт

Текст. Несмотря на то что нейросети давно умеют выводить читаемый текст, ошибки все еще встречаются регулярно — особенно на русском и когда в промпте много условий.

Наш запрос как раз был из таких: мы просили изобразить ребенка, который держит лист бумаги с надписью «зимний лес», надеть на него футболку с фразой tiny rabbit, а рядом показать часы, показывающие 09:00, и календарь с конкретным месяцем — декабрем 2025 года. Все условия выполнила только Nano Banana Pro.

Промпт

И как теперь распознать ИИ-фото

Все картинки из Nano Banana Pro помечены водяным знаком SynthID. Это незаметный человеческому глазу маркер, который встраивается внутрь изображения. В метаданных он не отображается.

Если картинка создана в интерфейсе чат-бота Gemini, на нем появляется видимый вотермарк в правом нижнем углу. Но при генерации через API или сторонние сервисы эта отметка не ставится — только невидимая метка SynthID.

Чтобы проверить, есть ли на изображении SynthID, нужно прогнать его через официальный детектор Google. Им могут воспользоваться только партнеры и журналисты, с которым сотрудничает компания. Обычным пользователям доступ не выдают. Можно попытаться подать заявку, но неизвестно, одобрят ли ее.

Google предлагает пользователям проверять картинки прямо в чат-боте Gemini. Якобы достаточно загрузить изображение и спросить, есть ли на нем SynthID. Но это не работает.

Мы проверили несколько картинок, сгенерированных в Nano Banana Pro, и Gemini ответил, что не может найти на них SynthID. Но чат-бот хотя бы предположил, что это генерация, и рассказал про признаки, которые на это указывают.

Поскольку доступных способов проверять картинки на наличие вотермарка нет, на Reddit попытались найти ее самостоятельно. Один из пользователей выкрутил на максимум насыщенность у одной из генерации и обнаружил, как может выглядеть SynthID — как разноцветный паттерн.

Мы попробовали увеличить насыщенность у сгенерированного селфи — и увидели похожий узор.

Конечно, каждую картинку в интернете не будешь сохранять и увеличивать ей насыщенность. Да и этот трюк сработает только с изображениями, у которых есть SynthID — то есть созданных в моделях Google. Например, генерации из Flux.2 таким образом не проверить.

Остается только продолжать присматриваться к оставшимся артефактам на дальнем плане и прислушиваться к интуиции. Если кажется, что с картинкой что-то не так, скорее всего, с ней действительно что-то не так.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоЧто думаете о том, что генерации становится труднее отличить от реальных фото?
    Сообщество