В «Яндекс Браузере» появился ИИ-агент. Может ли​ он​ спра­виться с простей­шими задачами?
Нейросети
3K
Сгенерированное изображение — Таня Бронникова / Midjourney

В «Яндекс Браузере» появился ИИ-агент. Может ли​ он​ спра­виться с простей­шими задачами?

Нейросеть искала билеты в кино и собирала продуктовую корзину
2
Аватар автора

Даша Лейзаренко

жестко делегирует

Страница автора

«Яндекс» запустил ИИ-агента, который должен забрать на себя рутинные действия в интернете.

Например, забронировать столик в ресторане или собрать заказ в «Лавке». Для этого агент выходит в сеть, переходит по ссылкам и главное — сам принимает решения.

Я проверила, как ИИ-агент в «Браузере» справляется с простыми задачами.

Что может ИИ-агент «Яндекса» и как работает

ИИ-агенты умеют действовать без постоянного контроля со стороны человека: достаточно задать запрос — и дальше нейросеть работает сама. По задумке, они должны брать на себя рутинные задачи и тем самым экономить время и силы пользователя. Правда, это пока больше теория, чем реальность.

В конце августа ИИ-агент появился в «Яндекс Браузере». Он работает на базе Алисы и доступен бесплатно, но только в тестовом режиме. Чтобы получить к нему доступ, нужно оставить заявку, а каждому пользователю выдают 10 запросов в день.

Работает это так: в чате с Алисой вы задаете запрос — например, «Найди билеты в кино». Дальше агент открывает новую вкладку в браузере и начинает действовать сам: переходит по сайтам, выбирает нужные пункты меню, заполняет формы. Параллельно нейросеть комментирует свои действия в диалоговом пузыре.

Такие комментарии оставляет Алиса, говоря о себе в третьем лице
Такие комментарии оставляет Алиса, говоря о себе в третьем лице
А так выглядит отчет о действиях
А так выглядит отчет о действиях

В чате остается описание каждого шага. В отличие от агента ChatGPT, Алиса не записывает свои действия на видео — их можно наблюдать только в реальном времени.

В «Яндексе» подчеркивают: пока агент выполняет задачу, пользователь может спокойно заниматься своими делами. Среди примеров, которые приводят разработчики, — собрать корзину продуктов по заданным условиям, подобрать билеты на концерт, построить маршрут или найти письма в почте и проанализировать их.

При этом нейросеть не доводит процесс до конца: она не может нажать «Заказать» при сборе корзины или «Забронировать» при выборе билетов. «Яндекс» не позволяет привязывать персональные данные и платежные карты, поэтому агент лишь выбирает товары и услуги. Финальное действие остается за пользователем.

Как агент «Яндекса» справляется с заявленными задачами

Я протестировала агента на нескольких несложных задачах. Расскажу, с чем он справился, а где совсем провалился.

Найти товар по условиям. Я попросила найти наушники Sony WH-1000XM5 по самой низкой цене и с доставкой в Петербург на этой неделе. Агент справился за 20 минут — открыл ссылку с самым дешевым вариантом с доставкой в тот же день.

Здесь вопросов не возникло.

Наушники, которые нашел агент
Наушники, которые нашел агент

⚠️ Собрать корзину продуктов. Я попросила агента сформировать заказ в «Яндекс Лавке» на неделю за 3 000 ₽ с набором белков, углеводов и овощей. Намеренно выбрала сервис экосистемы «Яндекса», рассчитывая, что Алисе будет проще с ним справиться.

Агент бродил по сайту «Лавки» почти полчаса. За это время он успел добавить в корзину две упаковки яиц, спагетти, картошку, гречку, хлеб (со сроком годности, который истекал в тот же день), а также кинзу, укроп, зеленый лук и почти идентичный набор зелени — укроп, петрушку и зеленый лук. Общая сумма получилась меньше тысячи рублей.

А потом начались странности: агент внезапно перешел на страницу с макаронами и почему-то нажал на кнопку «Выйти», вообще разлогинив меня. Продолжить работу он уже не смог — запрос завершился ошибкой.

Алиса полчаса собирает корзину и выходит из аккаунта

Я снова взяла управление на себя — вошла в профиль и отправила агенту тот же запрос. Корзина сохранилась, и казалось, что осталось только добавить недостающие продукты. Но агент тут же сломался — набрал в поиске слово «мясо» и завершил работу ошибкой. Возможно, его смутила уже заполненная корзина. Я очистила ее полностью и попробовала еще раз.

На этот раз корзину все-таки удалось собрать. Еще через полчаса Алиса набрала продуктов почти на 3 000 ₽. В списке оказались яйца, картошка, помидоры, морковь, хлеб, макароны, рис, мандарины и апельсины. Но вместе с ними агент почему-то добавил и несколько готовых блюд: сэндвич, рулет, бутерброды и свинину по-французски на 1 205 ₽.

Это не совсем соответствовало запросу: я просила продукты на неделю, а не готовые блюда. У них короткий срок годности и довольно высокая цена. На эти деньги можно было взять источники белка, например курицу, рыбу или нут. В любом случае такую корзину я бы не заказала и пересобрала заново.

1/2
Корзина, которую собрал ИИ-агент. Первый день поем шикарно, а потом буду на двух пачках риса и макаронах
Корзина, которую собрал ИИ-агент. Первый день поем шикарно, а потом буду на двух пачках риса и макаронах

⚠️ Забронировать билеты в кино. Я попросила найти сеансы «Токсичного мстителя» в Петербурге на вечер пятницы для двоих. Локацию не уточняла, поэтому Алиса открыла первую же ссылку — сайт «Великан парка». Дату и время нейросеть выбрала верно: 5 сентября, пятница, 22:00. Правда, это оказался вип-показ: билеты стоили по 2 500 ₽. Но тут я сама не уточнила ограничения по стоимости.

До этапа выбора мест Алиса так и не добралась: застряла на плашке с подтверждением возраста. Непонятно почему, но кнопку «Продолжить» она нажать не смогла. При этом ни моего разрешения, ни уточнения возраста в чате не запросила.

Тут агент застрял в первый раз. Запрос не закончился ошибкой, Алиса просто зависла
Тут агент застрял в первый раз. Запрос не закончился ошибкой, Алиса просто зависла

Тут вскрылась проблема: если забрать управление на себя, вернуть его уже нельзя. То есть если нейросеть ошиблась, застряла или зависла, помочь ей не получится. Остается два варианта: доделывать все вручную либо запускать запрос заново.

При повторном запросе Алиса смогла пройти проверку возраста и на этот раз выбрала сеанс на 00:00 — билеты оказались куда дешевле, всего по 400 ₽. Она отметила два соседних места и запросила данные для бронирования, которые сама же ввела в форму. Затем агент уточнил, какие галочки поставить. Я не хотела получать рекламные материалы, но Алиса все равно прожала и эту галочку.

В итоге мы дошли до оплаты — на этом этапе уже нужно было вводить банковские данные вручную, с ними агент не работает. Всего на это ушло две попытки и около часа.

Во второй раз агент дошел до этого экрана
Во второй раз агент дошел до этого экрана

⚠️ Построить прогулочный маршрут по городу. Я попросила агента составить пешеходный маршрут по Красноярску по неочевидным местам, чтобы можно было пройти, не пользуясь такси и общественным транспортом.

Сначала Алиса делала что-то странное — находила улицы в разных городах, хаотично перемещалась по карте по всей России, зависала и сбрасывала собственные маршруты. Полчаса агент вообще простоял на одном месте, ничего не делая.

Точка, может быть, и потрясающая, только вообще не в Красноярске
Точка, может быть, и потрясающая, только вообще не в Красноярске

Когда прошло больше часа, а результата так и не было, я перезапустила запрос. Похоже, при долгой работе память агента забивается предыдущими действиями и ему становится сложнее довести задачу до конца. Еще неудобно, что агент никак не оповещает о завершении работы или об ошибке — приходится все время перепроверять вкладку браузера, где он работает.

Тогда я упростила запрос и попросила построить интересный пешеходный маршрут по Красноярску на два часа. Тут нейросеть справилась, но не сообщила об окончании работы, поэтому неизвестно, закончила она или нет.

Сам маршрут выглядел немного хаотично: повторы по одним и тем же улицам, огромный подъем на гору к часовне с последующим спуском обратно в центр и, главное, без выхода на набережную — одно из самых приятных мест города. Маршрут действительно можно пройти за два часа, но с должной физической подготовкой и довольно быстрым шагом.

На достижение результата у меня ушло около пяти попыток и четыре часа. Конечно, я не контролировала агента все время и по большей части занималась своими делами, но раз в полчаса вкладку браузера приходилось открывать. Это оказалось самой изматывающей задачей для меня и самой сложной для агента.

Такой маршрут получился, но агент так и не завершил задачу. После этого комментария перестал выполнять какие-либо действия
Такой маршрут получился, но агент так и не завершил задачу. После этого комментария перестал выполнять какие-либо действия

Общие впечатления

ИИ-агент в «Яндекс Браузере» пока работает очень сыро. Он действительно может выполнять простые рутинные задачи вроде поиска товара или выбора билетов. Но в большинстве сценариев агент оказывается катастрофически медленным, путается в действиях, зависает или завершает запрос ошибкой.

За время теста я так и не приблизилась к лимиту в 10 запросов в день. Причина не в том, что задач было мало, а в том, что агент выполняет их слишком долго и часто ломается. Достичь лимита в таких условиях попросту нереально.

Идея о том, что агент делает работу за тебя, пока ты занимаешься своими делами, звучит привлекательно. На практике же это не работает: нейросеть не сообщает, когда закончила процесс или застряла. Все равно приходится следить за ее шагами и перепроверять. Еще время уходит на переформулирование промпта, если агент вообще не справляется с задачей.

На контроль за агентом уходит больше времени, чем на самостоятельное выполнение задачи.

Единственное, с чем нейросеть справилась без нареканий, хоть и за полчаса, — поиск товара по заданным условиям.

Забавная деталь — то, как Алиса комментирует собственные действия. Очень восторженно и воодушевленно. Жаль, что результаты пока не на том же уровне.

Не вошли
Не вошли

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоПользуетесь «Яндекс Браузером»? Поделитесь впечатлениями:
    Вот что еще мы писали по этой теме
    Сообщество