ego (lite) is just a browser, ego is your personal agent across devices.
Join waitlist
Русский

Браузерные задачи на практике

Как описать веб-задачу агенту, когда его лучше остановить и как проверить, что вернулось.

llms.txt

Сначала разберём, для чего вообще нужен ego lite, а потом пройдёмся по одной задаче от начала до конца, чтобы было видно, что именно происходит между подсказкой на естественном языке и структурированным результатом.

ego lite — это место, где агент делает за вас работу в вебе. Всё, что требует логина — CRM, почта, ATS, бухгалтерия, соцсети, бронирования, внутренние админки — агент может вести от начала до конца. Он читает вашу подсказку на естественном языке, пишет один heredoc ego-browser nodejs, запускает его в Space и не лезет во вкладки, которыми пользуетесь вы.

Записанные демо лежат на lite.ego.app/use-cases. Задачу с бронированием Expedia в конце страницы мы разберём пошагово.

Перед стартом

  1. Убедитесь, что ego lite установлен — см. Быстрый старт.

  2. Хотя бы один Agent CLI с зарегистрированным скиллом ego-browser: Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode.

  3. В Agent CLI наберите:

    /ego-browser <опишите задачу на естественном языке>
    

    Агент подгрузит контекст скилла ego-browser и сам напишет соответствующий heredoc. Ваше дело — внятно описать, что нужно.

Что можно делать через ego lite

Всё, что вы умеете делать в браузере, в который уже залогинены, агент может сделать за вас в одном или нескольких Space.

  • Соцсети. Отвечать на твиты, делать quote-tweet с цитатами из своих заметок, готовить и ставить в очередь публикации, выгружать данные по вовлечённости, мониторить упоминания, собирать активность аккаунта. X, LinkedIn, Threads, Reddit, Instagram, Facebook — всё подходит. Что требует залогиненности и не отдаётся public API, ego lite добирает.

  • Поиск работы и рекрутинг. Поиск на LinkedIn, Wellfound, YC startup jobs. Фильтр, нажатие Apply с переходом в ATS (AshbyHQ, Greenhouse, Lever, Workday), загрузка резюме, заполнение тестовых ответов, остановка перед Submit до вашего подтверждения.

  • Недвижимость, финансы, шопинг. Фильтрация Redfin, Zillow, Apartments.com по вашим реальным критериям, прогон ипотечных и affordability-калькуляторов, выгрузка структурированных данных в локальный markdown. Сравнение цен на Amazon, оптовые заказы Costco, бэк-офис брокеров с закрытым API — та же механика.

  • Бронирования. Авиабилеты, отели, рестораны — полный сценарий с тестовыми данными пассажира или гостя, до самого экрана оплаты. Walkthrough по Expedia ниже — полноценный пример.

  • SaaS-бэк-офисы. HubSpot, Salesforce, Notion, Airtable, Linear, Stripe dashboard, GA4, Search Console, Mixpanel. Выгрузка отчётов, обновление дашбордов, массовое редактирование полей, плановые отправки. Где public API ограничен, неполон или платный — ego lite добирает.

  • Внутренние инструменты. Ваш админ-бэк-офис, staging, QA-флоу. Всё, что прячется за SSO и недоступно из обычных автоматизаций — ego lite наследует реальные логины из вашего повседневного браузера и просто проходит насквозь.

Дальше — разбор одной задачи от подсказки до результата, чтобы было видно, что под капотом.


Бронирование Expedia в одну сторону: разбор полного флоу

Реальная задача в Expedia US: найти рейсы JFK→MIA в одну сторону на следующую пятницу, отфильтровать прямые, отсортировать по возрастанию цены, выбрать самый дешёвый у Delta или American Airlines, заполнить форму пассажира тестовыми данными и остановиться непосредственно перед оплатой, после чего вернуть номер рейса, время вылета и итоговую сумму с налогами. От подсказки до результата — 14 шагов в браузере.

Сначала посмотрите видео, затем прочитайте два следующих раздела: чем эта задача тяжёлая и как с ней справляется ego lite.

Prompt:

Search Expedia for a one-way flight next Friday from New York (JFK) to Miami (MIA). Apply the "Nonstop" filter and sort results by "Price (Lowest to Highest)." Choose the cheapest flight operated by either Delta Air Lines or American Airlines, then proceed to the passenger information page. Use the following mock data to fill out the passenger form:

Stop before the payment page. Then provide:

  • Flight number
  • Departure time
  • Total price including taxes and fees.

Видео:

Агент переводит подсказку в один heredoc ego-browser nodejs, запускает его в Space, который не трогает ваши фоновые вкладки, и в конце возвращает структурированный cliLog: American Airlines AA 655, 5:35am, $188.40 — в одном шаге от оплаты.

Чем эта задача тяжёлая

Мы выбрали Expedia, потому что он стягивает типичные «костыли» современной веб-страницы в один 14-шаговый сценарий. Те же ямы вы поймаете на CRM, ATS, во внутренней админке, в любом ежедневном SaaS. Здесь сходятся пять вещей:

  1. Date picker, где у каждой ячейки даты нет ни aria-label, ни data-атрибутов — только видимое число.
  2. Фильтр «Nonstop», aria-label которого содержит живое количество рейсов и текущую минимальную цену ("12 Nonstop flights from $189"). Любой селектор с захардкоженной строкой умрёт после следующего пересчёта цен Expedia.
  3. Дропдаун сортировки, который закрывается, если между его открытием и кликом по опции прилетит любой DOM-уровневый JS click.
  4. Апсейл-модалка «Bundle & Save». У ссылки «No thanks» внутри нет стабильного accessibility ref, и появляется она только на определённых тарифах.
  5. Между Trip Summary и Checkout встроена модалка «Continue without choosing seats?». Если её не обработать, флоу молча застрянет.

Ничего экзотического. Notion, Linear, Airbnb, Salesforce, LinkedIn, Stripe dashboard — почти всё, что вы открываете во вторник утром, изнутри одно и то же: React, controlled inputs, флоу через модалки, layout под постоянным A/B-тестом. Возьмите чуть сложнее задачу в любом из них — агент почти наверняка наткнётся на парочку из этих пяти.

Особенность Expedia только в одном: он умудряется упаковать все пять в один записываемый 14-шаговый сценарий. Поэтому и взяли. Если ego lite держится на Expedia, он удержится и на большей части вашего списка.

Как ego lite разбирается с каждой проблемой

Пять болевых точек — пять конкретных архитектурных решений:

  1. Ячейки даты без семантики. snapshot в ego-browser создаётся на уровне кастомного ядра Chromium, поэтому даже у семантически бедного элемента остаются стабильный loc= и корректная иерархия. Когда snapshot не даёт ответа, агент в том же heredoc уходит в js(String.raw\...`) и тянет данные напрямую из DOM (.uitk-month-double-left+td.innerText === '5'`), чтобы найти нужную ячейку. Два слоя в одном скрипте, без лишних round-trip'ов.
  2. Aria-label, меняющий значения. Селекторы поддерживают частичное совпадение (input[aria-label*="Nonstop flights"]), так что скрипт не завязан на точную строку, которая живёт до ближайшего пересчёта цен.
  3. Дропдаун, который закрывается на JS click. click('@N') отправляет реальные координаты мыши через CDP, а не DOM-click event, поэтому открытое состояние дропдауна не прерывается между двумя кликами. Один heredoc, два @N-клика: открыли, выбрали.
  4. Модалка без стабильного ref. Когда refs не помогают, агент считает getBoundingClientRect() ссылки внутри js() и зовёт click([x, y]) по координатам. Один и тот же helper click() принимает CSS-селекторы, refs, координаты viewport и относительные смещения от элемента.
  5. Модалка с принудительным выбором. snapshot на уровне ядра стабильно видит наложения [role="dialog"][aria-modal="true"], в том числе те, что React portal монтирует вне основного дерева. Скрипт замечает модалку, находит кнопку «Continue to Checkout» внутри и нажимает на неё.

Под этими пятью пунктами лежит один и тот же базовый выбор: code base, а не CLI base. Агент пишет один полный скрипт, запускает его одним махом и свободно переключается между семантическими ref, JavaScript на странице и сырым CDP в одном heredoc. Не попадает в цикл «запусти команду — посмотри вывод — запусти следующую», который превращал бы 14-шаговую задачу в 14-раундовую дуэль с моделью.

Этот выбор подпирает ещё несколько вещей:

  • Настоящие Chrome-логины. Закладки, cookies, расширения, логины и Profile повседневного Chrome переезжают на первом запуске в один клик. Не нужно стартовать с пустого headless Chromium, не нужно «сначала закрой Chrome», и не срабатывают более жёсткие антибот-проверки, которые часто палят именно headless.
  • Изолированный Space. На протяжении всех 14 шагов на Expedia ваши вкладки на переднем плане не дёргаются. Никто не отбирает фокус, никакая вкладка не улетает в новое окно, и клик не попадает на текст, который вы только что выделили.
  • Ваш собственный агент. Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode — все они управляют ego lite через один и тот же скилл ego-browser. Вы не заперты в одной модели или в одном UX ассистента.

Walkthrough по Expedia — это всего одна задача. Та же архитектура тем же способом покрывает все категории из верхней части страницы.


Попробуйте на чём-то, что и так нужно сделать сегодня

Быстрее всего проверить, подходит ли ego lite, — взять что-то из сегодняшнего списка и просто запустить.

Если ещё не установили

Выбирайте удобный способ.

Или в терминале любого Agent CLI:

curl -fsSL https://lite.ego.app/install.sh | sh

Любой из вариантов установит браузер ego lite, helper ego-browser и зарегистрирует скилл во всех Agent CLI на машине. При первом запуске будет один вопрос: импортировать данные браузера? Затем выберите соответствующий браузер для подтверждения, и логины, cookies, расширения и Profile переедут в один клик.

Если уже установили

Откройте Agent CLI, наберите /ego-browser, а дальше — что нужно сделать.

Не знаете, с чего начать? Возьмите один из пяти промптов ниже и вставьте.

Соцсети

/ego-browser Pull every mention of my X account from the last 24 hours, sort by engagement, and draft a reply to each. Queue the drafts, don't post anything.

Поиск работы

/ego-browser Search LinkedIn for remote "product manager" jobs posted in the last week. For the top 10, pull company, title, and salary range into a markdown table.

Недвижимость и шопинг

/ego-browser Search Zillow for 2-bedroom rentals in Seattle under $3000/month that allow pets. List address, rent, square footage, and link as a table.

Бронирования

/ego-browser Search Expedia for hotels near Miami Beach next Saturday night, 4 stars and up, under $200. Sort by rating, list the top 5, and stop before booking.

SaaS-бэк-офис

/ego-browser Log into my Salesforce, group this quarter's pipeline by stage, and export the total amount and deal count per stage to markdown.

Вставили, нажали Enter — и откройте панель Space в ego lite, чтобы посмотреть, как агент работает.