ego (lite) is just a browser, ego is your personal agent across devices.
Join waitlist
Español (Latam)

Tareas de navegador en la práctica

Cómo describir una tarea web al agente, cuándo pedirle que pause y cómo revisar lo que devolvió.

llms.txt

Esta página primero deja claro para qué sirve ego lite y después te acompaña en una tarea de punta a punta, para que veas exactamente qué ocurre entre un prompt en lenguaje natural y un resultado estructurado.

ego lite es el lugar donde el agente hace cosas en la web por ti. Todo lo que está detrás de un login — CRM, bandeja de entrada, ATS, contabilidad, social, reservas, admin interno — el agente lo lleva de inicio a fin. Lee tu prompt en lenguaje natural, escribe un heredoc ego-browser nodejs, lo corre dentro de un Space, y deja en paz las pestañas que estás usando.

Los videos de demo están en lite.ego.app/use-cases. La reserva en Expedia al final de esta página es la que vamos a desmenuzar paso a paso.

Antes de empezar

  1. Verifica que ego lite esté instalado — ver Inicio rápido.

  2. Al menos un Agent CLI con la skill ego-browser registrada: Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode.

  3. En el Agent CLI, escribe:

    /ego-browser <describe tu tarea en lenguaje natural>
    

    El agente carga el contexto de la skill ego-browser y arma solo el heredoc. Tu único trabajo es describir lo que quieres.

Qué puedes hacer con ego lite

Todo lo que sabes hacer en un navegador donde ya estás logueado, el agente puede hacerlo por ti, en uno o más Spaces.

  • Redes sociales. Responder tweets, hacer quote-tweet citando tus propias notas, redactar y programar posts, sacar datos de engagement, monitorear menciones, raspar actividad de cuentas. X, LinkedIn, Threads, Reddit, Instagram, Facebook funcionan todos. Cualquier cosa que requiera login para leer o actuar y que la API pública no entrega, ego lite la cubre.

  • Búsqueda de empleo y reclutamiento. Buscar en LinkedIn, Wellfound, YC startup jobs. Filtrar, clicar Apply para entrar al ATS (AshbyHQ, Greenhouse, Lever, Workday), subir CV, llenar respuestas modelo, detenerse antes de Submit para esperar tu visto bueno.

  • Inmuebles, finanzas, compras. Filtrar Redfin, Zillow, Apartments.com con tus criterios reales, correr sus simuladores de hipoteca y de affordability, volcar datos estructurados a un markdown local. Comparativo de precios en Amazon, pedidos al por mayor en Costco, back-offices de brokers con API trancada — la misma jugada.

  • Reservas. Vuelos, hoteles, restaurantes — el flujo completo con datos ficticios de pasajero o huésped, deteniéndose justo antes de la pantalla de pago. El walkthrough de Expedia más abajo es el ejemplo completo.

  • Back-offices SaaS. HubSpot, Salesforce, Notion, Airtable, Linear, Stripe dashboard, GA4, Search Console, Mixpanel. Sacar reportes, refrescar dashboards, actualizar campos en masa, programar envíos. Donde la API pública es limitada, incompleta o paga, ego lite cubre.

  • Herramientas internas. Tu admin, staging, flujos de QA. Todo lo que está detrás de SSO y fuera del alcance de frameworks de automatización — ego lite hereda los logins reales de tu navegador del día a día, así que pasa derecho.

El walkthrough siguiente lleva una tarea del prompt al resultado para que veas qué hace la máquina por debajo.


Reserva Expedia de ida: walkthrough completo

Una tarea real en Expedia US: buscar vuelos de ida JFK→MIA para el próximo viernes, filtrar directos, ordenar por precio ascendente, elegir el más barato operado por Delta o American Airlines, llenar el formulario de pasajero con datos ficticios, detenerse antes de la página de pago y devolver número de vuelo, hora de salida y total con impuestos. Del prompt al resultado: 14 acciones en el navegador.

Mira el video, después lee las dos secciones siguientes — qué hace difícil a esta tarea y cómo la aguanta ego lite.

Prompt:

Search Expedia for a one-way flight next Friday from New York (JFK) to Miami (MIA). Apply the "Nonstop" filter and sort results by "Price (Lowest to Highest)." Choose the cheapest flight operated by either Delta Air Lines or American Airlines, then proceed to the passenger information page. Use the following mock data to fill out the passenger form:

Stop before the payment page. Then provide:

  • Flight number
  • Departure time
  • Total price including taxes and fees.

Video:

El agente traduce ese prompt a un único heredoc ego-browser nodejs, lo corre dentro de un Space que no toca tus pestañas del frente, y devuelve un cliLog estructurado: American Airlines AA 655, 5:35am, $188.40 — a un paso del pago.

Qué hace difícil a esta tarea

Elegimos Expedia porque junta las dolencias típicas de una página web moderna en un único flujo de 14 pasos. Las mismas piedras aparecen en CRM, ATS, back-office interno o cualquier SaaS del día a día. Acá se apilan cinco cosas:

  1. Un date picker donde cada celda de fecha no tiene aria-label ni atributos data — solo el número visible.
  2. Un filtro "Nonstop" cuyo aria-label trae el conteo de vuelos en tiempo real y el precio más bajo actual ("12 Nonstop flights from $189"). Cualquier selector con string fija muere en el próximo cambio de precios de Expedia.
  3. Un dropdown de orden que se cierra si entre abrir y clicar la opción se dispara cualquier click JS a nivel del DOM.
  4. Un modal de upsell "Bundle & Save" cuyo link "No thanks" no tiene ref de accesibilidad estable y solo aparece en ciertos tipos de tarifa.
  5. Entre Trip Summary y Checkout, un modal de elección forzada "Continue without choosing seats?" que traba en silencio todo el flujo si no lo manejas.

Nada de esto es exótico. Notion, Linear, Airbnb, Salesforce, LinkedIn, Stripe dashboard — casi todas las herramientas que abres un martes a la mañana tienen la misma sopa por debajo: React, controlled inputs, flujos guiados por modal, layouts en A/B test semanal. Toma una tarea un poco más compleja en cualquiera de ellas y el agente va a chocar con varios de estos cinco.

Expedia es especial solo porque empaqueta los cinco en un solo flujo grabable de 14 pasos. Por eso lo elegimos. Si ego lite aguanta en Expedia, aguanta la mayor parte de lo que tengas en la lista.

Cómo lo resuelve ego lite

Cinco dolores, cinco decisiones concretas de arquitectura:

  1. Celdas de fecha sin semántica. El snapshot de ego-browser se genera en la capa kernel del motor Chromium personalizado, así que incluso un elemento semánticamente pobre sale con un loc= estable y la estructura padre-hijo correcta. Cuando el snapshot no alcanza, el agente entra en js(String.raw\...`) dentro del mismo heredoc y consulta el DOM directo (.uitk-month-double-left+td.innerText === '5'`) para hallar la celda. Dos capas en un script, sin round trip.
  2. Aria-labels que cambian de valor. Los selectores soportan match parcial (input[aria-label*="Nonstop flights"]), así el script no depende de una string exacta que solo dura hasta el próximo cambio de precios.
  3. Un dropdown que se cierra ante un click JS. click('@N') despacha coordenadas reales de mouse vía CDP, no un click event del DOM, así el estado abierto del dropdown no se rompe entre dos clics. Un heredoc, dos clicks @N: abrir, elegir.
  4. Un modal sin ref estable. Cuando los refs no alcanzan, el agente calcula el getBoundingClientRect() del link dentro de js() y llama click([x, y]) por coordenadas. El mismo helper click() acepta selectores CSS, refs, coordenadas del viewport y offsets relativos al elemento.
  5. Modal de elección forzada. El snapshot a nivel kernel ve de manera estable overlays [role="dialog"][aria-modal="true"], incluidos modales montados con React portal fuera del árbol principal. El script ve que el modal está abierto, encuentra el botón "Continue to Checkout" adentro, y clica.

Detrás de las cinco respuestas vive la misma decisión de fondo: code base, no CLI base. El agente escribe un script completo de una sola vez, lo corre de una sola vez, y dentro del mismo heredoc cambia libremente entre ref semántica, JavaScript en la página y CDP crudo. No cae en el loop "corre un comando, mira la salida, corre otro" que convierte una tarea de 14 pasos en una pelea de 14 rondas con el modelo.

Atornilladas a esa decisión vienen unas piezas más:

  • Sesión real de Chrome. Bookmarks, cookies, extensiones, sesiones iniciadas y Profile de tu Chrome cotidiano migran con un clic en el primer arranque. No partes de un Chromium headless en blanco, no tienes que "cerrar Chrome primero" y no caes en el control anti-bot más agresivo que el solo hecho de ser headless suele activar.
  • Un Space aislado. Durante los 14 pasos en Expedia, tus pestañas del frente no se mueven. Sin popups que te roben el foco, sin pestañas que vuelen a una ventana nueva, sin clicks que aterricen en el texto que acabas de seleccionar.
  • Tu propio agente. Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode — todos manejan ego lite a través de la misma skill ego-browser. No quedas atrapado en un solo modelo ni en una sola UX.

El walkthrough de Expedia es solo una tarea. La misma arquitectura, hecha igual, cubre todas las categorías de arriba.


Pruébalo con algo que de verdad tienes que hacer hoy

La forma más rápida de saber si ego lite te sirve es agarrar algo de la lista de hoy y probar.

Si todavía no instalaste

Elige lo que te quede mejor.

O, en la terminal de cualquier Agent CLI:

curl -fsSL https://lite.ego.app/install.sh | sh

Cualquiera de las dos opciones instala el navegador ego lite, el helper ego-browser y registra la skill en todos los Agent CLI de tu equipo. En el primer arranque te hace una sola pregunta: ¿importar los datos del navegador? Luego selecciona el navegador correspondiente para confirmar, y logins, cookies, extensiones y Profile se vienen con un solo clic.

Si ya instalaste

Abre tu Agent CLI, escribe /ego-browser, y a continuación lo que quieras hacer.

¿Sin ideas para arrancar? Toma uno de estos cinco y pégalo:

Redes sociales

/ego-browser Pull every mention of my X account from the last 24 hours, sort by engagement, and draft a reply to each. Queue the drafts, don't post anything.

Búsqueda de empleo

/ego-browser Search LinkedIn for remote "product manager" jobs posted in the last week. For the top 10, pull company, title, and salary range into a markdown table.

Inmuebles y compras

/ego-browser Search Zillow for 2-bedroom rentals in Seattle under $3000/month that allow pets. List address, rent, square footage, and link as a table.

Reservas

/ego-browser Search Expedia for hotels near Miami Beach next Saturday night, 4 stars and up, under $200. Sort by rating, list the top 5, and stop before booking.

Back-office SaaS

/ego-browser Log into my Salesforce, group this quarter's pipeline by stage, and export the total amount and deal count per stage to markdown.

Pega, enter, abre el panel Space en ego lite, y mira al agente trabajar.