ego (lite) is just a browser, ego is your personal agent across devices.
Join waitlist
Français

Tâches navigateur en pratique

Comment décrire une tâche web à l'agent, quand le faire patienter, et comment vérifier ce qui revient.

llms.txt

Cette page commence par poser à quoi sert vraiment ego lite, puis vous fait suivre une tâche du début à la fin pour que vous voyiez précisément ce qui se passe entre un prompt en langage naturel et un résultat structuré.

ego lite, c'est l'endroit où l'agent travaille sur le web pour vous. Tout ce qui est derrière une session — CRM, boîte mail, ATS, comptabilité, social, réservations, admin interne — l'agent peut le mener de bout en bout. Il lit votre prompt en langage naturel, écrit un heredoc ego-browser nodejs, le lance dans un Space, et laisse les onglets que vous utilisez tranquilles.

Les démos enregistrées sont sur lite.ego.app/use-cases. La réservation Expedia tout en bas de cette page est celle que nous démontons étape par étape.

Avant de commencer

  1. Vérifiez qu'ego lite est installé — voir Démarrage rapide.

  2. Au moins une CLI d'agent où la skill ego-browser est enregistrée : Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode.

  3. Dans la CLI d'agent, tapez :

    /ego-browser <décrivez votre tâche en langage naturel>
    

    L'agent charge le contexte de la skill ego-browser et écrit lui-même le heredoc correspondant. Votre seul travail : décrire ce que vous voulez.

Ce que vous pouvez faire avec ego lite

Tout ce que vous savez faire dans un navigateur où vous êtes déjà connecté, l'agent peut le faire pour vous, dans un ou plusieurs Spaces.

  • Réseaux sociaux. Répondre à des tweets, faire des quote-tweets avec des citations de vos propres notes, rédiger et programmer des posts, récupérer des données d'engagement, surveiller les mentions, extraire l'activité d'un compte. X, LinkedIn, Threads, Reddit, Instagram, Facebook, tout passe. Tout ce qui exige d'être connecté et que l'API publique ne donne pas, ego lite le rattrape.

  • Recherche d'emploi et recrutement. Chasser sur LinkedIn, Wellfound, YC startup jobs. Filtrer, cliquer Apply pour entrer dans un ATS (AshbyHQ, Greenhouse, Lever, Workday), uploader un CV, remplir des réponses fictives, s'arrêter avant Submit pour votre validation.

  • Immobilier, finance, achats. Filtrer Redfin, Zillow, Apartments.com avec vos vrais critères, faire tourner leurs simulateurs de prêt, dumper la donnée structurée dans un markdown local. Comparaisons de prix Amazon, commandes en gros Costco, back-offices de courtiers aux API verrouillées — même approche.

  • Réservations. Vols, hôtels, restaurants, le parcours complet avec des données passager ou client fictives, en s'arrêtant juste avant le paiement. Le walkthrough Expedia plus bas est l'exemple complet.

  • Back-offices SaaS. HubSpot, Salesforce, Notion, Airtable, Linear, Stripe dashboard, GA4, Search Console, Mixpanel. Sortir des rapports, rafraîchir des dashboards, mettre à jour des champs en masse, programmer des envois. Là où l'API publique est restreinte, incomplète ou payante, ego lite compense.

  • Outils internes. Votre back-office admin, votre staging, vos flux QA. Tout ce qui est derrière du SSO et inaccessible aux frameworks d'automation — ego lite hérite des sessions réelles de votre navigateur quotidien, donc ça passe.

Le walkthrough ci-dessous prend une tâche du prompt jusqu'au résultat, pour que vous voyiez ce que la mécanique fait par-dessous.


Réservation Expedia aller simple : walkthrough complet

Une vraie tâche sur Expedia US : chercher les vols aller simple JFK→MIA pour vendredi prochain, filtrer sur direct, trier par prix croissant, choisir le moins cher opéré par Delta ou American Airlines, remplir le formulaire passager avec des données fictives, s'arrêter juste avant la page de paiement, et renvoyer numéro de vol, heure de départ et total taxes incluses. Du prompt au résultat : 14 actions navigateur.

Regardez la vidéo, puis lisez les deux sections suivantes — pourquoi cette tâche est dure, et comment ego lite tient le choc.

Prompt :

Search Expedia for a one-way flight next Friday from New York (JFK) to Miami (MIA). Apply the "Nonstop" filter and sort results by "Price (Lowest to Highest)." Choose the cheapest flight operated by either Delta Air Lines or American Airlines, then proceed to the passenger information page. Use the following mock data to fill out the passenger form:

Stop before the payment page. Then provide:

  • Flight number
  • Departure time
  • Total price including taxes and fees.

Vidéo :

L'agent traduit ce prompt en un seul heredoc ego-browser nodejs, le lance dans un Space qui ne touche pas vos onglets de premier plan, et renvoie un cliLog structuré : American Airlines AA 655, 5:35am, $188.40 — à un pas du paiement.

Pourquoi cette tâche est dure

Nous avons choisi Expedia parce qu'il concentre les difficultés typiques d'une page web moderne dans un flux unique de 14 étapes. Vous tomberiez sur les mêmes nids-de-poule sur un CRM, un ATS, un back-office interne, ou n'importe quel SaaS de votre quotidien. Cinq choses s'empilent ici :

  1. Un date picker où chaque cellule de date n'a ni aria-label ni attribut data — uniquement le numéro affiché.
  2. Un filtre « Nonstop » dont l'aria-label contient le nombre de vols en temps réel et le prix actuellement le plus bas ("12 Nonstop flights from $189"). N'importe quel sélecteur en chaîne dure jusqu'à la prochaine remise à jour des tarifs d'Expedia.
  3. Une liste déroulante de tri qui se referme dès qu'un click JS arrive au niveau DOM entre l'ouverture et le clic sur l'option.
  4. Un modal d'upsell « Bundle & Save » avec un lien « No thanks » sans ref accessibilité stable, qui n'apparaît que sur certains types de tarifs.
  5. Entre Trip Summary et Checkout, un modal de choix forcé « Continue without choosing seats? » qui bloque tout le flux en silence s'il n'est pas géré.

Rien d'exotique. Notion, Linear, Airbnb, Salesforce, LinkedIn, Stripe dashboard — presque tous les outils que vous ouvrez un mardi matin sont la même soupe en dessous : React, inputs contrôlés, flux pilotés par modaux, layouts en A/B test permanent. Prenez n'importe quelle tâche un peu complexe dans n'importe lequel, l'agent va croiser au moins quelques-uns de ces pièges.

Expedia se distingue uniquement par le fait qu'il empile les cinq dans un seul flux enregistrable de 14 étapes. C'est pour ça qu'on l'a choisi. Si ego lite tient sur Expedia, il tient sur la plupart de ce que vous lui demanderez.

Comment ego lite traite chacun de ces points

Cinq irritants, chacun rattaché à un choix d'architecture précis :

  1. Cellules de date sans sémantique. Le snapshot d'ego-browser est produit dans la couche kernel du moteur Chromium personnalisé, donc même un élément sémantiquement pauvre sort avec un loc= stable et une structure parent-enfant correcte. Quand le snapshot ne suffit pas, l'agent bascule dans js(String.raw\...`) à l'intérieur du même heredoc et interroge le DOM directement (.uitk-month-double-left+td.innerText === '5'`) pour trouver la bonne cellule. Deux couches en un script, aucun aller-retour.
  2. Aria-labels qui changent. Les sélecteurs supportent les correspondances partielles (input[aria-label*="Nonstop flights"]), donc le script ne dépend pas d'une chaîne qui ne vaudra plus rien à la prochaine variation tarifaire d'Expedia.
  3. Une dropdown qui se ferme sur un click JS. click('@N') envoie de vraies coordonnées souris via CDP, pas un event DOM, donc l'état ouvert de la dropdown n'est pas interrompu entre deux clics. Un heredoc, deux @N clicks : ouvrir, puis choisir.
  4. Un modal sans ref stable. Quand les refs ne suffisent pas, l'agent calcule le getBoundingClientRect() du lien dans js() et appelle click([x, y]) par coordonnées. Le même helper click() accepte sélecteurs CSS, refs, coordonnées viewport et offsets relatifs à l'élément.
  5. Un modal de choix forcé. Le snapshot au niveau kernel voit de façon fiable les overlays [role="dialog"][aria-modal="true"], y compris ceux qu'un React portal monte hors de l'arbre principal. Le script sait que le modal est là, retrouve le bouton « Continue to Checkout » à l'intérieur, et clique.

Sous ces cinq réponses, le même choix racine : code base, pas CLI base. L'agent écrit un script complet en une fois, l'exécute en une fois, et bascule librement entre refs sémantiques, JavaScript dans la page et CDP brut dans le même heredoc. Pas de boucle « lance une commande, regarde la sortie, lance la suivante » qui transforme une tâche en 14 étapes en un match en 14 rounds avec le modèle.

Quelques pièces complètent ce choix :

  • Vraie session Chrome. Bookmarks, cookies, extensions, sessions et profil de votre Chrome quotidien sont migrés au premier lancement en un clic. Vous ne partez pas d'un Chromium headless vierge, vous n'avez pas à « fermer Chrome d'abord », et vous ne tombez pas dans le filtre anti-bot plus dur que « headless » seul déclenche souvent.
  • Un Space isolé. Pendant les 14 étapes sur Expedia, vos onglets de premier plan ne bougent pas d'un pixel. Pas de popup qui vole le focus, pas d'onglet qui part dans une nouvelle fenêtre, pas de clic qui atterrit sur le texte que vous veniez de surligner.
  • Votre propre agent. Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode pilotent tous ego lite via la même skill ego-browser. Vous n'êtes ni enfermé sur un modèle, ni sur une UX d'assistant.

Le walkthrough Expedia n'est qu'une tâche. La même architecture, de la même façon, couvre toutes les catégories du haut de cette page.


Essayez avec quelque chose que vous avez vraiment à faire aujourd'hui

Le plus rapide pour juger si ego lite est pour vous, c'est de prendre une tâche de votre liste d'aujourd'hui et de l'essayer.

Si vous n'avez pas encore installé

Choisissez ce qui vous arrange.

Ou, dans le terminal d'une CLI d'agent :

curl -fsSL https://lite.ego.app/install.sh | sh

L'une et l'autre installent le navigateur ego lite, le helper ego-browser, et enregistrent la skill auprès de toutes les CLI d'agent de votre machine. Au premier lancement, une seule question : importer vos données de navigateur ? Sélectionnez ensuite le navigateur correspondant pour confirmer, et vos sessions, cookies, extensions et profil suivent en un clic.

Si vous avez déjà installé

Ouvrez votre CLI d'agent, tapez /ego-browser, puis ce que vous voulez faire.

Pas d'idée pour commencer ? Choisissez l'un des cinq prompts ci-dessous et collez-le :

Réseaux sociaux

/ego-browser Pull every mention of my X account from the last 24 hours, sort by engagement, and draft a reply to each. Queue the drafts, don't post anything.

Recherche d'emploi

/ego-browser Search LinkedIn for remote "product manager" jobs posted in the last week. For the top 10, pull company, title, and salary range into a markdown table.

Immobilier et achats

/ego-browser Search Zillow for 2-bedroom rentals in Seattle under $3000/month that allow pets. List address, rent, square footage, and link as a table.

Réservations

/ego-browser Search Expedia for hotels near Miami Beach next Saturday night, 4 stars and up, under $200. Sort by rating, list the top 5, and stop before booking.

Back-office SaaS

/ego-browser Log into my Salesforce, group this quarter's pipeline by stage, and export the total amount and deal count per stage to markdown.

Collez, entrée, ouvrez le panneau Space dans ego lite et regardez l'agent travailler.