L'IA redéfinit le paysage des navigateurs : de l'interface utilisateur à la plateforme d'appel d'Agent

La nouvelle configuration des navigateurs à l'ère de l'IA

La troisième guerre des navigateurs se déroule discrètement. En regardant l'histoire, depuis Netscape jusqu'à IE, puis à Firefox et Chrome, la lutte entre les navigateurs a toujours été le reflet du contrôle des plateformes et des changements de paradigme technologique. Chrome est devenu le maître grâce à ses mises à jour rapides et à son écosystème interconnecté, Google a créé un cercle fermé d'accès à l'information à travers une structure de double monopole entre la recherche et le navigateur.

Mais cette configuration est en train de vaciller. L'émergence des grands modèles de langage (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches sur la page de résultats de recherche avec des "zéro clic", ce qui réduit le comportement traditionnel de clic sur les pages web. Parallèlement, des rumeurs concernant le fait qu'Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent davantage la base de profits d'Alphabet, et l'inquiétude du marché concernant la "orthodoxie de la recherche" commence à se manifester.

Le navigateur lui-même est également confronté à une redéfinition de son rôle. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur d'un ensemble de capacités telles que la saisie de données, le comportement des utilisateurs et l'identité privée. Bien que l'Agent IA soit puissant, pour réaliser des interactions complexes sur les pages, appeler des données d'identité locales et contrôler des éléments web, il doit encore s'appuyer sur les frontières de confiance et le bac à sable fonctionnel du navigateur. Le navigateur évolue d'une interface humaine à une plateforme d'appels système pour les Agents.

Ce qui pourrait vraiment bouleverser le paysage actuel des navigateurs, ce n'est pas un autre "meilleur Chrome", mais une toute nouvelle architecture d'interaction : passer de l'affichage d'informations à l'appel de tâches. Les navigateurs de demain doivent être conçus pour les agents IA - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use essaient de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par LLM, réalisant ainsi la cartographie des pages aux instructions et réduisant considérablement le coût d'interaction.

Les projets dominants sur le marché ont commencé à se structurer : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine la protection de la vie privée et le raisonnement local, renforçant les fonctionnalités de recherche et de filtrage avec LLM ; tandis que des projets natifs de cryptomonnaie comme Donut visent à établir un nouvel accès à l'interaction entre l'IA et les actifs en chaîne. La caractéristique commune de ces projets est de reconstruire l'entrée du navigateur, plutôt que d'embellir sa couche de sortie.

Pour les entrepreneurs, l'opportunité réside dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour le futur Agent, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance pourraient devenir une partie intégrante de la nouvelle génération de plateformes. De l'optimisation SEO à l'AEO(Agent Engine Optimization), du trafic de page aux appels de chaîne de tâches, la forme du produit et la pensée de conception se reconstruisent. La troisième guerre des navigateurs se déroule dans "l'entrée" plutôt que dans "l'affichage" ; celui qui déterminera la victoire n'est plus celui qui attire l'œil des utilisateurs, mais celui qui gagne la confiance de l'Agent et obtient l'entrée pour l'appel.

Conseils pour les entrepreneurs

En tant qu'entrepreneur, il faut reconnaître que le navigateur reste le plus grand "point d'entrée" non restructuré du monde Internet. Ce qui a réellement un potentiel de disruption, ce sont les innovations du côté de "l'entrée" - comment faire en sorte qu'un agent AI appelle activement votre produit pour accomplir des tâches spécifiques. Cela déterminera si le produit peut s'intégrer dans l'écosystème des agents, obtenir du trafic et une répartition de la valeur.

Recherchez l'ère de "cliquer" ; l'ère des agents de "faire appel". Réimaginez le produit comme un composant API, permettant aux agents intelligents non seulement de "comprendre" mais aussi de "faire appel". Concentrez-vous sur trois dimensions :

  1. Standardisation de la structure des interfaces : garantir que le produit est "appelable". Considérer si la structure de l'information peut être standardisée et abstraite sous un schéma clair, si les opérations clés peuvent être décrites par un DOM sémantique ou une cartographie JSON, et si une machine d'état est fournie pour permettre à l'Agent de reproduire le processus comportemental de l'utilisateur.

  2. Identité et passage : aider l'Agent à "franchir les barrières de confiance". Surtout dans les scénarios Web3, devenir la MCP(Multi Capability Platform) du monde blockchain, fournissant une couche d'instructions universelles ou un ensemble d'interfaces de contrat standardisées.

  3. Mécanisme de flux à reconsidérer : passer de l'SEO à l'AEO/ATF. Le produit doit avoir une granularité de tâche claire, optimiser les agents ou adapter la planification des tâches. Simplifier le processus d'inscription, fournir des interfaces en temps réel, adapter la syntaxe d'appel pour différents cadres LLM.

Les projets d'entrepreneuriat futurs ne consistent pas à recréer un navigateur, mais à faire en sorte que les navigateurs existants servent d'Agent, créant un pont pour la nouvelle génération de "flux d'instructions". Construire la "syntaxe d'interface" pour appeler le monde des Agents, devenir un maillon de la chaîne de confiance des intelligences artificielles, et ériger le "château API" du prochain modèle de recherche. À l'ère de Web3 + AI Agent, il s'agit de capturer l'intention d'exécution de l'Agent par la chaîne d'appel, plutôt que d'attirer l'attention de l'utilisateur par l'interface utilisateur.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
ChainChefvip
· 07-17 02:20
smh la recherche de recettes de google devient un peu fade... il est temps d'ajouter un peu de LLM frais à cette soupe de navigateur
Voir l'originalRépondre0
AirdropCollectorvip
· 07-17 02:17
IE est vraiment en train de mourir.
Voir l'originalRépondre0
CryptoSourGrapevip
· 07-17 02:12
Ah si j'avais su que Google était si bull, pourquoi n'ai-je pas vendu un rein pour acheter des actions à l'époque ?
Voir l'originalRépondre0
SnapshotBotvip
· 07-17 02:09
chrome va être condamné, n'est-ce pas
Voir l'originalRépondre0
TokenDustCollectorvip
· 07-17 02:06
IE est déjà couché.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)