La IA reconfigura el panorama del navegador: desde la interfaz de usuario hasta la plataforma de llamada de agentes

Nueva configuración del navegador en la era de la IA

La tercera guerra de los navegadores está ocurriendo silenciosamente. Mirando hacia atrás en la historia, desde Netscape hasta IE, y luego Firefox y Chrome, la lucha entre navegadores ha sido un reflejo del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome se ha convertido en el líder gracias a sus rápidas actualizaciones y la interconexión de su ecosistema, Google ha creado un bucle cerrado de entrada a la información a través de la estructura de duopolio entre búsqueda y navegador.

Pero este patrón está comenzando a tambalearse. El auge de los grandes modelos de lenguaje (LLM) está haciendo que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que reduce el comportamiento de clics en páginas web tradicionales. Al mismo tiempo, los rumores sobre que Apple podría reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el malestar del mercado por la "ortodoxia de la búsqueda" ya ha comenzado a mostrar signos.

El propio navegador también se enfrenta a una reconfiguración de su papel. No solo es una herramienta para mostrar páginas web, sino que también es un contenedor de diversas capacidades como la entrada de datos, el comportamiento del usuario, la privacidad y la identidad. Aunque el Agente de IA es poderoso, para llevar a cabo interacciones complejas en páginas, invocar datos de identidad locales y controlar elementos de la página, aún necesita aprovechar los límites de confianza y el sandbox de funciones del navegador. El navegador está evolucionando de una interfaz humana a una plataforma de llamadas de sistema para Agentes.

Lo que realmente podría revolucionar el panorama actual de los navegadores no es otro "mejor Chrome", sino una nueva arquitectura de interacción: pasar de la presentación de información a la llamada de tareas. El futuro de los navegadores debe ser diseñado para agentes de IA: no solo pueden leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que pueda ser llamado por LLM, logrando una mapeo de página a instrucción y reduciendo drásticamente el costo de interacción.

Los proyectos líderes en el mercado han comenzado a estructurarse: Perplexity está construyendo el navegador nativo Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando la búsqueda y las funciones de bloqueo con LLM; mientras que proyectos nativos de criptomonedas como Donut apuntan a nuevas entradas para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: reconstruir el extremo de entrada del navegador, en lugar de embellecer su capa de salida.

Para los emprendedores, la oportunidad radica en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz que conecta al mundo a través de futuros agentes, significa que quien pueda ofrecer "bloques de habilidad" que sean estructurados, invocables y de confianza, podría convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO( Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto se están reestructurando. La tercera guerra de los navegadores ocurre en la "entrada" y no en la "presentación"; lo que determina el resultado ya no es quién capta la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada para la invocación.

Consejos para emprendedores

Como emprendedor, es importante reconocer que el navegador sigue siendo la "entrada total" más grande del mundo de Internet que no ha sido reestructurada. La verdadera innovación con potencial disruptivo se encuentra en el "lado de entrada" - cómo hacer que el Agente de IA llame proactivamente a tu producto para completar tareas específicas. Esto determinará si el producto puede integrarse en el ecosistema de Agentes, obteniendo tráfico y distribución de valor.

Buscar la era escribe "clic"; la era de los agentes escribe "llamar". Reimaginar el producto como un componente API, permitiendo que los agentes no solo puedan "entenderlo", sino también "llamarlo". Enfocarse en tres dimensiones:

  1. Estandarización de la estructura de la interfaz: asegurar que el producto sea "llamable". Considerar si la estructura de la información puede estandarizarse y abstraerse en un esquema claro, si las operaciones clave pueden describirse a través de un DOM semántico o un mapeo JSON, y si se proporciona una máquina de estados para que el Agente reproduzca el flujo de comportamiento del usuario.

  2. Identidad y acceso: ayudar al Agente a "superar las barreras de confianza". Especialmente en el escenario de Web3, convertirse en la MCP(Plataforma de Múltiples Capacidades) del mundo blockchain, proporcionando una capa de instrucciones universal o un conjunto de interfaces de contratos estandarizados.

  3. Entendimiento del mecanismo de tráfico: pasar de SEO a AEO/ATF. El producto debe tener una granularidad de tareas clara, realizar optimización de agentes o adaptación de programación de tareas. Simplificar el proceso de registro, proporcionar interfaces en tiempo real y adaptar la sintaxis de llamada de diferentes marcos LLM.

Los proyectos de emprendimiento del futuro no consisten en recrear navegadores, sino en hacer que los navegadores existentes sirvan a los agentes, estableciendo un puente para la nueva generación de "flujos de comandos". Construir la "sintaxis de interfaz" que invoque al mundo de los agentes, convirtiéndose en un eslabón en la cadena de confianza de los agentes, y construir el "castillo API" del próximo modelo de búsqueda. En la era de Web3 + AI Agent, se capturan las intenciones de ejecución del agente a través de la cadena de invocación, en lugar de captar la atención del usuario a través de la interfaz de usuario.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
ChainChefvip
· 07-17 02:20
smh la receta de búsqueda de google se está volviendo un poco anticuada... es hora de añadir un poco de sazón fresca de LLM a esta sopa del navegador
Ver originalesResponder0
AirdropCollectorvip
· 07-17 02:17
IE realmente está a punto de morir.
Ver originalesResponder0
CryptoSourGrapevip
· 07-17 02:12
Ay, si hubiera sabido que Google era tan alcista, ¿por qué no vendí un riñón para comprar algunas acciones en su momento?
Ver originalesResponder0
SnapshotBotvip
· 07-17 02:09
chrome va a estar condenado, ¿verdad?
Ver originalesResponder0
TokenDustCollectorvip
· 07-17 02:06
IE ya ha caído
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)