Revolución del navegador AI: el telón de la tercera guerra de los navegadores ya ha comenzado

Navegador AI: El comienzo de la tercera guerra de los navegadores

La tercera guerra de los navegadores está ocurriendo silenciosamente. Desde Netscape y IE de Microsoft en la década de 1990, hasta Firefox con su espíritu de código abierto y Chrome de Google, la lucha entre navegadores ha sido una representación concentrada del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su velocidad de actualización y su conexión ecológica, mientras que Google, a través de su estructura de "duopolio" entre búsqueda y navegador, ha formado un ciclo cerrado de entrada de información.

Pero hoy, este patrón está siendo sacudido. El auge de los modelos de lenguaje a gran escala (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores sobre que Apple podría reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de beneficios de Alphabet, y el mercado ya ha comenzado a mostrar inquietud por la "ortodoxia de la búsqueda".

El navegador también enfrenta una reestructuración de su papel. No es solo una herramienta para mostrar páginas web, sino un contenedor que reúne múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad privada. Aunque los Agentes de IA son poderosos, para llevar a cabo interacciones complejas en las páginas, invocar datos de identidad locales y controlar elementos de la web, todavía se necesita aprovechar los límites de confianza y la sandbox funcional del navegador. El navegador está transformándose de una interfaz humana a una plataforma de llamadas del sistema para Agentes.

Lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no la presentación de información, sino la invocación de tareas. Los navegadores del futuro deben estar diseñados para el Agente AI - no solo para leer, sino también para escribir y ejecutar. Proyectos como Browser Use están intentando semanticizar la estructura de las páginas, transformando la interfaz visual en un texto estructurado llamable por LLM, logrando así una mapeo de página a instrucción, disminuyendo enormemente el costo de interacción.

Los proyectos líderes en el mercado han comenzado a experimentar: un motor de búsqueda de IA ha construido un navegador nativo, utilizando IA para reemplazar los resultados de búsqueda tradicionales; un navegador combina la protección de la privacidad con la inferencia local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que algunos proyectos nativos de Crypto apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentan reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.

Para los emprendedores, las oportunidades se encuentran en la relación triangular entre entrada, estructura y agencia. El navegador, como interfaz del futuro para la llamada a un mundo de agentes, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y de confianza, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma de los productos y el pensamiento de diseño están siendo reconfigurados. La tercera guerra de los navegadores se libra en la "entrada" y no en la "exhibición"; el resultado ya no depende de quién capte la atención del usuario, sino de quién gane la confianza de los agentes y obtenga el acceso a la invocación.

Breve historia del desarrollo de navegadores

A principios de la década de 1990, cuando Internet aún no había pasado a formar parte de la vida cotidiana, Netscape Navigator apareció repentinamente, como un barco que abre nuevas tierras, abriendo las puertas del mundo digital a millones de usuarios. Este navegador no fue el primero, pero sí fue el primero en llevar realmente a las masas y en moldear la experiencia de Internet. En ese momento, las personas podían navegar por páginas web con tanta facilidad a través de una interfaz gráfica, como si de repente todo el mundo se volviera accesible.

Sin embargo, la gloria suele ser efímera. Microsoft pronto se dio cuenta de la importancia de los navegadores y decidió forzar la inclusión de Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se considera un "golpe maestro de la plataforma", que desmanteló directamente la posición de dominio de mercado de Netscape. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era el predeterminado del sistema. IE, aprovechando la capacidad de distribución de Windows, rápidamente se convirtió en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.

En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical y idealista: hicieron público el código fuente del navegador y lanzaron un llamado a la comunidad de código abierto. Esta decisión fue como un "dejarse llevar al estilo macedonio" en el ámbito tecnológico, presagiando el final de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, inicialmente llamado Phoenix (que significa renacimiento del fénix), pero debido a problemas de marca, pasó por varios cambios de nombre, y finalmente se llamó Firefox.

Firefox no es una simple copia de Netscape, ha logrado múltiples avances en experiencia del usuario, ecosistema de plugins, seguridad, entre otros. Su nacimiento marca la victoria del espíritu de código abierto y también inyecta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, así como el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene su significado.

Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando su ventaja de tiempo y su estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, lo que hacía que esta competencia no fuera una competencia justa en la que todos partieran desde la misma línea de salida.

Mientras tanto, otro jugador temprano también ha hecho su aparición. En 1994, se lanzó el navegador Opera, que proviene de Noruega y en un principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto, desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque el número de usuarios fue limitado, siempre se mantuvo a la vanguardia de la industria tecnológicamente, convirtiéndose en "el favorito de los geeks".

Ese mismo año, Apple lanzó el navegador Safari. Fue un giro significativo. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener las apariencias de competencia y evitar una revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su creación es Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: cooperación y competencia, siempre van de la mano.

En 2007, IE7 se lanzó junto con Windows Vista, pero la respuesta del mercado fue tibia. En cambio, Firefox, gracias a su ritmo de actualización más rápido, su mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio aumentar su participación en el mercado hasta aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y el viento estaba cambiando.

Un gigante tecnológico tiene un enfoque diferente. Aunque comenzó a gestar su propio navegador desde 2001, le tomó seis años convencer al CEO para aprobar el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó como el navegador "pesado", pero gracias a la profunda habilidad de la empresa en publicidad y creación de marca, rápidamente se elevó.

La clave del éxito de Chrome no son sus funcionalidades, sino el ritmo frecuente de actualizaciones de versiones (cada seis semanas) y la experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, volvió a superar a IE, completando la transición de retador a dominante.

Al mismo tiempo, el internet móvil en China también está formando su propio ecosistema. Un navegador de una empresa tecnológica nacional se volvió muy popular a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, ganándose la preferencia de los usuarios de dispositivos de gama baja gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un máximo del 46%. Pero esta victoria no fue duradera. Con el gobierno indio reforzando la revisión de seguridad de las aplicaciones chinas, el navegador se vio obligado a retirarse de este mercado clave, perdiendo gradualmente su antiguo esplendor.

A medida que entramos en la década de 2020, la posición dominante de Chrome se ha consolidado, con una cuota de mercado global estable alrededor del 65%. Es importante señalar que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla alrededor del noventa por ciento de las entradas de búsqueda globales, mientras que el segundo tiene el control de la "primera ventana" a través de la cual la mayoría de los usuarios acceden a la web.

Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición de búsqueda predeterminada en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "tasa de protección" para su fortaleza.

Pero el viento ha cambiado una vez más. Con el auge de los modelos de lenguaje de gran tamaño (LLM), la búsqueda tradicional ha comenzado a verse afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas ya son visibles. Más disruptivo aún son los rumores de que Apple podría lanzar su propio motor de búsqueda de IA; si Safari cambia su búsqueda predeterminada a su propio ecosistema, esto no solo reescribiría el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. El mercado reaccionó rápidamente, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, lo que refleja no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.

Desde Navigator hasta Chrome, desde el ideal del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda AI, la lucha de los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controla la entrada, define el futuro.

En la opinión de los VC, apoyándose en la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores se está desarrollando gradualmente.

La arquitectura anticuada de los navegadores modernos

Hablando de la arquitectura del navegador, la clásica arquitectura tradicional se muestra en la siguiente imagen:

Cliente - Entrada del frontend

Consulta la entrega más reciente de Google Front End a través de HTTPS, completa la descifrado TLS, la muestreo de QoS y el enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, raspado automático), se puede limitar o desafiar en esta capa.

Consulta de comprensión

El frontend necesita entender el significado de las palabras que el usuario escribe, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intenciones, determinando si la consulta es de información, navegación o intención de transacción, y asignando la solicitud Vertical.

Recuperación de candidatos

La tecnología de consulta utilizada por un gigante tecnológico se llama: índice invertido. En un índice directo, se nos da un ID para poder indexar un archivo. Sin embargo, los usuarios no pueden conocer el número de contenido deseado entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional para consultar qué archivos tienen palabras clave correspondientes. A continuación, la empresa utiliza el índice de vectores para manejar la búsqueda semántica, es decir, para encontrar contenido que sea semánticamente similar a la consulta. Convierte texto, imágenes y otros contenidos en vectores de alta dimensión (embedding) y busca en función de la similitud entre esos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa de pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", porque son semánticamente similares. Después del índice invertido y el índice de vectores, se filtran inicialmente alrededor de cien mil páginas web.

Ordenación múltiple

Los sistemas suelen filtrar cientos de miles de páginas candidatas a aproximadamente 1000, utilizando características ligeras de miles de dimensiones como BM25, TF-IDF y puntuaciones de calidad de página, formando así un conjunto de candidatos preliminares. Estos sistemas se conocen colectivamente como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, que incluyen el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales de contexto. Por ejemplo, la empresa integra la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, entre otros, y también considera factores de contexto, como el tiempo (horario del día, días específicos de la semana) y eventos externos como noticias de última hora.

Clasificación principal mediante aprendizaje profundo

En la fase de búsqueda preliminar, un gigante tecnológico utiliza tecnologías como RankBrain y Neural Matching para entender el significado de las consultas y filtrar resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático que la compañía introdujo en 2015, con el objetivo de comprender mejor el significado de las consultas de los usuarios, especialmente las consultas que aparecen por primera vez. Convierte las consultas y documentos en representaciones vectoriales para calcular la similitud entre ellos y así encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer una pizza".

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 3
  • Compartir
Comentar
0/400
DevChivevip
· hace22h
¿Con estas pocas cosas se puede luchar?
Ver originalesResponder0
TokenStormvip
· hace22h
Vi los indicadores, introducir una posición navegador.
Ver originalesResponder0
ArbitrageBotvip
· hace22h
IE está condenado, ahora han vuelto a pelear.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)