Navegador de IA: O início da terceira guerra dos navegadores
A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde o Netscape e o Internet Explorer da Microsoft na década de 1990, até o espírito de código aberto do Firefox e o Chrome do Google, a disputa entre navegadores sempre foi uma expressão concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição de domínio com sua velocidade de atualização e interconexão ecológica, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.
Mas hoje, esse padrão está sendo abalado. A ascensão dos grandes modelos de linguagem (LLM) está fazendo com que cada vez mais usuários completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, os rumores de que a Apple pode substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a mostrar inquietação em relação à "ortodoxia da busca".
O próprio navegador está também a enfrentar uma reconfiguração do seu papel. Ele deixou de ser apenas uma ferramenta para exibir páginas da web e tornou-se um recipiente que agrega diversas capacidades, como a entrada de dados, o comportamento dos usuários e a identidade de privacidade. Embora o AI Agent seja forte, para realizar interações complexas em páginas, invocar dados de identidade locais e controlar elementos da web, ainda é necessário recorrer às fronteiras de confiança e ao sandbox funcional do navegador. O navegador está a transformar-se de uma interface humana em uma plataforma de chamadas de sistema para o Agent.
O que realmente pode quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não a exibição de informações, mas a invocação de tarefas. O navegador do futuro deve ser projetado para Agentes de IA - não apenas para ler, mas também para escrever e executar. Projetos como o Browser Use estão tentando semantizar a estrutura da página, transformando a interface visual em um texto estruturado que pode ser invocado por LLM, realizando o mapeamento de páginas para comandos, reduzindo drasticamente o custo de interação.
Os principais projetos no mercado começaram a experimentar: um certo motor de busca AI construiu um navegador nativo, substituindo os resultados de busca tradicionais por AI; um certo navegador combinou proteção de privacidade com raciocínio local, usando LLM para aprimorar a busca e as funções de bloqueio; enquanto certos projetos nativos de Crypto visam uma nova entrada para a interação entre AI e ativos em cadeia. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface que invoca o mundo no futuro, significa que quem puder fornecer "blocos de capacidade" estruturados, invocáveis e confiáveis, poderá se tornar parte da nova geração de plataformas. Desde SEO até AEO (Otimização do Motor de Agentes), do tráfego de página à invocação de cadeias de tarefas, as formas de produtos e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; quem decide o vencedor não é mais quem chama a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para invocação.
História do desenvolvimento dos navegadores
No início da década de 90, quando a internet ainda não fazia parte da vida cotidiana, o Netscape Navigator surgiu como um barco à vela que abria um novo continente, permitindo a milhões de usuários acessar o mundo digital. Este navegador não foi o primeiro, mas foi o primeiro produto verdadeiramente voltado para o público em geral, moldando a experiência da internet. Naquela época, as pessoas podiam navegar em páginas da web de forma tão fácil através de uma interface gráfica, como se o mundo inteiro de repente se tornasse ao alcance das mãos.
No entanto, o brilho é muitas vezes efémero. A Microsoft rapidamente percebeu a importância do navegador e decidiu forçar a integração do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia é conhecida como "arma secreta da plataforma", e desmantelou diretamente a posição de liderança de mercado da Netscape. Muitos usuários não escolheram o IE ativamente, mas o aceitaram porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder da indústria, enquanto a Netscape entrou em um caminho de declínio.
Em meio à adversidade, os engenheiros da Netscape escolheram um caminho radical e idealista - eles tornaram o código-fonte do navegador público, convocando a comunidade de código aberto. Esta decisão parecia ser uma "cedência macedônica" no mundo da tecnologia, sinalizando o fim de uma era e o surgimento de novas forças. Este código acabou por se tornar a base do projeto do navegador Mozilla, inicialmente nomeado de Phoenix (que significa renascimento da fênix), mas devido a problemas de marca, passou por várias renomeações, até ser finalmente chamado de Firefox.
O Firefox não é uma simples cópia do Netscape; ele realizou várias inovações em termos de experiência do usuário, ecossistema de plugins e segurança. Seu surgimento marcou a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou os últimos resquícios do Império Bizantino. Esta metáfora, embora exagerada, é bastante significativa.
Mas nos anos anteriores ao lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem de tempo e a estratégia de bundling do sistema, fazendo com que o Firefox estivesse em uma posição de perseguição desde o início, o que tornava esta competição desigual desde o início.
Ao mesmo tempo, outro jogador inicial estava silenciosamente surgindo. Em 1994, o navegador Opera foi lançado, originário da Noruega, e inicialmente era apenas um projeto experimental. Mas a partir da versão 7.0 de 2003, introduziu o motor Presto desenvolvido internamente, sendo o primeiro a suportar tecnologias de ponta como CSS, layouts responsivos, controle por voz e codificação Unicode. Embora o número de usuários fosse limitado, a tecnologia sempre esteve na vanguarda da indústria, tornando-se "o favorito dos geeks".
No mesmo ano, a Apple lançou o navegador Safari. Esta foi uma reviravolta significativa. Naquela época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter as aparências de concorrência e evitar uma investigação antitruste. Embora o motor de busca padrão do Safari desde o seu nascimento seja o Google, esse enredo histórico com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: a cooperação e a concorrência estão sempre interligadas.
Em 2007, o IE7 foi lançado com o Windows Vista, mas o feedback do mercado foi morno. Em contraste, o Firefox, com seu ritmo de atualização mais rápido, mecanismo de extensões mais amigável e atração natural para desenvolvedores, viu sua participação de mercado aumentar de forma constante para cerca de 20%. O domínio do IE começou a enfraquecer, e a maré estava mudando.
Um gigante da tecnologia adotou uma abordagem diferente. Embora tenha começado a conceber seu próprio navegador desde 2001, levou seis anos para convencer o CEO a aprovar o projeto. O Chrome foi lançado em 2008, baseado no projeto de código aberto Chromium e no motor WebKit utilizado pelo Safari. Foi apelidado de "navegador pesado", mas, com a profunda habilidade da empresa em publicidade e construção de marca, rapidamente se destacou.
A arma secreta do Chrome não são as funcionalidades, mas sim o ritmo frequente de atualizações (a cada seis semanas) e a experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou pela primeira vez o Firefox, alcançando 27% de participação no mercado; seis meses depois, superou novamente o IE, completando a transição de desafiador a dominador.
Ao mesmo tempo, a internet móvel da China também está formando seu próprio ecossistema. Um navegador sob uma empresa de tecnologia nacional ganhou rapidamente destaque no início da década de 2010, especialmente em mercados emergentes como a Índia, Indonésia e China, conquistando a preferência dos usuários de dispositivos de baixo custo devido ao seu design leve e características como compressão de dados para economizar tráfego. Em 2015, sua participação no mercado global de navegadores móveis ultrapassou 17%, chegando a 46% na Índia em um determinado momento. Mas essa vitória não durou. Com o governo indiano intensificando a revisão de segurança de aplicativos chineses, o navegador foi forçado a sair de um mercado crítico, perdendo gradualmente seu antigo brilho.
Entrando na década de 2020, a posição dominante do Chrome já está estabelecida, com uma quota de mercado global estável em cerca de 65%. Vale a pena notar que, embora o motor de busca Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista do mercado, eles são dois sistemas hegemônicos independentes - o primeiro controla cerca de 90% das entradas de pesquisa globais, enquanto o segundo detém a maioria dos usuários que acessam a internet pela "primeira janela".
Para manter essa estrutura de duopólio, o Google não hesitou em investir pesadamente. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple apenas para manter o Google como o motor de busca padrão no Safari. Algumas análises apontam que esse gasto corresponde a 36% da receita de anúncios de busca que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para sua fortaleza.
Mas a direção mudou novamente. Com o surgimento de grandes modelos de linguagem (LLM), as buscas tradicionais começaram a ser impactadas. Em 2024, a participação de mercado da busca do Google caiu de 93% para 89%, embora ainda domine, as fissuras começaram a aparecer. Mais disruptivas são os rumores de que a Apple poderá lançar seu próprio motor de busca de IA - se o Safari mudar sua busca padrão para seu próprio ecossistema, isso não apenas reescreverá o cenário ecológico, mas poderá também abalar os pilares de lucro da Alphabet. O mercado reagiu rapidamente, e as ações da Alphabet caíram de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda inquietação sobre a direção futura da era das buscas.
Desde o Navigator até ao Chrome, desde o ideal open source até à comercialização de anúncios, desde navegadores leves até assistentes de busca com IA, a batalha dos navegadores tem sido sempre uma guerra sobre tecnologia, plataformas, conteúdo e controle. O campo de batalha está em constante mudança, mas a essência nunca muda: quem controla a entrada, define o futuro.
Na visão dos VCs, apoiada pela nova demanda das pessoas por motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está a desenrolar-se gradualmente.
A arquitetura antiga dos navegadores modernos
Falando sobre a arquitetura dos navegadores, a arquitetura tradicional clássica é mostrada na figura abaixo:
Cliente - Entrada do Frontend
Consultar o Google Front End mais próximo via HTTPS, completar a descriptografia TLS, amostragem de QoS e roteamento geográfico. Se tráfego anômalo (DDoS, scraping automático) for detectado, pode-se limitar ou desafiar neste nível.
Consulta de Compreensão
A front-end precisa entender o significado das palavras digitadas pelo usuário, e há três etapas: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é de informação, navegação ou intenção de transação, e alocando a solicitação Vertical.
Recall de Candidatos
A tecnologia de consulta utilizada por um gigante da tecnologia é chamada de: índice invertido. No índice direto, temos um ID que nos permite indexar um arquivo. No entanto, os usuários não conseguem saber o número de conteúdo desejado entre trilhões de arquivos, por isso, adotaram um índice invertido muito tradicional, que permite consultar quais arquivos têm palavras-chave correspondentes. Em seguida, a empresa adotou o índice vetorial para processar a busca semântica, ou seja, encontrar conteúdos com significados semelhantes à consulta. Isso transforma textos, imagens e outros conteúdos em vetores de alta dimensão (embedding) e realiza buscas com base na similaridade entre esses vetores. Por exemplo, mesmo que um usuário pesquise "como fazer massa de pizza", o mecanismo de busca pode retornar resultados relacionados a "guia de fabricação de massa de pizza", pois são semanticamente semelhantes. Após o índice invertido e o índice vetorial, aproximadamente cem mil páginas da web são inicialmente filtradas.
Ordenação em múltiplos níveis
Os sistemas normalmente filtram centenas de milhares de páginas candidatas para cerca de 1000, utilizando características leves de milhares de dimensões, como BM25, TF-IDF e pontuação de qualidade da página, formando um conjunto inicial de candidatos. Esses sistemas são coletivamente chamados de motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de pesquisa e sinais de contexto. Por exemplo, a empresa considera o histórico do usuário, o feedback de comportamento de outros usuários, a semântica da página, o significado da consulta, entre outras informações, ao mesmo tempo que leva em conta fatores de contexto, como o tempo (períodos do dia, dias específicos da semana) e eventos externos, como notícias em tempo real.
Aprendizado profundo para classificação principal
Na fase de pesquisa inicial, uma grande empresa de tecnologia utiliza tecnologias como RankBrain e Neural Matching para entender o significado das consultas e filtrar resultados preliminares de documentos em grande quantidade. RankBrain é um sistema de aprendizado de máquina introduzido pela empresa em 2015, com o objetivo de entender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele converte consultas e documentos em representações vetoriais e calcula a similaridade entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer pizza"
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
10 gostos
Recompensa
10
3
Partilhar
Comentar
0/400
DevChive
· 22h atrás
Com tão pouco, que batalha se pode lutar?
Ver originalResponder0
TokenStorm
· 22h atrás
Olhei os indicadores, entrar numa posição no conceito de navegador.
Ver originalResponder0
ArbitrageBot
· 22h atrás
IE está condenado, agora está tudo a começar de novo.
Revolução do navegador de IA: O início da terceira guerra dos navegadores já foi bombear
Navegador de IA: O início da terceira guerra dos navegadores
A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde o Netscape e o Internet Explorer da Microsoft na década de 1990, até o espírito de código aberto do Firefox e o Chrome do Google, a disputa entre navegadores sempre foi uma expressão concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição de domínio com sua velocidade de atualização e interconexão ecológica, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.
Mas hoje, esse padrão está sendo abalado. A ascensão dos grandes modelos de linguagem (LLM) está fazendo com que cada vez mais usuários completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, os rumores de que a Apple pode substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a mostrar inquietação em relação à "ortodoxia da busca".
O próprio navegador está também a enfrentar uma reconfiguração do seu papel. Ele deixou de ser apenas uma ferramenta para exibir páginas da web e tornou-se um recipiente que agrega diversas capacidades, como a entrada de dados, o comportamento dos usuários e a identidade de privacidade. Embora o AI Agent seja forte, para realizar interações complexas em páginas, invocar dados de identidade locais e controlar elementos da web, ainda é necessário recorrer às fronteiras de confiança e ao sandbox funcional do navegador. O navegador está a transformar-se de uma interface humana em uma plataforma de chamadas de sistema para o Agent.
O que realmente pode quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não a exibição de informações, mas a invocação de tarefas. O navegador do futuro deve ser projetado para Agentes de IA - não apenas para ler, mas também para escrever e executar. Projetos como o Browser Use estão tentando semantizar a estrutura da página, transformando a interface visual em um texto estruturado que pode ser invocado por LLM, realizando o mapeamento de páginas para comandos, reduzindo drasticamente o custo de interação.
Os principais projetos no mercado começaram a experimentar: um certo motor de busca AI construiu um navegador nativo, substituindo os resultados de busca tradicionais por AI; um certo navegador combinou proteção de privacidade com raciocínio local, usando LLM para aprimorar a busca e as funções de bloqueio; enquanto certos projetos nativos de Crypto visam uma nova entrada para a interação entre AI e ativos em cadeia. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface que invoca o mundo no futuro, significa que quem puder fornecer "blocos de capacidade" estruturados, invocáveis e confiáveis, poderá se tornar parte da nova geração de plataformas. Desde SEO até AEO (Otimização do Motor de Agentes), do tráfego de página à invocação de cadeias de tarefas, as formas de produtos e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; quem decide o vencedor não é mais quem chama a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para invocação.
História do desenvolvimento dos navegadores
No início da década de 90, quando a internet ainda não fazia parte da vida cotidiana, o Netscape Navigator surgiu como um barco à vela que abria um novo continente, permitindo a milhões de usuários acessar o mundo digital. Este navegador não foi o primeiro, mas foi o primeiro produto verdadeiramente voltado para o público em geral, moldando a experiência da internet. Naquela época, as pessoas podiam navegar em páginas da web de forma tão fácil através de uma interface gráfica, como se o mundo inteiro de repente se tornasse ao alcance das mãos.
No entanto, o brilho é muitas vezes efémero. A Microsoft rapidamente percebeu a importância do navegador e decidiu forçar a integração do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia é conhecida como "arma secreta da plataforma", e desmantelou diretamente a posição de liderança de mercado da Netscape. Muitos usuários não escolheram o IE ativamente, mas o aceitaram porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder da indústria, enquanto a Netscape entrou em um caminho de declínio.
Em meio à adversidade, os engenheiros da Netscape escolheram um caminho radical e idealista - eles tornaram o código-fonte do navegador público, convocando a comunidade de código aberto. Esta decisão parecia ser uma "cedência macedônica" no mundo da tecnologia, sinalizando o fim de uma era e o surgimento de novas forças. Este código acabou por se tornar a base do projeto do navegador Mozilla, inicialmente nomeado de Phoenix (que significa renascimento da fênix), mas devido a problemas de marca, passou por várias renomeações, até ser finalmente chamado de Firefox.
O Firefox não é uma simples cópia do Netscape; ele realizou várias inovações em termos de experiência do usuário, ecossistema de plugins e segurança. Seu surgimento marcou a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou os últimos resquícios do Império Bizantino. Esta metáfora, embora exagerada, é bastante significativa.
Mas nos anos anteriores ao lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem de tempo e a estratégia de bundling do sistema, fazendo com que o Firefox estivesse em uma posição de perseguição desde o início, o que tornava esta competição desigual desde o início.
Ao mesmo tempo, outro jogador inicial estava silenciosamente surgindo. Em 1994, o navegador Opera foi lançado, originário da Noruega, e inicialmente era apenas um projeto experimental. Mas a partir da versão 7.0 de 2003, introduziu o motor Presto desenvolvido internamente, sendo o primeiro a suportar tecnologias de ponta como CSS, layouts responsivos, controle por voz e codificação Unicode. Embora o número de usuários fosse limitado, a tecnologia sempre esteve na vanguarda da indústria, tornando-se "o favorito dos geeks".
No mesmo ano, a Apple lançou o navegador Safari. Esta foi uma reviravolta significativa. Naquela época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter as aparências de concorrência e evitar uma investigação antitruste. Embora o motor de busca padrão do Safari desde o seu nascimento seja o Google, esse enredo histórico com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: a cooperação e a concorrência estão sempre interligadas.
Em 2007, o IE7 foi lançado com o Windows Vista, mas o feedback do mercado foi morno. Em contraste, o Firefox, com seu ritmo de atualização mais rápido, mecanismo de extensões mais amigável e atração natural para desenvolvedores, viu sua participação de mercado aumentar de forma constante para cerca de 20%. O domínio do IE começou a enfraquecer, e a maré estava mudando.
Um gigante da tecnologia adotou uma abordagem diferente. Embora tenha começado a conceber seu próprio navegador desde 2001, levou seis anos para convencer o CEO a aprovar o projeto. O Chrome foi lançado em 2008, baseado no projeto de código aberto Chromium e no motor WebKit utilizado pelo Safari. Foi apelidado de "navegador pesado", mas, com a profunda habilidade da empresa em publicidade e construção de marca, rapidamente se destacou.
A arma secreta do Chrome não são as funcionalidades, mas sim o ritmo frequente de atualizações (a cada seis semanas) e a experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou pela primeira vez o Firefox, alcançando 27% de participação no mercado; seis meses depois, superou novamente o IE, completando a transição de desafiador a dominador.
Ao mesmo tempo, a internet móvel da China também está formando seu próprio ecossistema. Um navegador sob uma empresa de tecnologia nacional ganhou rapidamente destaque no início da década de 2010, especialmente em mercados emergentes como a Índia, Indonésia e China, conquistando a preferência dos usuários de dispositivos de baixo custo devido ao seu design leve e características como compressão de dados para economizar tráfego. Em 2015, sua participação no mercado global de navegadores móveis ultrapassou 17%, chegando a 46% na Índia em um determinado momento. Mas essa vitória não durou. Com o governo indiano intensificando a revisão de segurança de aplicativos chineses, o navegador foi forçado a sair de um mercado crítico, perdendo gradualmente seu antigo brilho.
Entrando na década de 2020, a posição dominante do Chrome já está estabelecida, com uma quota de mercado global estável em cerca de 65%. Vale a pena notar que, embora o motor de busca Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista do mercado, eles são dois sistemas hegemônicos independentes - o primeiro controla cerca de 90% das entradas de pesquisa globais, enquanto o segundo detém a maioria dos usuários que acessam a internet pela "primeira janela".
Para manter essa estrutura de duopólio, o Google não hesitou em investir pesadamente. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple apenas para manter o Google como o motor de busca padrão no Safari. Algumas análises apontam que esse gasto corresponde a 36% da receita de anúncios de busca que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para sua fortaleza.
Mas a direção mudou novamente. Com o surgimento de grandes modelos de linguagem (LLM), as buscas tradicionais começaram a ser impactadas. Em 2024, a participação de mercado da busca do Google caiu de 93% para 89%, embora ainda domine, as fissuras começaram a aparecer. Mais disruptivas são os rumores de que a Apple poderá lançar seu próprio motor de busca de IA - se o Safari mudar sua busca padrão para seu próprio ecossistema, isso não apenas reescreverá o cenário ecológico, mas poderá também abalar os pilares de lucro da Alphabet. O mercado reagiu rapidamente, e as ações da Alphabet caíram de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda inquietação sobre a direção futura da era das buscas.
Desde o Navigator até ao Chrome, desde o ideal open source até à comercialização de anúncios, desde navegadores leves até assistentes de busca com IA, a batalha dos navegadores tem sido sempre uma guerra sobre tecnologia, plataformas, conteúdo e controle. O campo de batalha está em constante mudança, mas a essência nunca muda: quem controla a entrada, define o futuro.
Na visão dos VCs, apoiada pela nova demanda das pessoas por motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está a desenrolar-se gradualmente.
A arquitetura antiga dos navegadores modernos
Falando sobre a arquitetura dos navegadores, a arquitetura tradicional clássica é mostrada na figura abaixo:
Cliente - Entrada do Frontend
Consultar o Google Front End mais próximo via HTTPS, completar a descriptografia TLS, amostragem de QoS e roteamento geográfico. Se tráfego anômalo (DDoS, scraping automático) for detectado, pode-se limitar ou desafiar neste nível.
Consulta de Compreensão
A front-end precisa entender o significado das palavras digitadas pelo usuário, e há três etapas: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é de informação, navegação ou intenção de transação, e alocando a solicitação Vertical.
Recall de Candidatos
A tecnologia de consulta utilizada por um gigante da tecnologia é chamada de: índice invertido. No índice direto, temos um ID que nos permite indexar um arquivo. No entanto, os usuários não conseguem saber o número de conteúdo desejado entre trilhões de arquivos, por isso, adotaram um índice invertido muito tradicional, que permite consultar quais arquivos têm palavras-chave correspondentes. Em seguida, a empresa adotou o índice vetorial para processar a busca semântica, ou seja, encontrar conteúdos com significados semelhantes à consulta. Isso transforma textos, imagens e outros conteúdos em vetores de alta dimensão (embedding) e realiza buscas com base na similaridade entre esses vetores. Por exemplo, mesmo que um usuário pesquise "como fazer massa de pizza", o mecanismo de busca pode retornar resultados relacionados a "guia de fabricação de massa de pizza", pois são semanticamente semelhantes. Após o índice invertido e o índice vetorial, aproximadamente cem mil páginas da web são inicialmente filtradas.
Ordenação em múltiplos níveis
Os sistemas normalmente filtram centenas de milhares de páginas candidatas para cerca de 1000, utilizando características leves de milhares de dimensões, como BM25, TF-IDF e pontuação de qualidade da página, formando um conjunto inicial de candidatos. Esses sistemas são coletivamente chamados de motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de pesquisa e sinais de contexto. Por exemplo, a empresa considera o histórico do usuário, o feedback de comportamento de outros usuários, a semântica da página, o significado da consulta, entre outras informações, ao mesmo tempo que leva em conta fatores de contexto, como o tempo (períodos do dia, dias específicos da semana) e eventos externos, como notícias em tempo real.
Aprendizado profundo para classificação principal
Na fase de pesquisa inicial, uma grande empresa de tecnologia utiliza tecnologias como RankBrain e Neural Matching para entender o significado das consultas e filtrar resultados preliminares de documentos em grande quantidade. RankBrain é um sistema de aprendizado de máquina introduzido pela empresa em 2015, com o objetivo de entender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele converte consultas e documentos em representações vetoriais e calcula a similaridade entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer pizza"