A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape até o IE, passando pelo Firefox e Chrome, a disputa entre navegadores sempre foi um reflexo do controle da plataforma e das mudanças no paradigma tecnológico. O Chrome tornou-se o líder devido às atualizações rápidas e à interconexão do ecossistema, enquanto o Google, através da estrutura de duopólio de busca e navegador, formou um ciclo fechado de entrada de informações.
Mas este padrão está a tremer. O surgimento do modelo de linguagem (LLM) está a fazer com que cada vez mais utilizadores completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento de clique em páginas da web tradicionais. Ao mesmo tempo, rumores sobre a possibilidade de a Apple substituir o motor de busca por defeito no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a revelar inquietações sobre a "ortodoxia da busca".
O navegador em si também enfrenta uma reconfiguração de papéis. Ele não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário, identidade de privacidade, entre outras. Embora o Agente de IA seja poderoso, para completar interações complexas em páginas, acessar dados de identidade local e controlar elementos da página, ainda precisa da confiança e da funcionalidade do navegador. O navegador está evoluindo de uma interface humana para uma plataforma de chamadas de sistema para Agentes.
O que realmente pode revolucionar o atual cenário dos navegadores não é outro "Chrome melhor", mas sim uma nova arquitetura de interação: a transição de exibição de informações para a chamada de tarefas. O navegador do futuro deve ser projetado para o Agente AI - que não apenas pode ler, mas também escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando interfaces visuais em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para comandos e reduzindo significativamente o custo de interação.
Os projetos principais no mercado começaram a se posicionar: a Perplexity está construindo um navegador nativo chamado Comet, substituindo os resultados de busca tradicionais por AI; a Brave combina proteção de privacidade com raciocínio local, utilizando LLM para aprimorar a busca e as funções de bloqueio; enquanto projetos nativos de criptomoeda como o Donut estão mirando em novas entradas para a interação entre AI e ativos em blockchain. A característica comum desses projetos é: reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, a oportunidade reside na relação triangular entre entrada, estrutura e agente. O navegador, como a interface do futuro para a invocação do mundo pelos Agentes, significa que quem puder fornecer "blocos de capacidade" que sejam estruturados, invocáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO(Agent Engine Optimization), desde o tráfego de páginas até a invocação de cadeias de tarefas, a forma do produto e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que determina o vencedor não é mais quem captura a atenção do usuário, mas quem ganha a confiança do Agente e obtém a entrada para a invocação.
Conselhos para empreendedores
Como empreendedor, é importante reconhecer que o navegador ainda é a "porta de entrada" não reconstruída mais significativa do mundo da internet. A verdadeira inovação com potencial disruptivo reside na "lateral de entrada" - como fazer com que o Agente de IA chame ativamente o seu produto para realizar tarefas específicas. Isso determinará se o produto pode ser integrado ao ecossistema do Agente, obtendo fluxo e distribuição de valor.
Pesquise a era da combinação "clique"; a era da combinação "chamada". Reimagine o produto como um componente de API, permitindo que os agentes não apenas "entendam" isso, mas também "chamem" isso. Concentre-se em três dimensões:
Estrutura de interface padronizada: garantir que o produto seja "chamável". Considerar se a estrutura da informação pode ser padronizada e abstraída em um schema claro, se as operações-chave podem ser descritas através de um DOM semântico ou mapeamento JSON, se é fornecida uma máquina de estados para que o Agente reproduza o fluxo de comportamento do usuário.
Identidade e Acesso: Ajudar o Agente a "superar barreiras de confiança". Especialmente no cenário Web3, tornando-se a MCP(Multi Capability Platform) do mundo blockchain, oferecendo uma camada de instruções genéricas ou um conjunto de interfaces de contrato padronizadas.
Compreensão do mecanismo de tráfego: passando de SEO para AEO/ATF. O produto deve ter uma granularidade de tarefa clara, realizando otimização de agente ou adaptação de agendamento de tarefas. Simplificar o processo de registro, fornecer interfaces em tempo real e adaptar a sintaxe de chamada de diferentes estruturas LLM.
Os futuros projetos de empreendedorismo não consistem em recriar navegadores, mas sim em fazer com que os navegadores existentes sirvam os Agentes, estabelecendo uma ponte para a nova geração de "fluxo de comandos". Construir a "sintaxe de interface" que chama o mundo dos Agentes, tornando-se um elo na cadeia de confiança dos agentes inteligentes, e erguer o "castelo de APIs" para o próximo modelo de busca. Na era do Web3 + Agente AI, a intenção de execução do Agente é capturada pela cadeia de chamadas, e não pela UI que captura a atenção do usuário.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
18 gostos
Recompensa
18
5
Partilhar
Comentar
0/400
ChainChef
· 07-17 02:20
smh a pesquisa do google está a tornar-se um pouco antiquada... é hora de adicionar um pouco de tempero LLM fresco a esta sopa do navegador
Ver originalResponder0
AirdropCollector
· 07-17 02:17
IE está realmente a morrer.
Ver originalResponder0
CryptoSourGrape
· 07-17 02:12
Ai, se eu soubesse que o Google era tão bull, por que não vendi um rim para comprar algumas ações naquela época?
A IA está a reconfigurar o panorama dos navegadores: desde a interface do utilizador até à plataforma de chamada de agentes
O novo panorama dos navegadores na era da IA
A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape até o IE, passando pelo Firefox e Chrome, a disputa entre navegadores sempre foi um reflexo do controle da plataforma e das mudanças no paradigma tecnológico. O Chrome tornou-se o líder devido às atualizações rápidas e à interconexão do ecossistema, enquanto o Google, através da estrutura de duopólio de busca e navegador, formou um ciclo fechado de entrada de informações.
Mas este padrão está a tremer. O surgimento do modelo de linguagem (LLM) está a fazer com que cada vez mais utilizadores completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento de clique em páginas da web tradicionais. Ao mesmo tempo, rumores sobre a possibilidade de a Apple substituir o motor de busca por defeito no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a revelar inquietações sobre a "ortodoxia da busca".
O navegador em si também enfrenta uma reconfiguração de papéis. Ele não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário, identidade de privacidade, entre outras. Embora o Agente de IA seja poderoso, para completar interações complexas em páginas, acessar dados de identidade local e controlar elementos da página, ainda precisa da confiança e da funcionalidade do navegador. O navegador está evoluindo de uma interface humana para uma plataforma de chamadas de sistema para Agentes.
O que realmente pode revolucionar o atual cenário dos navegadores não é outro "Chrome melhor", mas sim uma nova arquitetura de interação: a transição de exibição de informações para a chamada de tarefas. O navegador do futuro deve ser projetado para o Agente AI - que não apenas pode ler, mas também escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando interfaces visuais em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para comandos e reduzindo significativamente o custo de interação.
Os projetos principais no mercado começaram a se posicionar: a Perplexity está construindo um navegador nativo chamado Comet, substituindo os resultados de busca tradicionais por AI; a Brave combina proteção de privacidade com raciocínio local, utilizando LLM para aprimorar a busca e as funções de bloqueio; enquanto projetos nativos de criptomoeda como o Donut estão mirando em novas entradas para a interação entre AI e ativos em blockchain. A característica comum desses projetos é: reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, a oportunidade reside na relação triangular entre entrada, estrutura e agente. O navegador, como a interface do futuro para a invocação do mundo pelos Agentes, significa que quem puder fornecer "blocos de capacidade" que sejam estruturados, invocáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO(Agent Engine Optimization), desde o tráfego de páginas até a invocação de cadeias de tarefas, a forma do produto e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que determina o vencedor não é mais quem captura a atenção do usuário, mas quem ganha a confiança do Agente e obtém a entrada para a invocação.
Conselhos para empreendedores
Como empreendedor, é importante reconhecer que o navegador ainda é a "porta de entrada" não reconstruída mais significativa do mundo da internet. A verdadeira inovação com potencial disruptivo reside na "lateral de entrada" - como fazer com que o Agente de IA chame ativamente o seu produto para realizar tarefas específicas. Isso determinará se o produto pode ser integrado ao ecossistema do Agente, obtendo fluxo e distribuição de valor.
Pesquise a era da combinação "clique"; a era da combinação "chamada". Reimagine o produto como um componente de API, permitindo que os agentes não apenas "entendam" isso, mas também "chamem" isso. Concentre-se em três dimensões:
Estrutura de interface padronizada: garantir que o produto seja "chamável". Considerar se a estrutura da informação pode ser padronizada e abstraída em um schema claro, se as operações-chave podem ser descritas através de um DOM semântico ou mapeamento JSON, se é fornecida uma máquina de estados para que o Agente reproduza o fluxo de comportamento do usuário.
Identidade e Acesso: Ajudar o Agente a "superar barreiras de confiança". Especialmente no cenário Web3, tornando-se a MCP(Multi Capability Platform) do mundo blockchain, oferecendo uma camada de instruções genéricas ou um conjunto de interfaces de contrato padronizadas.
Compreensão do mecanismo de tráfego: passando de SEO para AEO/ATF. O produto deve ter uma granularidade de tarefa clara, realizando otimização de agente ou adaptação de agendamento de tarefas. Simplificar o processo de registro, fornecer interfaces em tempo real e adaptar a sintaxe de chamada de diferentes estruturas LLM.
Os futuros projetos de empreendedorismo não consistem em recriar navegadores, mas sim em fazer com que os navegadores existentes sirvam os Agentes, estabelecendo uma ponte para a nova geração de "fluxo de comandos". Construir a "sintaxe de interface" que chama o mundo dos Agentes, tornando-se um elo na cadeia de confiança dos agentes inteligentes, e erguer o "castelo de APIs" para o próximo modelo de busca. Na era do Web3 + Agente AI, a intenção de execução do Agente é capturada pela cadeia de chamadas, e não pela UI que captura a atenção do usuário.