HTTPSを介して最近のGoogle Front Endにリクエストを送り、TLSの復号化、QoSサンプリング、地理的ルーティングを完了します。異常なトラフィック(DDoS、自動クローリング)が検出された場合、このレイヤーで制限またはチャレンジを行うことができます。
クエリ理解
フロントエンドは、ユーザーが入力した単語の意味を理解する必要があります。これには3つのステップがあります:神経スペルチェックで「recpie」を「recipe」に修正します;同義語拡張で「how to fix bike」を「repair bicycle」に拡張します。意図解析では、クエリが情報、ナビゲーション、または取引の意図であるかを判断し、Verticalリクエストを割り当てます。
AIブラウザ革命:第3次ブラウザ戦争の幕がポンプされた
AIブラウザ: 第三次ブラウザ戦争の幕開け
第三回のブラウザ戦争が静かに展開しています。1990年代のNetscape、MicrosoftのIEから、オープンソースの精神を持つFirefoxとGoogleのChromeまで、ブラウザの争いは常にプラットフォームのコントロール権と技術的パラダイムの変遷を集中して示しています。Chromeは更新速度とエコシステムの連携により覇権を獲得し、Googleは検索とブラウザの「ダブルオリゴポリ」構造を通じて、情報の入口のクローズドループを形成しました。
しかし、今日、この構図は揺らいでいます。大型言語モデル(LLM)の台頭により、ますます多くのユーザーが検索結果ページで「ゼロクリック」でタスクを完了し、従来のウェブページクリック行動が減少しています。同時に、AppleがSafariでデフォルトの検索エンジンを置き換える可能性についての噂が、Alphabetの利益基盤にさらなる脅威を与え、市場は「検索の正統性」に対する不安を見せ始めています。
ブラウザ自体も役割の再構築に直面しています。それは単なるウェブページを表示するツールではなく、データ入力、ユーザー行動、プライバシーアイデンティティなど、さまざまな機能を持つ集合体です。AIエージェントは強力ですが、複雑なページインタラクションを実行したり、ローカルアイデンティティデータを呼び出したり、ウェブページの要素を制御したりするには、ブラウザの信頼の境界と機能サンドボックスの助けが必要です。ブラウザは人間のインターフェースから、エージェントのシステム呼び出しプラットフォームへと変わりつつあります。
現在のブラウザ市場の構造を本当に打破するのは、別の「より良いChrome」ではなく、新しいインタラクション構造である:情報の表示ではなく、タスクの呼び出しである。未来のブラウザはAIエージェントのために設計されるべきであり、読み取るだけでなく、書き込みや実行もできるようにするべきだ。Browser Useのようなプロジェクトは、ページ構造を意味的にし、視覚的インターフェースをLLMが呼び出せる構造化テキストに変換し、ページから命令へのマッピングを実現し、インタラクションコストを大幅に削減することを試みている。
市場における主流プロジェクトは試験的に動き出しています:あるAI検索エンジンはネイティブブラウザを構築し、AIが従来の検索結果を置き換えています;あるブラウザはプライバシー保護とローカル推論を組み合わせ、LLMを使用して検索とブロック機能を強化しています;そして一部のCryptoネイティブプロジェクトは、AIとチェーン上の資産とのインタラクションの新しい入り口を狙っています。これらのプロジェクトの共通の特徴は、出力層を美化するのではなく、ブラウザの入力端を再構築しようとしていることです。
起業家にとって、機会は入力、構造、代理の三角関係の中に隠れています。ブラウザは未来のエージェントが世界を呼び出すインターフェースとして、構造化され、呼び出し可能で、信頼できる「能力ブロック」を提供できる者が新しいプラットフォームの一部となることを意味します。SEOからAEO(エージェンジン最適化)へ、ページトラフィックからタスクチェーンの呼び出しへ、製品の形態とデザイン思考は再構築されています。第三次ブラウザ戦争は「入力」において発生しており、「表示」ではありません。勝敗を決定するのは、もはや誰がユーザーの目を引くかではなく、誰がエージェントの信頼を得て、呼び出しの入り口を獲得するかです。
ブラウザの発展の簡単な歴史
1990年代初頭、インターネットが日常生活の一部ではなかった時代に、Netscape Navigatorが登場しました。それは新しい大陸を開く帆船のように、数百万のユーザーにデジタル世界への扉を開きました。このブラウザは最初のものではありませんでしたが、真に一般向けに普及し、インターネット体験を形作る製品としての最初のものでした。当時、人々は初めてグラフィカルインターフェースを介してウェブページをこんなに簡単に閲覧できるようになり、まるで世界全体が突然手の届くところにあるかのように感じました。
しかし、栄光はしばしば短命です。マイクロソフトはすぐにブラウザの重要性に気付き、Internet ExplorerをWindowsオペレーティングシステムに強制的にバンドルし、デフォルトのブラウザにすることを決定しました。この戦略は「プラットフォームの必殺技」と呼ばれ、Netscapeの市場支配地位を直接崩壊させました。多くのユーザーは自発的にIEを選択したわけではなく、システムのデフォルトで受け入れたからです。IEはWindowsの配布能力を利用して急速に業界の覇者となり、Netscapeは衰退の軌道に陥りました。
困難の中で、Netscape のエンジニアたちは過激で理想主義的な道を選びました - 彼らはブラウザのソースコードを公開し、オープンソースコミュニティに呼びかけました。この決定は、技術界の「マケドニア式譲歩」のようで、旧時代の終焉と新たな力の台頭を予示していました。このコードは後に Mozilla ブラウザプロジェクトの基礎となり、最初は Phoenix(意訳:不死鳥)と名付けられましたが、商標問題のために何度も改名され、最終的には Firefox と名付けられました。
Firefoxは単なるNetscapeのコピーではなく、ユーザー体験、プラグインエコシステム、安全性などの面で多くの突破を実現しました。その誕生はオープンソース精神の勝利を象徴し、業界全体に新たな活力を注入しました。誰かがFirefoxをNetscapeの「精神的継承者」と形容し、オスマン帝国がビザンティウムの余韻を引き継いだようだと述べました。この比喩は誇張されていますが、非常に意味深いものです。
しかし、Firefoxが正式にリリースされる数年前に、マイクロソフトはすでに6つのバージョンのIEをリリースしており、時間の利点とシステムバンドル戦略により、Firefoxは最初から追いかける立場に置かれ、この競争は平等なスタートラインの公平な競争ではないことが運命づけられていました。
その一方で、もう一人の初期プレーヤーが静かに登場しました。1994年、オペラブラウザが登場し、ノルウェーから来たもので、最初は実験的なプロジェクトに過ぎませんでした。しかし、2003年の7.0バージョンから、自社開発のPrestoエンジンを導入し、CSS、レスポンシブデザイン、音声制御、Unicodeコーディングなどの最先端技術をいち早くサポートしました。ユーザー数は限られていましたが、技術的には常に業界の先端を行き、「ギークの愛好者」となりました。
同年、アップルはSafariブラウザを発売しました。これは意味深い転換点でした。当時、マイクロソフトは破産寸前のアップルに1.5億ドルを投資し、競争の表面を維持し、独占禁止法の審査を避けようとしていました。Safariが誕生して以来のデフォルト検索エンジンはGoogleですが、このマイクロソフトとの歴史的な関係は、インターネットの巨人たちの間の複雑で微妙な関係を象徴しています:協力と競争は常に影を落としているのです。
2007年、IE7はWindows Vistaと共にリリースされましたが、市場の反響は平凡でした。一方で、Firefoxはより早い更新ペース、より友好的な拡張機構、そして開発者に対する天然の魅力を武器に、市場シェアを約20%まで着実に引き上げました。IEの支配は徐々に緩み、風向きが変わりつつあります。
あるテクノロジー大手は別のアプローチをしています。2001年から自社のブラウザを開発する構想を練り始めましたが、CEOにこのプロジェクトを承認させるのに6年かかりました。Chromeは2008年に登場し、ChromiumオープンソースプロジェクトとSafariで使用されているWebKitエンジンを基にしています。「肥大化した」ブラウザと揶揄されていますが、その企業の広告運用とブランド構築の深いノウハウにより、急速に台頭しました。
Chromeの鍵となる武器は機能ではなく、頻繁なバージョン更新のリズム(6週間ごと)と全プラットフォームでの統一された体験です。2011年11月、Chromeは初めてFirefoxを超え、市場シェア27%に達しました;6ヶ月後、再びIEを超え、挑戦者から支配者への転換を完了しました。
一方で、中国のモバイルインターネットも独自のエコシステムを形成しつつある。ある国内のテクノロジー企業が運営するブラウザーは、2010年代初頭に急速に人気を博し、特にインド、インドネシア、中国などの新興市場において、軽量なデザイン、データを圧縮してデータ使用量を節約する機能を活かし、低価格帯のデバイスユーザーに支持された。2015年には、そのグローバルなモバイルブラウザー市場シェアが17%を突破し、インドでは一時46%に達した。しかし、この勝利は長続きしなかった。インド政府が中国アプリの安全審査を強化するにつれ、そのブラウザーは重要な市場から撤退を余儀なくされ、次第にかつての栄光を失っていった。
2020年代に入ると、Chromeの支配的地位が確立され、世界市場シェアは約65%で安定しています。注目すべきは、Google検索エンジンとChromeブラウザは同じAlphabetに属しているものの、市場の観点から見ると2つの独立した覇権体系であるということです - 前者は世界の約90%の検索入口を制御し、後者は大多数のユーザーがネットにアクセスする"第一ウィンドウ"を掌握しています。
この二重独占構造を守るために、Googleは巨額の投資を惜しまなかった。2022年、AlphabetはAppleに約200億ドルを支払い、GoogleがSafariのデフォルト検索エンジンの地位を維持できるようにした。分析によると、この支出はGoogleがSafariのトラフィックから得る検索広告収入の36%に相当する。言い換えれば、Googleは自社の護城河のために「保護料」を支払っている。
しかし、風向きは再び変わった。大規模言語モデル(LLM)の台頭により、従来の検索が影響を受け始めている。2024年には、Googleの検索市場シェアが93%から89%に落ち込み、依然として支配的であるものの、亀裂が見え始めている。さらに破壊的なのは、Appleが独自のAI検索エンジンを発表する可能性についての噂だ。もしSafariのデフォルト検索が自社に切り替われば、これはエコシステムの構図を変えるだけでなく、Alphabetの利益の柱を揺るがす可能性もある。市場は迅速に反応し、Alphabetの株価は170ドルから140ドルに急落し、これは投資家の恐慌だけでなく、検索時代の未来に対する深い不安を反映している。
NavigatorからChromeへ、オープンソースの理想から広告の商業化へ、軽量ブラウザからAI検索アシスタントへ、ブラウザの争いは常に技術、プラットフォーム、コンテンツと制御権に関する戦争であった。戦場は絶えず移動するが、本質は決して変わらない:入口を握る者が未来を定義する。
VCの目には、LLMとAIに依存し、人々の検索エンジンに対する新たな需要が生まれ、第三次ブラウザ戦争が徐々に展開されている。
現代ブラウザの古いアーキテクチャ
ブラウザのアーキテクチャについて言及すると、従来のクラシックなアーキテクチャは以下の図のようになります:
クライアント - フロントエンド入口
HTTPSを介して最近のGoogle Front Endにリクエストを送り、TLSの復号化、QoSサンプリング、地理的ルーティングを完了します。異常なトラフィック(DDoS、自動クローリング)が検出された場合、このレイヤーで制限またはチャレンジを行うことができます。
クエリ理解
フロントエンドは、ユーザーが入力した単語の意味を理解する必要があります。これには3つのステップがあります:神経スペルチェックで「recpie」を「recipe」に修正します;同義語拡張で「how to fix bike」を「repair bicycle」に拡張します。意図解析では、クエリが情報、ナビゲーション、または取引の意図であるかを判断し、Verticalリクエストを割り当てます。
候補のリコール
あるテクノロジー大手が使用している検索技術は、逆インデックスと呼ばれています。順次インデックスでは、IDを指定することでファイルにアクセスできます。しかし、ユーザーは何千億ものファイルの中から目的の内容がどの番号であるかを知ることができないため、非常に伝統的な逆インデックスを採用し、コンテンツを基にしてどのファイルに対応するキーワードがあるかを検索します。次に、その会社はベクトルインデックスを採用して意味検索を処理します。つまり、クエリの意味に類似したコンテンツを探すことです。テキストや画像などのコンテンツを高次元ベクトル(埋め込み)に変換し、これらのベクトル間の類似性に基づいて検索を行います。たとえば、ユーザーが「ピザ生地の作り方」を検索した場合、検索エンジンは「ピザ生地作成ガイド」に関連する結果を返すことができます。なぜなら、それらは意味的に類似しているからです。逆インデックスとベクトルインデックスを経て、約十万件のウェブページが初期選別されます。
マルチレベルソート
システムは通常、BM25、TF-IDF、ページ品質スコアなどの数千次元の軽量特徴を通じて、十万規模の候補ページを約1000件に絞り込み、初期候補セットを構成します。このようなシステムは一般にレコメンデーションエンジンと呼ばれます。それは、ユーザーの行動、ページの属性、クエリの意図、コンテキスト信号など、さまざまなエンティティによって生成された膨大な特徴に依存しています。例えば、同社はユーザーの履歴、他のユーザーの行動フィードバック、ページの意味、クエリの意味などの情報を総合的に考慮し、さらに時間(1日の時間帯、1週間の特定の日)やリアルタイムのニュースなどの外部イベントといったコンテキスト要素も考慮します。
深層学習による主ソート
初期検索段階では、あるテクノロジー企業が RankBrain や Neural Matching などの技術を使用して、クエリの意味を理解し、膨大な文書から初歩的に関連する結果を絞り込んでいます。RankBrain は、この企業が 2015 年に導入した機械学習システムで、特に初めて現れるクエリの意味をよりよく理解することを目的としています。クエリと文書をベクトル表現に変換し、相互の類似性を計算することで、最も関連性の高い結果を見つけます。例えば、"どうやってピザを作るか"というクエリに対して。