Третя війна браузерів тихо розгортається. Від Netscape і Microsoft IE 90-х років до Firefox з відкритим кодом і Google Chrome, боротьба браузерів завжди була яскравим відображенням контролю платформ і зміни технологічних парадигм. Chrome завоював домінуючу позицію завдяки швидкості оновлень і екосистемній взаємодії, тоді як Google сформував замкнене коло інформаційного входу через "подвійну олігополію" пошуку та браузера.
Але сьогодні ця структура починає коливатися. Поява великих мовних моделей (LLM) призводить до того, що дедалі більше користувачів виконують завдання на сторінках результатів пошуку "нульовими кліками", традиційна поведінка кліків на веб-сторінках зменшується. Водночас, чутки про те, що Apple може замінити пошукову систему за замовчуванням у Safari, ще більше загрожують прибутковій базі Alphabet, ринок вже почав виявляти тривогу щодо "традиційного пошуку".
Браузер сам по собі також стикається з переосмисленням ролі. Він більше не просто інструмент для відображення веб-сторінок, а є контейнером, що об'єднує різноманітні можливості, такі як введення даних, поведінка користувачів, конфіденційність та ідентифікація. Хоча AI Agent і сильний, для виконання складних взаємодій на сторінці, виклику локальних даних про особу та контролю елементів веб-сторінки, все ще необхідно покладатися на довірчі межі та функціональні пісочниці браузера. Браузер перетворюється з людського інтерфейсу на платформу системних викликів для агентів.
Справжнім потенційним зламом сучасної структури ринку браузерів не стане ще один "кращий Chrome", а нова інтерактивна структура: не показ інформації, а виклик завдань. У майбутньому браузери потрібно проектувати для AI Agent - вони повинні не лише читати, а й писати та виконувати. Проекти, як-от Browser Use, намагаються семантизувати структуру сторінки, перетворюючи візуальний інтерфейс на структуру, яку можна викликати за допомогою LLM, реалізуючи відображення сторінки на команди, значно знижуючи витрати на взаємодію.
Головні проекти на ринку вже почали експериментувати: один AI пошуковий двигун створює рідний браузер, використовуючи AI замість традиційних результатів пошуку; один браузер об'єднує захист приватності з локальним висновком, посилюючи функції пошуку та блокування за допомогою LLM; а деякі крипто рідні проекти намагаються знайти нові входи для взаємодії AI з активами на ланцюгу. Спільною рисою цих проектів є спроба реконструювати вхідний бік браузера, а не прикрашати його вихідний шар.
Для підприємців можливості приховані у трикутних відносинах між введенням, структурою та агентами. Браузер як інтерфейс для виклику світу майбутніми агентами означає, що хто може надати структуровані, викликаються та надійні "блоки можливостей", той зможе стати частиною нового покоління платформ. Від SEO до AEO (оптимізація агентських двигунів), від трафіку сторінок до викликів ланцюга завдань, форма продукту та дизайн мислення зазнають реконструкції. Третя браузерна війна відбувається у "введенні", а не у "відображенні"; вирішальним фактором у перемозі більше не є те, хто привертає увагу користувачів, а хто завоює довіру агентів і отримає доступ до викликів.
Історія розвитку браузерів
На початку 90-х років минулого століття, коли Інтернет ще не став частиною повсякденного життя, з'явився Netscape Navigator, немов вітрильник, який відкриває новий континент, відкривши мільйонам користувачів двері до цифрового світу. Цей браузер не був першим, але став першим продуктом, який справді вийшов на широку аудиторію і сформував досвід використання Інтернету. Тоді люди вперше змогли настільки легко переглядати веб-сторінки через графічний інтерфейс, ніби весь світ раптом став доступним.
Проте, слава часто є короткочасною. Microsoft швидко усвідомила важливість браузерів і вирішила примусово інтегрувати Internet Explorer у операційну систему Windows, зробивши його браузером за замовчуванням. Ця стратегія стала "вбивцею платформ", яка безпосередньо зруйнувала домінуючу позицію Netscape на ринку. Багато користувачів не обирали IE свідомо, а приймали його через те, що він був за замовчуванням у системі. IE завдяки можливостям розповсюдження Windows швидко став лідером галузі, в той час як Netscape потрапила в траєкторію занепаду.
У кризі інженери Netscape обрали радикальний ідеалістичний шлях - вони відкрили вихідний код браузера, закликавши відкриту спільноту. Це рішення, здавалося, стало технічним «македонським відступом», що передбачає кінець старої ери та підйом нових сил. Цей код згодом став основою для проекту браузера Mozilla, спочатку названого Phoenix (означає «фенікс, що відроджується»), але через проблеми з товарними знаками кілька разів змінював назву, поки нарешті не отримав ім'я Firefox.
Firefox не є простим копіюванням Netscape, він досяг багатьох проривів у користувацькому досвіді, екосистемі плагінів, безпеці тощо. Його народження стало символом перемоги відкритого програмного забезпечення та внесло нову енергію в цілу індустрію. Дехто описує Firefox як "духовного спадкоємця" Netscape, подібно до того, як Османська імперія успадкувала відгомін Візантії. Це порівняння хоча й перебільшене, але має глибокий зміст.
Але за кілька років до офіційного випуску Firefox Microsoft вже випустила шість версій IE, завдяки перевазі в часі та стратегії пакетної поставки системи, що змусило Firefox з самого початку опинитися в позиції наздоганяючого, що призвело до того, що ця гонка не була рівноправною.
В той же час, ще один ранній гравець тихо з'явився на сцені. У 1994 році з'явився браузер Opera, який походить з Норвегії і спочатку був лише експериментальним проектом. Але з 7.0 версії 2003 року він впровадив власний двигун Presto, першими підтримавши CSS, адаптивну верстку, голосове управління та кодування Unicode. Хоча кількість користувачів була обмеженою, технології завжди залишалися на передовій галузі, ставши "улюбленцем гіків".
Того ж року Apple випустила браузер Safari. Це стало знаковим поворотом. Тоді Microsoft інвестувала в Apple 150 мільйонів доларів, щоб підтримати видимість конкуренції та уникнути антимонопольного розслідування. Хоча за замовчуванням пошуковою системою Safari був Google, ця історія з Microsoft символізує складні та делікатні стосунки між інтернет-гігантами: співпраця та конкуренція завжди йдуть рука об руку.
У 2007 році IE7 вийшов разом з Windows Vista, але ринковий відгук був посереднім. Натомість Firefox, завдяки швидшому темпу оновлень, більш дружній механіці розширень та природній привабливості для розробників, поступово збільшив свою частку на ринку до приблизно 20%. Панування IE поступово ослаблюється, напрямок змінюється.
Одна технологічна гігантка обрала інший підхід. Хоча з 2001 року вона почала розробляти власний браузер, лише через шість років змогла переконати генерального директора затвердити цей проект. Chrome з'явився у 2008 році, створений на основі відкритого проекту Chromium та движка WebKit, який використовується Safari. Його жартома називають "об'ємним" браузером, але завдяки глибоким навичкам цієї компанії в рекламі та формуванні бренду, він швидко став популярним.
Ключовою перевагою Chrome є не функції, а частота оновлень версій (раз на шість тижнів) та єдиний досвід на всіх платформах. У листопаді 2011 року Chrome вперше перевищив Firefox, досягнувши 27% ринкової частки; через шість місяців він знову перевершив IE, завершивши перехід від виклику до домінування.
Водночас мобільний інтернет у Китаї також формує власну екосистему. Браузер, що належить одній з вітчизняних технологічних компаній, швидко став популярним на початку 2010-х років, особливо на нових ринках, таких як Індія, Індонезія та Китай, завдяки легкому дизайну, стисненню даних для заощадження трафіку та іншим характеристикам, які сподобалися користувачам недорогих пристроїв. У 2015 році його частка на світовому ринку мобільних браузерів перевищила 17%, у той час як в Індії вона досягала 46%. Але ця перемога не була тривалою. З посиленням урядом Індії перевірок безпеки китайських додатків, браузер був змушений вийти з ключового ринку та поступово втратив колишню славу.
У 2020-х роках домінування Chrome вже встановлено, глобальна частка ринку стабільно тримається на рівні приблизно 65%. Варто зазначити, що хоча пошукова система Google та браузер Chrome належать до Alphabet, з точки зору ринку це дві незалежні гегемонії - перша контролює близько 90% глобальних пошукових вхідних точок, тоді як друга володіє більшістю "першого вікна" для користувачів, що виходять в Інтернет.
Щоб зберегти цю двоїсту монопольну структуру, Google не шкодує коштів. У 2022 році Alphabet заплатила Apple близько 20 мільярдів доларів лише для того, щоб Google залишався за замовчуванням пошуковою системою у Safari. Деякі аналітики вказують на те, що ці витрати становлять 36% доходу від пошукової реклами, отриманого Google з трафіку Safari. Іншими словами, Google платить "плату за захист" для свого захисного бар'єра.
Але вітер знову змінив напрямок. З ростом великих мовних моделей (LLM) традиційний пошук починає зазнавати ударів. У 2024 році частка ринку пошуку Google впала з 93% до 89%, хоча компанія все ще домінує, тріщини вже з'явилися. Ще більш руйнівними є чутки про те, що Apple може запустити власну AI пошукову систему - якщо Safari переключить свій пошук на власні ресурси, це не лише перепише екосистему, але й може похитнути прибуткову основу Alphabet. Ринок швидко відреагував, акції Alphabet впали з 170 доларів до 140 доларів, що відображає не лише паніку інвесторів, але й глибоке занепокоєння щодо майбутнього ери пошуку.
Від Navigator до Chrome, від ідеалів з відкритим кодом до комерціалізації реклами, від легкого браузера до AI-пошукового помічника, боротьба між браузерами завжди була війною про технології, платформи, контент і контроль. Поле битви постійно змінюється, але суть ніколи не змінюється: хто контролює вхід, той визначає майбутнє.
В очах венчурних капіталістів, спираючись на нові потреби людей у пошукових системах в епоху LLM та ШІ, третя війна браузерів поступово розгортається.
Застаріла архітектура сучасних браузерів
Говорячи про архітектуру браузера, класична традиційна архітектура зображена на наступній схемі:
Клієнт - фронтальний вхід
Запит через HTTPS надсилається до найближчого Google Front End, завершує TLS-розшифрування, QoS-зразок та географічну маршрутизацію. Якщо виявлено аномальний трафік (DDoS, автоматичне сканування), можна обмежити швидкість або кинути виклик на цьому рівні.
Розуміння запиту
Передня частина повинна розуміти значення слів, які вводить користувач, є три етапи: нейронна перевірка правопису, виправлення "recpie" на "recipe"; розширення синонімів, розширення "how to fix bike" на "repair bicycle". Аналіз наміру, визначення, чи є запит інформаційним, навігаційним чи торговим наміром, і розподіл запиту Vertical.
Кандидат на повернення
Технологія запитів, яку використовує один з технологічних гігантів, називається: обернений індекс. У прямому індексі ми можемо просто вказати ID, щоб знайти файл. Але користувач не може знати номер вмісту серед тисяч мільярдів файлів, тому використовується дуже традиційний обернений індекс, щоб шукати файли, що містять відповідні ключові слова. Далі ця компанія використовує векторний індекс для обробки семантичного пошуку, тобто для знаходження вмісту, що має подібний зміст до запиту. Вона перетворює текст, зображення та інший вміст у високорозмірні вектори (embedding) і виконує пошук на основі подібності між цими векторами. Наприклад, навіть якщо користувач шукає "як зробити тісто для піци", пошукова система може повернути результати, пов'язані з "посібником по приготуванню тіста для піци", оскільки вони семантично подібні. Після проходження через обернений індекс і векторний індекс близько ста тисяч веб-сторінок будуть попередньо відсортовані.
Багаторівневе сортування
Системи зазвичай за допомогою BM25, TF-IDF, оцінки якості сторінок та інших тисяч легких характеристик відфільтровують десятки тисяч кандидатних сторінок до приблизно 1000, формуючи первинний набір кандидатів. Ці системи загалом називаються рекомендуючими системами. Вони залежать від безлічі характеристик, що генеруються різними сутностями, включаючи поведінку користувачів, атрибути сторінок, наміри запитів та сигнали контексту. Наприклад, компанія буде враховувати історію користувача, відгуки поведінки інших користувачів, семантику сторінок, значення запитів тощо, при цьому також беручи до уваги контекстуальні фактори, такі як час (періоди дня, конкретні дні тижня) та зовнішні події, такі як поточні новини.
Глибинне навчання для основного сортування
На початковому етапі пошуку один з технологічних гігантів використовує такі технології, як RankBrain і Neural Matching, щоб зрозуміти семантику запиту та відібрати попередньо релевантні результати з величезної кількості документів. RankBrain — це система машинного навчання, впроваджена компанією у 2015 році, яка має на меті краще зрозуміти значення запитів користувачів, особливо нових. Вона перетворює запити та документи на векторні представлення, обчислюючи їхню схожість, щоб знайти найрелевантніші результати. Наприклад, для запиту "як приготувати пі
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
10 лайків
Нагородити
10
3
Поділіться
Прокоментувати
0/400
DevChive
· 23год тому
Що це за дрібниці, щоб боротися?
Переглянути оригіналвідповісти на0
TokenStorm
· 23год тому
Подивившись на індикатори, увійти в позицію браузерної концепції
Революція AI-браузерів: третя війна браузерів вже розпочалася.
AI Браузер: початок третьої війни браузерів
Третя війна браузерів тихо розгортається. Від Netscape і Microsoft IE 90-х років до Firefox з відкритим кодом і Google Chrome, боротьба браузерів завжди була яскравим відображенням контролю платформ і зміни технологічних парадигм. Chrome завоював домінуючу позицію завдяки швидкості оновлень і екосистемній взаємодії, тоді як Google сформував замкнене коло інформаційного входу через "подвійну олігополію" пошуку та браузера.
Але сьогодні ця структура починає коливатися. Поява великих мовних моделей (LLM) призводить до того, що дедалі більше користувачів виконують завдання на сторінках результатів пошуку "нульовими кліками", традиційна поведінка кліків на веб-сторінках зменшується. Водночас, чутки про те, що Apple може замінити пошукову систему за замовчуванням у Safari, ще більше загрожують прибутковій базі Alphabet, ринок вже почав виявляти тривогу щодо "традиційного пошуку".
Браузер сам по собі також стикається з переосмисленням ролі. Він більше не просто інструмент для відображення веб-сторінок, а є контейнером, що об'єднує різноманітні можливості, такі як введення даних, поведінка користувачів, конфіденційність та ідентифікація. Хоча AI Agent і сильний, для виконання складних взаємодій на сторінці, виклику локальних даних про особу та контролю елементів веб-сторінки, все ще необхідно покладатися на довірчі межі та функціональні пісочниці браузера. Браузер перетворюється з людського інтерфейсу на платформу системних викликів для агентів.
Справжнім потенційним зламом сучасної структури ринку браузерів не стане ще один "кращий Chrome", а нова інтерактивна структура: не показ інформації, а виклик завдань. У майбутньому браузери потрібно проектувати для AI Agent - вони повинні не лише читати, а й писати та виконувати. Проекти, як-от Browser Use, намагаються семантизувати структуру сторінки, перетворюючи візуальний інтерфейс на структуру, яку можна викликати за допомогою LLM, реалізуючи відображення сторінки на команди, значно знижуючи витрати на взаємодію.
Головні проекти на ринку вже почали експериментувати: один AI пошуковий двигун створює рідний браузер, використовуючи AI замість традиційних результатів пошуку; один браузер об'єднує захист приватності з локальним висновком, посилюючи функції пошуку та блокування за допомогою LLM; а деякі крипто рідні проекти намагаються знайти нові входи для взаємодії AI з активами на ланцюгу. Спільною рисою цих проектів є спроба реконструювати вхідний бік браузера, а не прикрашати його вихідний шар.
Для підприємців можливості приховані у трикутних відносинах між введенням, структурою та агентами. Браузер як інтерфейс для виклику світу майбутніми агентами означає, що хто може надати структуровані, викликаються та надійні "блоки можливостей", той зможе стати частиною нового покоління платформ. Від SEO до AEO (оптимізація агентських двигунів), від трафіку сторінок до викликів ланцюга завдань, форма продукту та дизайн мислення зазнають реконструкції. Третя браузерна війна відбувається у "введенні", а не у "відображенні"; вирішальним фактором у перемозі більше не є те, хто привертає увагу користувачів, а хто завоює довіру агентів і отримає доступ до викликів.
Історія розвитку браузерів
На початку 90-х років минулого століття, коли Інтернет ще не став частиною повсякденного життя, з'явився Netscape Navigator, немов вітрильник, який відкриває новий континент, відкривши мільйонам користувачів двері до цифрового світу. Цей браузер не був першим, але став першим продуктом, який справді вийшов на широку аудиторію і сформував досвід використання Інтернету. Тоді люди вперше змогли настільки легко переглядати веб-сторінки через графічний інтерфейс, ніби весь світ раптом став доступним.
Проте, слава часто є короткочасною. Microsoft швидко усвідомила важливість браузерів і вирішила примусово інтегрувати Internet Explorer у операційну систему Windows, зробивши його браузером за замовчуванням. Ця стратегія стала "вбивцею платформ", яка безпосередньо зруйнувала домінуючу позицію Netscape на ринку. Багато користувачів не обирали IE свідомо, а приймали його через те, що він був за замовчуванням у системі. IE завдяки можливостям розповсюдження Windows швидко став лідером галузі, в той час як Netscape потрапила в траєкторію занепаду.
У кризі інженери Netscape обрали радикальний ідеалістичний шлях - вони відкрили вихідний код браузера, закликавши відкриту спільноту. Це рішення, здавалося, стало технічним «македонським відступом», що передбачає кінець старої ери та підйом нових сил. Цей код згодом став основою для проекту браузера Mozilla, спочатку названого Phoenix (означає «фенікс, що відроджується»), але через проблеми з товарними знаками кілька разів змінював назву, поки нарешті не отримав ім'я Firefox.
Firefox не є простим копіюванням Netscape, він досяг багатьох проривів у користувацькому досвіді, екосистемі плагінів, безпеці тощо. Його народження стало символом перемоги відкритого програмного забезпечення та внесло нову енергію в цілу індустрію. Дехто описує Firefox як "духовного спадкоємця" Netscape, подібно до того, як Османська імперія успадкувала відгомін Візантії. Це порівняння хоча й перебільшене, але має глибокий зміст.
Але за кілька років до офіційного випуску Firefox Microsoft вже випустила шість версій IE, завдяки перевазі в часі та стратегії пакетної поставки системи, що змусило Firefox з самого початку опинитися в позиції наздоганяючого, що призвело до того, що ця гонка не була рівноправною.
В той же час, ще один ранній гравець тихо з'явився на сцені. У 1994 році з'явився браузер Opera, який походить з Норвегії і спочатку був лише експериментальним проектом. Але з 7.0 версії 2003 року він впровадив власний двигун Presto, першими підтримавши CSS, адаптивну верстку, голосове управління та кодування Unicode. Хоча кількість користувачів була обмеженою, технології завжди залишалися на передовій галузі, ставши "улюбленцем гіків".
Того ж року Apple випустила браузер Safari. Це стало знаковим поворотом. Тоді Microsoft інвестувала в Apple 150 мільйонів доларів, щоб підтримати видимість конкуренції та уникнути антимонопольного розслідування. Хоча за замовчуванням пошуковою системою Safari був Google, ця історія з Microsoft символізує складні та делікатні стосунки між інтернет-гігантами: співпраця та конкуренція завжди йдуть рука об руку.
У 2007 році IE7 вийшов разом з Windows Vista, але ринковий відгук був посереднім. Натомість Firefox, завдяки швидшому темпу оновлень, більш дружній механіці розширень та природній привабливості для розробників, поступово збільшив свою частку на ринку до приблизно 20%. Панування IE поступово ослаблюється, напрямок змінюється.
Одна технологічна гігантка обрала інший підхід. Хоча з 2001 року вона почала розробляти власний браузер, лише через шість років змогла переконати генерального директора затвердити цей проект. Chrome з'явився у 2008 році, створений на основі відкритого проекту Chromium та движка WebKit, який використовується Safari. Його жартома називають "об'ємним" браузером, але завдяки глибоким навичкам цієї компанії в рекламі та формуванні бренду, він швидко став популярним.
Ключовою перевагою Chrome є не функції, а частота оновлень версій (раз на шість тижнів) та єдиний досвід на всіх платформах. У листопаді 2011 року Chrome вперше перевищив Firefox, досягнувши 27% ринкової частки; через шість місяців він знову перевершив IE, завершивши перехід від виклику до домінування.
Водночас мобільний інтернет у Китаї також формує власну екосистему. Браузер, що належить одній з вітчизняних технологічних компаній, швидко став популярним на початку 2010-х років, особливо на нових ринках, таких як Індія, Індонезія та Китай, завдяки легкому дизайну, стисненню даних для заощадження трафіку та іншим характеристикам, які сподобалися користувачам недорогих пристроїв. У 2015 році його частка на світовому ринку мобільних браузерів перевищила 17%, у той час як в Індії вона досягала 46%. Але ця перемога не була тривалою. З посиленням урядом Індії перевірок безпеки китайських додатків, браузер був змушений вийти з ключового ринку та поступово втратив колишню славу.
У 2020-х роках домінування Chrome вже встановлено, глобальна частка ринку стабільно тримається на рівні приблизно 65%. Варто зазначити, що хоча пошукова система Google та браузер Chrome належать до Alphabet, з точки зору ринку це дві незалежні гегемонії - перша контролює близько 90% глобальних пошукових вхідних точок, тоді як друга володіє більшістю "першого вікна" для користувачів, що виходять в Інтернет.
Щоб зберегти цю двоїсту монопольну структуру, Google не шкодує коштів. У 2022 році Alphabet заплатила Apple близько 20 мільярдів доларів лише для того, щоб Google залишався за замовчуванням пошуковою системою у Safari. Деякі аналітики вказують на те, що ці витрати становлять 36% доходу від пошукової реклами, отриманого Google з трафіку Safari. Іншими словами, Google платить "плату за захист" для свого захисного бар'єра.
Але вітер знову змінив напрямок. З ростом великих мовних моделей (LLM) традиційний пошук починає зазнавати ударів. У 2024 році частка ринку пошуку Google впала з 93% до 89%, хоча компанія все ще домінує, тріщини вже з'явилися. Ще більш руйнівними є чутки про те, що Apple може запустити власну AI пошукову систему - якщо Safari переключить свій пошук на власні ресурси, це не лише перепише екосистему, але й може похитнути прибуткову основу Alphabet. Ринок швидко відреагував, акції Alphabet впали з 170 доларів до 140 доларів, що відображає не лише паніку інвесторів, але й глибоке занепокоєння щодо майбутнього ери пошуку.
Від Navigator до Chrome, від ідеалів з відкритим кодом до комерціалізації реклами, від легкого браузера до AI-пошукового помічника, боротьба між браузерами завжди була війною про технології, платформи, контент і контроль. Поле битви постійно змінюється, але суть ніколи не змінюється: хто контролює вхід, той визначає майбутнє.
В очах венчурних капіталістів, спираючись на нові потреби людей у пошукових системах в епоху LLM та ШІ, третя війна браузерів поступово розгортається.
Застаріла архітектура сучасних браузерів
Говорячи про архітектуру браузера, класична традиційна архітектура зображена на наступній схемі:
Клієнт - фронтальний вхід
Запит через HTTPS надсилається до найближчого Google Front End, завершує TLS-розшифрування, QoS-зразок та географічну маршрутизацію. Якщо виявлено аномальний трафік (DDoS, автоматичне сканування), можна обмежити швидкість або кинути виклик на цьому рівні.
Розуміння запиту
Передня частина повинна розуміти значення слів, які вводить користувач, є три етапи: нейронна перевірка правопису, виправлення "recpie" на "recipe"; розширення синонімів, розширення "how to fix bike" на "repair bicycle". Аналіз наміру, визначення, чи є запит інформаційним, навігаційним чи торговим наміром, і розподіл запиту Vertical.
Кандидат на повернення
Технологія запитів, яку використовує один з технологічних гігантів, називається: обернений індекс. У прямому індексі ми можемо просто вказати ID, щоб знайти файл. Але користувач не може знати номер вмісту серед тисяч мільярдів файлів, тому використовується дуже традиційний обернений індекс, щоб шукати файли, що містять відповідні ключові слова. Далі ця компанія використовує векторний індекс для обробки семантичного пошуку, тобто для знаходження вмісту, що має подібний зміст до запиту. Вона перетворює текст, зображення та інший вміст у високорозмірні вектори (embedding) і виконує пошук на основі подібності між цими векторами. Наприклад, навіть якщо користувач шукає "як зробити тісто для піци", пошукова система може повернути результати, пов'язані з "посібником по приготуванню тіста для піци", оскільки вони семантично подібні. Після проходження через обернений індекс і векторний індекс близько ста тисяч веб-сторінок будуть попередньо відсортовані.
Багаторівневе сортування
Системи зазвичай за допомогою BM25, TF-IDF, оцінки якості сторінок та інших тисяч легких характеристик відфільтровують десятки тисяч кандидатних сторінок до приблизно 1000, формуючи первинний набір кандидатів. Ці системи загалом називаються рекомендуючими системами. Вони залежать від безлічі характеристик, що генеруються різними сутностями, включаючи поведінку користувачів, атрибути сторінок, наміри запитів та сигнали контексту. Наприклад, компанія буде враховувати історію користувача, відгуки поведінки інших користувачів, семантику сторінок, значення запитів тощо, при цьому також беручи до уваги контекстуальні фактори, такі як час (періоди дня, конкретні дні тижня) та зовнішні події, такі як поточні новини.
Глибинне навчання для основного сортування
На початковому етапі пошуку один з технологічних гігантів використовує такі технології, як RankBrain і Neural Matching, щоб зрозуміти семантику запиту та відібрати попередньо релевантні результати з величезної кількості документів. RankBrain — це система машинного навчання, впроваджена компанією у 2015 році, яка має на меті краще зрозуміти значення запитів користувачів, особливо нових. Вона перетворює запити та документи на векторні представлення, обчислюючи їхню схожість, щоб знайти найрелевантніші результати. Наприклад, для запиту "як приготувати пі