AI-управлявана нова екосистема браузера: революція від відображення інформації до виклику розумних завдань

2025-08-03 05:40:40

Революція браузерів в еру штучного інтелекту: від демонстрації інформації до виклику завдань

Третя війна браузерів тихо розгортається. Від Netscape та Microsoft IE 90-х років до відкритого Firefox і Google Chrome, боротьба браузерів завжди була зосередженою на контролі над платформою та змінах технологічних парадигм. Chrome здобув панівну позицію завдяки швидкості оновлень та екосистемним зв'язкам, Google створив закритий цикл інформаційного входу через структуру "двох олігархів" в пошуку та браузері.

Однак ця структура починає хитатися. Поява великих мовних моделей (LLM) призводить до того, що дедалі більше користувачів виконують завдання на сторінках результатів пошуку без натискання на посилання, традиційна поведінка натискання на веб-сторінки зменшується. Тим часом чутки про те, що Apple може замінити пошукову систему за замовчуванням у Safari, ще більше загрожують прибуткам Alphabet, ринок починає виявляти неспокій щодо "традиційного пошуку".

Браузер сам по собі також стикається з перетворенням ролі. Він більше не є просто інструментом для відображення веб-сторінок, а стає контейнером для різних можливостей, таких як введення даних, поведінка користувачів, приватність ідентичності тощо. Хоча AI Agent потужний, для виконання складних взаємодій на сторінці, виклику локальних даних про особу, контролю елементів веб-сторінки, все ще потрібна довіра браузера та функціональний пісочниця. Браузер перетворюється з людського інтерфейсу в платформу системних викликів для агентів.

Справжнім проривом у поточному ринку браузерів може стати не ще один "кращий Chrome", а нова структура взаємодії: не просто відображення інформації, а виклик завдань. Майбутні браузери повинні бути спроектовані для AI Agent - не лише для читання, а й для написання та виконання. Проекти, такі як Browser Use, намагаються семантизувати структуру сторінок, перетворюючи візуальний інтерфейс на структуру, яку можна викликати з LLM, що дозволяє зменшити витрати на взаємодію.

На ринку основні проекти вже почали експериментувати: Perplexity створює рідний браузер Comet, використовуючи ШІ замість традиційних результатів пошуку; Brave поєднує захист конфіденційності з локальним висновком, покращуючи пошук і функції блокування за допомогою LLM; а такі проекти, як Donut, намагаються знайти нові точки входу для взаємодії між ШІ та активами на блокчейні. Спільною рисою цих проектів є те, що вони намагаються реконструювати вхідну частину браузера, а не покращувати його вихідний рівень.

Для підприємців можливості приховані в трикутних відносинах між введенням, структурою та агентом. Браузер як інтерфейс для виклику світу в майбутньому означає, що той, хто може надати структуровані, викликаємо, надійні "блоки можливостей", той стане частиною нової генерації платформ. Від SEO до AEO (оптимізація двигуна агентів), від трафіку сторінок до викликів завдань, форми продуктів і дизайнерське мислення зазнають реконструкції. Третя війна браузерів відбувається в "введенні", а не в "відображенні"; вирішальними стають не ті, хто привертає увагу користувачів, а ті, хто здобуває довіру агентів і отримує доступ до виклику.

Історія розвитку браузерів

На початку 90-х років минулого століття, коли Інтернет ще не став частиною повсякденного життя, з'явився Netscape Navigator, який відкрив мільйонам користувачів двері до цифрового світу. Цей браузер не був першим, але став першим продуктом, який насправді вийшов на широкий загал і визначив досвід використання Інтернету.

Однак, блиск був недовгим. Microsoft незабаром почала примусово зв'язувати Internet Explorer з операційною системою Windows, зробивши його браузером за замовчуванням. Ця стратегія стала "вбивцею платформ", безпосередньо знищивши домінуюче становище Netscape на ринку. IE, завдяки можливостям розповсюдження Windows, швидко став лідером галузі, тоді як Netscape потрапила на шлях занепаду.

У складних обставинах інженери Netscape обрали радикальний і ідеалістичний шлях - вони відкрили вихідний код браузера, закликаючи до спільноти з відкритим кодом. Цей код пізніше став основою проекту браузера Mozilla, спочатку названого Phoenix (в перекладі - Фенікс), після кількох змін назв він зрештою отримав назву Firefox.

Firefox не є простою копією Netscape, він досяг багатьох проривів у таких аспектах, як користувацький досвід, екосистема плагінів та безпека. Його народження знаменує перемогу духу з відкритим кодом і надає нову енергію всій індустрії.

1994 року з'явився браузер Opera, який походить з Норвегії і спочатку був експериментальним проектом. Але з версії 7.0 у 2003 році він впровадив власний рушій Presto, ставши першим, хто підтримав CSS, адаптивну верстку, голосове управління та кодування Unicode тощо. Хоча кількість користувачів була обмеженою, технологічно він завжди залишався попереду галузі, ставши "улюбленцем ґіків".

Того ж року Apple випустила веб-браузер Safari. Хоча за замовчуванням пошуковою системою Safari з моменту його створення є Google, ця історія з Microsoft символізує складні та тонкі відносини між інтернет-гігантами: співпраця та конкуренція завжди йдуть рука об руку.

У 2007 році IE7 був запущений разом із Windows Vista, але ринкова реакція була посередньою. Натомість, Firefox завдяки більш швидкому темпу оновлень, більш дружній механіці розширень та природній привабливості для розробників, поступово збільшив свою частку на ринку до приблизно 20%. Панування IE поступово послаблюється, вітри змінюються.

Chrome був випущений у 2008 році, створений на основі відкритого проекту Chromium і движка WebKit, який використовується в Safari. Його жартома називають "об'ємним" браузером, але завдяки глибокій майстерності Google в рекламі та формуванні бренду, він швидко здобув популярність.

Ключовою зброєю Chrome є не функціональність, а частота оновлень версій (раз на шість тижнів) та єдиний досвід на всіх платформах. У листопаді 2011 року Chrome вперше перевершив Firefox, ринкова частка досягла 27%; через шість місяців він знову обійшов IE, завершивши перехід від викликувача до домінуючого.

Водночас, мобільний інтернет Китаю також формує власну екосистему. Браузер UC, який належить Alibaba, швидко здобув популярність на початку 2010-х років, особливо на нових ринках, таких як Індія, Індонезія та Китай, завдяки легкому дизайну, стисненню даних для економії трафіку та іншим характеристикам, що сподобалися користувачам на бюджетних пристроях. У 2015 році його частка на глобальному ринку мобільних браузерів перевищила 17%, в Індії вона досягала 46%. Але ця перемога не була тривалою. З посиленням урядом Індії безпекового контролю китайських додатків, UC браузер був змушений вийти з ключового ринку і поступово втратив колишню славу.

Входячи в 2020-ті роки, домінування Chrome вже встановлено, а частка на світовому ринку стабільно складає близько 65%. Варто зазначити, що, хоча пошукова система Google та браузер Chrome належать до Alphabet, з ринкової точки зору це дві незалежні гегемонії - перша контролює близько дев'яти відсотків всіх пошукових входів у світі, а друга володіє більшістю "першого вікна" для користувачів в Інтернет.

Щоб утримати цю подвійну монопольну структуру, Google не шкодує витрат. У 2022 році Alphabet заплатила Apple близько 20 мільярдів доларів, лише для того, щоб Google залишався за замовчуванням пошуковою системою в Safari. Деякі аналітики стверджують, що ця витрата становить 36% від доходів від пошукової реклами, які Google отримує від трафіку Safari. Іншими словами, Google платить "захисний внесок" за свій захисний вал.

Але напрямок вітру знову змінився. З появою великих мовних моделей (LLM) традиційний пошук почав зазнавати ударів. У 2024 році частка ринку пошуку Google впала з 93% до 89%, хоча компанія все ще домінує, але тріщини вже з'явилися. Ще більш руйнівними є чутки про те, що Apple може запустити власну AI пошукову систему – якщо за замовчуванням пошук Safari перейде до власного табору, це не лише змінить екосистему, а й може похитнути прибуткову опору Alphabet. Ринок швидко відреагував, акції Alphabet впали з 170 доларів до 140 доларів, що відображає не лише паніку інвесторів, а й глибокий неспокій щодо майбутнього ери пошуку.

Від Navigator до Chrome, від відкритих ідей до реклами, від легких браузерів до AI-помічників пошуку, боротьба браузерів завжди була війною про технології, платформи, контент і контроль. Поле бою постійно змінюється, але суть ніколи не змінюється: хто контролює вхід, той визначає майбутнє.

В очах VC поступово розгортається третя війна браузерів, спираючись на нові потреби людей до пошукових систем в епоху LLM та ШІ.

Застаріла архітектура сучасних браузерів

Говорячи про архітектуру браузера, класична традиційна архітектура така:

Клієнт - фронтальний вхід

Запит через HTTPS до найближчого Google Front End, завершити TLS-розшифрування, QoS-інSampling та географічний маршрут. Якщо виявлено аномальний трафік (DDoS, автоматичне збирання), можна обмежити пропускну здатність або викликати складнощі на цьому рівні.

Розуміння запиту

Передня частина повинна зрозуміти значення слів, введених користувачем, і є три етапи: нейронна перевірка правопису, виправлення "recpie" на "recipe"; розширення синонімів, розширення "how to fix bike" до "repair bicycle". Аналіз намірів, визначення запиту як інформаційного, навігаційного чи торгового наміру та призначення запиту Vertical.

Кандидат на повернення

Запитувальна технологія, яку використовує Google, називається: обернений індекс. У прямому індексі ми можемо просто вказати ID, щоб знайти файл. Але користувач не може знати номер потрібного вмісту серед сотень мільярдів файлів, тому використовується дуже традиційний обернений індекс, щоб здійснити пошук за вмістом, щоб з'ясувати, які файли мають відповідні ключові слова. Далі Google використовує векторні індекси для обробки семантичного пошуку, тобто для пошуку вмісту, який є схожим за значенням на запит. Він перетворює текст, зображення та інший вміст у високорозмірні вектори (embedding) і здійснює пошук на основі схожості між цими векторами. Наприклад, навіть якщо користувач шукає "як приготувати тісто для піци", пошукова система може повернути результати, пов'язані з "посібником по приготуванню тіста для піци", оскільки вони семантично схожі. Після проходження через обернений індекс та векторні індекси близько ста тисяч веб-сторінок буде попередньо відсортовано.

Багаторівневе сортування

Системи зазвичай відфільтровують десятки тисяч кандидатних сторінок до приблизно 1000 статей за допомогою тисяч легких ознак, таких як BM25, TF-IDF, оцінка якості сторінки тощо, формуючи попередній кандидатний набір. Ці системи загалом називаються рекомендованими системами. Вони покладаються на масу ознак, що генеруються різними сутностями, включаючи поведінку користувачів, атрибути сторінки, наміри запиту та контекстуальні сигнали. Наприклад, Google комбінує історію користувача, відгуки інших користувачів, семантику сторінки, значення запиту та іншу інформацію, а також враховує контекстуальні елементи, такі як час (період дня, конкретні дні тижня) та зовнішні події, такі як новини в реальному часі.

Глибоке навчання для основного ранжування

На етапі попереднього пошуку Google використовує такі технології, як RankBrain і Neural Matching, щоб зрозуміти семантику запиту та відібрати попередньо релевантні результати з величезної кількості документів. RankBrain — це система машинного навчання, яку Google впровадив у 2015 році, щоб краще зрозуміти значення запитів користувачів, особливо нових запитів. Вона перетворює запити та документи в векторні представлення, обчислює їхню подібність, щоб знайти найбільш релевантні результати. Наприклад, для запиту "як приготувати тісто для піци" навіть якщо в документі немає повного збігу ключових слів, RankBrain може виявити вміст, пов'язаний із "основою для піци" або "приготуванням тіста".

Neural Matching – це ще одна технологія, яку Google запустив у 2018 році, що має на меті глибше зрозуміти семантичні зв'язки між запитами та документами. Вона використовує моделі нейронних мереж для захоплення неясних зв'язків між словами, що допомагає Google краще поєднувати запити та вміст веб-сторінок. Наприклад, для запиту "чому мій ноутбук так голосно шумить вентилятор" Neural Matching може зрозуміти, що користувач, можливо, шукає інформацію про усунення неполадок, пов'язаних з перегрівом, накопиченням пилу або високим використанням ЦП, навіть якщо ці слова безпосередньо не з'являються в запиті.

Глибока переробка: застосування моделі BERT

Після попереднього відбору відповідних документів Google використовує модель BERT (Bidirectional Encoder Representations from Transformers) для більш тонкого ранжування цих документів, щоб забезпечити, що найрелевантніші результати розташовані на перших місцях. BERT - це попередньо навчена мовна модель на основі трансформерів, яка може зрозуміти контекстуальні зв'язки слів у реченні. У пошуку BERT використовується для повторного ранжування попередньо отриманих документів. Він обчислює оцінки релевантності між запитом і документами, спільно кодувавши їх, і таким чином повторно ранжує документи. Наприклад, для запиту "Паркування на схилі без бордюру" BERT може зрозуміти значення "без бордюру" і повернути рекомендацію водієві повернути колеса в бік узбіччя, а не неправильно зрозуміти це як наявність бордюру. А для SEO-інженерів це означає необхідність точно вивчати алгоритми ранжування Google та рекомендаційні алгоритми машинного навчання, щоб цілеспрямовано оптимізувати вміст веб-сторінок для досягнення вищих позицій у відображенні.

Це типовий робочий процес пошукової системи Google. Але в епоху вибуху штучного інтелекту та великих даних у користувачів з'явилися нові вимоги до взаємодії з браузерами.

Чому ШІ перетворює браузери

По-перше, нам потрібно зрозуміти, чому браузер у такій формі все ще існує? Чи існує третя форма?

AGENT1.3%

BERT7.52%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

4 лайків