AIによるブラウザの新しいエコシステム:情報表示からインテリジェントなタスク呼び出しへの革命

AI時代のブラウザ革命:情報表示からタスク呼び出しへ

第三回のブラウザ戦争が静かに展開しています。1990年代のNetscape、Microsoft IEから、オープンソースのFirefoxとGoogle Chromeまで、ブラウザの争いは常にプラットフォームのコントロールと技術的パラダイムの変遷を集中して反映しています。Chromeは更新のスピードとエコシステムの連携により、覇権の地位を獲得しました。Googleは検索とブラウザの「二つの寡頭」構造を通じて、情報の入り口のクローズドループを形成しています。

しかし、この構図は揺らいでいる。大型言語モデル(LLM)の台頭により、ますます多くのユーザーが検索結果ページで「ゼロクリック」でタスクを完了しており、従来のウェブクリック行動は減少している。同時に、AppleがSafariでデフォルトの検索エンジンを変更する可能性に関する噂は、Alphabetの利益基盤にさらなる脅威を与えており、「検索の正統性」についての市場の不安が兆しを見せている。

ブラウザ自体も役割を再構築しています。それは単にウェブページを表示するツールではなく、データ入力、ユーザーの行動、プライバシーのアイデンティティなど、さまざまな能力の集合容器です。AIエージェントは強力ですが、複雑なページのインタラクションを完了し、ローカルのアイデンティティデータを呼び出し、ウェブページの要素を制御するには、依然としてブラウザの信頼の境界と機能のサンドボックスを借りる必要があります。ブラウザは人間のインターフェースからエージェントのシステムコールプラットフォームへと進化しています。

現在のブラウザ市場の構図を本当に打破するのは、別の「より良いChrome」ではなく、新しいインタラクション構造です。それは情報の表示ではなく、タスクの呼び出しです。未来のブラウザはAIエージェントのために設計されるべきであり、ただ読むだけでなく、書き、実行することもできる必要があります。Browser Useのようなプロジェクトは、ページ構造を意味的にし、視覚的インターフェースをLLMに呼び出せる構造化テキストに変えることを試みており、ページから命令へのマッピングを実現し、インタラクションコストを大幅に削減します。

市場の主流プロジェクトが試水を始めています:PerplexityはネイティブブラウザCometを構築し、AIを用いて従来の検索結果を代替しています;Braveはプライバシー保護とローカル推論を結びつけ、LLMを使って検索とブロック機能を強化しています;そしてDonutなどのCryptoネイティブプロジェクトは、AIとオンチェーン資産の相互作用の新しい入り口を狙っています。これらのプロジェクトの共通点は、ブラウザの入力端を再構築しようとしていることであり、出力層を美化するのではありません。

起業家にとって、機会は入力、構造、およびエージェントの三角関係に隠れています。ブラウザは未来のエージェントが世界を呼び出すインターフェースとして機能し、構造化され、呼び出し可能で、信頼できる「能力ブロック」を提供できる者が新しい世代のプラットフォームの一部となることを意味します。SEOからAEO(エージェントエンジン最適化)へ、ページトラフィックからタスクチェーン呼び出しへ、製品の形態とデザイン思考は再構築されています。第三次ブラウザ戦争は「入力」で発生しており、「表示」ではありません。勝敗を決するのは誰がユーザーの目を引くかではなく、誰がエージェントの信頼を得て、呼び出しの入口を獲得するかです。

ブラウザの発展の簡単な歴史

1990年代初頭、インターネットが日常生活の一部ではなかった時代に、Netscape Navigatorが登場し、数百万のユーザーにデジタル世界への扉を開きました。このブラウザは最初のものではありませんが、真に大衆に向けてインターネット体験を形作る製品の最初のものでした。

しかし、栄光は短命だった。マイクロソフトはすぐにInternet ExplorerをWindowsオペレーティングシステムに強制的にバンドルし、デフォルトのブラウザとした。この戦略は「プラットフォームの切り札」とも言え、Netscapeの市場での支配的地位を直接崩壊させた。IEはWindowsの配布能力を利用して、急速に業界の覇者となり、Netscapeは衰退の軌道に陥った。

危機の中で、Netscapeのエンジニアたちは過激で理想主義的な道を選びました - 彼らはブラウザのソースコードを公開し、オープンソースコミュニティに呼びかけました。このコードは後にMozillaブラウザプロジェクトの基礎となり、最初はPhoenix(フェニックスの意)と名付けられ、何度か名前が変更された後、最終的にFirefoxと名付けられました。

Firefoxは単なるNetscapeのコピーではなく、ユーザーエクスペリエンス、プラグインエコシステム、安全性などの面で多くの突破口を実現しました。その誕生はオープンソース精神の勝利を示し、業界全体に新しい活力を注入しました。

1994年、Operaブラウザが登場しました。これはノルウェーからのもので、最初は実験的なプロジェクトに過ぎませんでした。しかし、2003年の7.0バージョンからは、自社開発のPrestoエンジンを導入し、CSS、レスポンシブデザイン、音声制御、Unicodeエンコーディングなどの最先端技術をいち早くサポートしました。ユーザー数は限られていましたが、技術的には常に業界の最前線に立ち、「ギークのお気に入り」となりました。

同年、AppleはSafariブラウザを発表しました。Safariの誕生以来のデフォルト検索エンジンはGoogleですが、このMicrosoftとの歴史的な関わりは、インターネットの巨人たちの間の複雑で微妙な関係を象徴しています:協力と競争は常に寄り添っています。

2007年、IE7はWindows Vistaと共に発売されましたが、市場の反応は平凡でした。一方、Firefoxはより速い更新ペース、より友好的な拡張機能、そして開発者への自然な魅力のおかげで、市場シェアを約20%まで着実に増加させました。IEの支配は徐々に緩み、風向きが変わり始めています。

Chromeは2008年に登場し、ChromiumオープンソースプロジェクトとSafariで使用されるWebKitエンジンを基に作られました。"肥大化した"ブラウザと揶揄されることもありますが、Googleの広告投資とブランド構築の深い力によって、急速に台頭しました。

Chromeの重要な武器は機能ではなく、頻繁なバージョン更新のリズム(6週間ごと)と全プラットフォームの統一された体験です。2011年11月、Chromeは初めてFirefoxを超え、市場シェアは27%に達しました;6ヶ月後、IEを再び超え、挑戦者から支配者への転換を達成しました。

その一方で、中国のモバイルインターネットも独自のエコシステムを形成しつつあります。アリババ傘下のUCブラウザは2010年代初頭に急速に人気を集め、特にインド、インドネシア、中国などの新興市場において、軽量設計やデータ圧縮による通信量の節約といった特性を活かし、低価格のデバイスユーザーから支持を得ました。2015年には、世界のモバイルブラウザ市場シェアが17%を突破し、インドでは一時46%に達しました。しかし、この勝利は長続きしませんでした。インド政府が中国製アプリの安全審査を強化するにつれ、UCブラウザは重要な市場から撤退を余儀なくされ、徐々にかつての栄光を失っていきました。

2020年代に入り、Chromeの主導的地位は確立され、世界市場シェアは約65%で安定しています。注目すべきは、Google検索エンジンとChromeブラウザは同じAlphabetに属しているものの、市場的には二つの独立した覇権体系であるということです - 前者は世界の約90%の検索入口を制御し、後者は大多数のユーザーがネットにアクセスする"第一ウィンドウ"を掌握しています。

この二重独占構造を守るために、Googleは巨額の投資を惜しまない。2022年、AlphabetはAppleに約200億ドルを支払い、GoogleがSafariのデフォルト検索エンジンとしての地位を維持できるようにした。分析によると、この支出はGoogleがSafariのトラフィックから得る検索広告収入の36%に相当する。言い換えれば、Googleは防御のために「保護費」を支払っている。

しかし、風向きが再び変わりました。大型言語モデル(LLM)の台頭に伴い、従来の検索が打撃を受け始めています。2024年、Googleの検索市場シェアは93%から89%に低下しましたが、依然として圧倒的な地位を保持していますが、亀裂が見え始めています。さらに破壊的なのは、Appleが独自のAI検索エンジンを発表するという噂です - もしSafariのデフォルト検索が自社に切り替われば、これは生態系の構造を変えるだけでなく、Alphabetの利益の柱を揺るがす可能性があります。市場は迅速に反応し、Alphabetの株価は170ドルから140ドルに急落しました。このことは投資家の恐慌を反映しているだけでなく、検索時代の未来の方向性に対する深い不安を示しています。

NavigatorからChromeへ、オープンソースの理想から広告の商業化へ、軽量ブラウザからAI検索アシスタントへ、ブラウザの争いは常に技術、プラットフォーム、コンテンツ、そしてコントロールの権利に関する戦争です。戦場は常に移り変わりますが、本質は決して変わりません:入口を握る者が未来を定義します。

VCの目には、LLMとAIの時代における人々の検索エンジンに対する新たなニーズに基づいて、第3次ブラウザ戦争が徐々に展開されている。

現代ブラウザの古いアーキテクチャ

ブラウザのアーキテクチャについて言及すると、古典的な従来のアーキテクチャは次の通りです:

クライアント - フロントエンド入口

HTTPSを通じて最近のGoogle Front Endにアクセスし、TLSの復号、QoSサンプリング、地理ルーティングを完了します。異常なトラフィック(DDoS、自動スクレイピング)が検出された場合、このレイヤーでレート制限またはチャレンジを行うことができます。

クエリ理解

フロントエンドは、ユーザーが入力した単語の意味を理解する必要があります。3つのステップがあります:神経的なスペルチェックで「recpie」を「recipe」に修正します;同義語の拡張では「how to fix bike」を「repair bicycle」に拡張します。意図の解析では、クエリが情報、ナビゲーション、または取引の意図であるかを判断し、Verticalリクエストを割り当てます。

候補の呼び戻し

Googleが使用する検索技術は、逆インデックスと呼ばれています。順序インデックスでは、IDが与えられるとファイルにインデックスを付けることができます。しかし、ユーザーは何千億ものファイルの中から目的の内容の番号を知ることはできません。そのため、非常に伝統的な逆インデックスを使用して、コンテンツを通じて対応するキーワードを持つファイルを検索します。次に、Googleはベクトルインデックスを採用して意味検索を処理します。つまり、クエリの意味に似た内容を探します。テキストや画像などのコンテンツを高次元ベクトル(埋め込み)に変換し、これらのベクトル間の類似性に基づいて検索を行います。たとえば、ユーザーが「ピザ生地の作り方」を検索しても、検索エンジンは「ピザ生地の作り方ガイド」に関連する結果を返すことができます。なぜなら、それらは意味的に類似しているからです。逆インデックスとベクトルインデックスを経て、約十万レベルのウェブページが初期スクリーニングされます。

マルチレベルソート

システムは通常、BM25、TF-IDF、ページ品質スコアなどの数千次元の軽量特徴を通じて、10万規模の候補ページを約1000件に絞り込み、初期候補セットを構成します。このようなシステムは一般にレコメンデーションエンジンと呼ばれます。それは、ユーザーの行動、ページの属性、クエリの意図や文脈信号など、さまざまなエンティティによって生成される膨大な特徴に依存しています。たとえば、Googleはユーザーの履歴、他のユーザーの行動フィードバック、ページの意味、クエリの意味などの情報を総合的に考慮し、さらに時間(1日の時間帯、週の特定の日)やリアルタイムニュースなどの外部イベントなどの文脈要素も考慮します。

ディープラーニングによるメインソート

初期検索段階では、GoogleはRankBrainやNeural Matchingなどの技術を使用して、クエリの意味を理解し、膨大な文書の中から初歩的に関連する結果を絞り込みます。RankBrainは2015年にGoogleが導入した機械学習システムで、特に初めてのクエリの意味をよりよく理解することを目的としています。これは、クエリと文書をベクトル表現に変換し、それらの間の類似性を計算することによって、最も関連性の高い結果を見つけることができます。例えば、「ピザ生地を作る方法」というクエリに対して、文書内に完全に一致するキーワードがなくても、RankBrainは「ピザの基礎」や「生地作り」に関連する内容を識別することができます。

Neural Matchingは、Googleが2018年に導入した別の技術で、クエリと文書間の意味関係をより深く理解することを目的としています。それは神経ネットワークモデルを使用して、単語間のあいまいな関係を捉え、Googleがクエリとウェブコンテンツをよりよく一致させるのを助けます。例えば、クエリ「なぜ私のノートパソコンのファンの音が大きいのか」に対して、Neural Matchingは、ユーザーが過熱、ほこりの蓄積、または高いCPU使用率に関するトラブルシューティング情報を探している可能性があることを理解でき、これらの単語がクエリに直接含まれていなくても対応します。

深度リランキング:BERTモデルの応用

関連する文書を初歩的に選別した後、GoogleはBERT(Bidirectional Encoder Representations from Transformers)モデルを使用してこれらの文書をより詳細にランク付けし、最も関連性の高い結果を前面に表示します。BERTはTransformerに基づいた事前訓練された言語モデルで、文中の語の文脈関係を理解することができます。検索において、BERTは初歩的に取得された文書の再ランク付けに使用されます。クエリと文書を共同エンコードすることで、両者の関連性スコアを計算し、文書を再ランク付けします。例えば、クエリ「路肩のない坂道に駐車する」に対して、BERTは「路肩がない」の意味を理解し、運転手に車輪を路端に向けるように提案するページを返します。これは路肩がある状況と誤解されることはありません。そして、SEOエンジニアにとっては、Googleのランク付けや機械学習の推薦アルゴリズムを正確に学び、特定のウェブコンテンツを最適化してより高いランクの表示を得る必要があります。

以上が典型的なGoogle検索エンジンの作業フローです。しかし、現在のAIとビッグデータの爆発の時代において、ユーザーはブラウザとのインタラクションに新たなニーズを持っています。

なぜAIがブラウザを再構築するのか

まず、ブラウザという形態がなぜ存在し続けるのかを明確にする必要があります。第三の形態は存在するのでしょうか?

AGENT2.3%
BERT8.55%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • 共有
コメント
0/400
TokenAlchemistvip
· 2時間前
ブラウザが変わる時が来た
原文表示返信0
AirdropHunterXMvip
· 16時間前
AIはそんなに不思議ではないでしょう
原文表示返信0
GetRichLeekvip
· 16時間前
覇者は最終的に覆される
原文表示返信0
LiquidityWitchvip
· 17時間前
新しい革命が到来しました
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)