La nueva ecología del navegador potenciada por IA: una revolución desde la exhibición de información hasta la invocación de tareas inteligentes.

La revolución del navegador en la era de la IA: de la presentación de información a la llamada de tareas

La tercera guerra de los navegadores está ocurriendo silenciosamente. Desde Netscape y Microsoft IE en los años 90, hasta el navegador de código abierto Firefox y Google Chrome, la lucha por los navegadores ha sido una representación concentrada del control de la plataforma y la evolución de los paradigmas tecnológicos. Chrome ha alcanzado una posición dominante gracias a su velocidad de actualización y la interconexión de su ecosistema; Google ha formado un ciclo cerrado de entrada de información a través de la estructura de "duopolio" entre la búsqueda y el navegador.

Sin embargo, este patrón está empezando a tambalearse. El auge de los modelos de lenguaje grandes (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de clics en páginas web. Al mismo tiempo, los rumores sobre que Apple podría reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el malestar del mercado por la "ortodoxia de la búsqueda" ya ha comenzado a asomar.

El navegador también enfrenta una reestructuración de su rol. No solo es una herramienta para mostrar páginas web, sino que también es un contenedor que reúne múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad privada. Aunque los Agentes AI son poderosos, para realizar interacciones complejas en las páginas, acceder a datos de identidad locales y controlar elementos de la página web, aún deben aprovechar los límites de confianza y el entorno seguro del navegador. El navegador está evolucionando de una interfaz humana a una plataforma de llamadas del sistema para Agentes.

Lo que realmente puede romper el actual mercado de navegadores no es otro "Chrome más bueno", sino una nueva estructura de interacción: no se trata de la exhibición de información, sino de la invocación de tareas. Los navegadores del futuro deben ser diseñados para Agentes de IA - no solo capaces de leer, sino también de escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser llamado por LLM, logrando una mapeo de página a instrucciones y reduciendo drásticamente el costo de interacción.

Los proyectos principales en el mercado han comenzado a experimentar: Perplexity construye un navegador nativo llamado Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando la búsqueda y las funciones de bloqueo con LLM; mientras que proyectos nativos de criptomonedas como Donut apuntan a nuevas entradas para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentan reestructurar la entrada del navegador, en lugar de embellecer su capa de salida.

Para los emprendedores, las oportunidades se encuentran en la relación triangular entre la entrada, la estructura y el agente. El navegador, como la interfaz del futuro para invocar el mundo a través de agentes, significa que quien pueda proporcionar "bloques de capacidad" que sean estructurables, invocables y de confianza, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma del producto y el pensamiento de diseño se están reestructurando. La tercera guerra de navegadores se libra en la "entrada" y no en la "exhibición"; lo que decide el ganador ya no es quién atrae la atención del usuario, sino quién gana la confianza del agente y obtiene el acceso a la invocación.

Breve historia del desarrollo de navegadores

A principios de la década de 1990, cuando Internet aún no formaba parte de la vida cotidiana, Netscape Navigator apareció y abrió las puertas al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí fue el primero en el verdadero sentido de acercarse al público y moldear la experiencia de Internet.

Sin embargo, el esplendor fue efímero. Microsoft pronto obligó a integrar Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia es conocida como "arma de plataforma", que desmanteló directamente la posición de liderazgo en el mercado de Netscape. IE, aprovechando la capacidad de distribución de Windows, rápidamente se convirtió en el líder de la industria, mientras que Netscape se sumió en una trayectoria de declive.

En medio de la adversidad, los ingenieros de Netscape optaron por un camino radical e idealista: hicieron público el código fuente de su navegador, lanzando un llamado a la comunidad de código abierto. Este código se convirtió posteriormente en la base del proyecto del navegador Mozilla, que inicialmente se llamó Phoenix (que significa renacimiento del fénix), y que, tras varios cambios de nombre, finalmente se denominó Firefox.

Firefox no es una simple copia de Netscape; ha logrado múltiples avances en experiencia de usuario, ecosistema de plugins y seguridad. Su creación marca la victoria del espíritu de código abierto y también inyecta nueva vitalidad a toda la industria.

En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías avanzadas como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque el número de usuarios es limitado, siempre ha estado a la vanguardia de la industria en términos de tecnología, convirtiéndose en "el favorito de los geeks".

Ese mismo año, Apple lanzó el navegador Safari. Aunque el motor de búsqueda predeterminado de Safari desde su creación es Google, esta historia de relaciones complicadas con Microsoft simboliza la compleja y sutil relación entre los gigantes de Internet: la cooperación y la competencia siempre van de la mano.

En 2007, IE7 se lanzó con Windows Vista, pero la respuesta del mercado fue tibia. En cambio, Firefox, gracias a un ritmo de actualizaciones más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba de manera constante hasta alcanzar aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y el viento estaba cambiando.

Chrome fue lanzado en 2008, basado en el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó el "navegador pesado", pero gracias a la profunda habilidad de Google en la publicidad y la construcción de marcas, rápidamente se destacó.

El arma clave de Chrome no son sus funciones, sino su ritmo frecuente de actualizaciones de versiones (una cada seis semanas) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, volvió a superar a IE, completando la transición de retador a dominador.

Mientras tanto, el internet móvil en China también está formando su propio ecosistema. El navegador UC de Alibaba se disparó rápidamente a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, ganándose la preferencia de los usuarios de dispositivos de gama baja gracias a su diseño ligero y características como la compresión de datos para ahorrar tráfico. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, llegando a ser del 46% en India en un momento. Pero esta victoria no fue duradera. A medida que el gobierno indio intensificó la revisión de seguridad de las aplicaciones chinas, el navegador UC se vio obligado a salir de un mercado clave, perdiendo gradualmente su antiguo esplendor.

Al entrar en la década de 2020, la posición dominante de Chrome ya se ha consolidado, con una cuota de mercado mundial estable en alrededor del 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas de hegemonía independientes: el primero controla alrededor del noventa por ciento de las entradas de búsqueda en todo el mundo, mientras que el segundo domina la "primera ventana" a través de la cual la mayoría de los usuarios acceden a la red.

Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó aproximadamente 20 mil millones de dólares a Apple solo para que Google mantuviera su posición como el motor de búsqueda predeterminado en Safari. Algunos análisis señalan que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "cuota de protección" por su muro de contención.

Pero la dirección del viento ha cambiado una vez más. Con el auge de los modelos de lenguaje grande (LLM), la búsqueda tradicional ha comenzado a verse afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas ya son evidentes. Lo que es más disruptivo son los rumores sobre que Apple podría lanzar su propio motor de búsqueda de IA: si Safari cambia su búsqueda predeterminada a su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, lo que refleja no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.

Desde Navigator hasta Chrome, desde la idealización del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda de IA, la lucha de los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controla la entrada, define el futuro.

Desde la perspectiva de los VC, apoyándose en la nueva demanda de las personas por los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores se está desarrollando gradualmente.

La arquitectura anticuada de los navegadores modernos

Al hablar de la arquitectura del navegador, la arquitectura tradicional clásica es la siguiente:

Cliente - Entrada del front-end

Consulta la entrega más reciente de Google Front End a través de HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, raspado automático), se puede limitar o desafiar en esta capa.

Consulta de comprensión

El frontend necesita entender el significado de las palabras que el usuario teclea, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, ampliando "how to fix bike" a "repair bicycle". Análisis de intenciones, determinando si la consulta es de información, navegación o intención de transacción, y asignando solicitudes verticales.

Recuperación de candidatos

La tecnología de consulta utilizada por Google se llama: índice invertido. En un índice directo, se puede indexar un archivo dado un ID. Sin embargo, los usuarios no pueden conocer el número de contenido que desean entre miles de millones de archivos, por lo que se utiliza el tradicional índice invertido, que permite consultar qué archivos tienen las palabras clave correspondientes. A continuación, Google utiliza índices de vectores para manejar la búsqueda semántica, es decir, para encontrar contenido que sea similar en significado a la consulta. Convierte texto, imágenes y otros contenidos en vectores de alta dimensión (embedding) y realiza la búsqueda según la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa de pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza" porque son semánticamente similares. Después de pasar por el índice invertido y el índice de vectores, se filtran aproximadamente cien mil páginas web.

Ordenación multinivel

El sistema generalmente filtra miles de características ligeras de miles de dimensiones, como BM25, TF-IDF, y la puntuación de calidad de la página, reduciendo un conjunto de candidatos de cien mil páginas a aproximadamente mil, formando un conjunto de candidatos preliminar. Estos sistemas se conocen comúnmente como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales contextuales. Por ejemplo, Google integra la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, entre otros datos, y también considera elementos contextuales como el tiempo (el período del día, el día específico de la semana) y eventos externos como noticias de última hora.

Clasificación principal mediante aprendizaje profundo

En la fase de búsqueda preliminar, Google utiliza tecnologías como RankBrain y Neural Matching para entender el significado de las consultas y filtrar resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático que Google introdujo en 2015, diseñado para comprender mejor el significado de las consultas de los usuarios, especialmente las consultas que aparecen por primera vez. Convierte las consultas y documentos en representaciones vectoriales y calcula la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", RankBrain puede identificar contenido relacionado con "base de pizza" o "preparación de masa", incluso si no hay palabras clave que coincidan exactamente en el documento.

Neural Matching es otra tecnología que Google lanzó en 2018, con el objetivo de comprender más profundamente las relaciones semánticas entre consultas y documentos. Utiliza modelos de redes neuronales para capturar relaciones difusas entre palabras, ayudando a Google a coincidir mejor las consultas con el contenido de la página web. Por ejemplo, para la consulta "¿Por qué el ventilador de mi computadora portátil suena muy fuerte?", Neural Matching puede entender que el usuario podría estar buscando información de solución de problemas sobre sobrecalentamiento, acumulación de polvo o alta utilización de CPU, incluso si estas palabras no aparecen directamente en la consulta.

Reordenamiento profundo: Aplicación del modelo BERT

Después de una selección preliminar de documentos relevantes, Google utiliza el modelo BERT (Representaciones de Codificadores Bidireccionales a partir de Transformadores) para clasificar estos documentos de manera más precisa, asegurando que los resultados más relevantes aparezcan primero. BERT es un modelo de lenguaje preentrenado basado en Transformer, capaz de entender las relaciones contextuales de las palabras en una oración. En la búsqueda, BERT se utiliza para reordenar los documentos que se han recuperado inicialmente. Calcula la puntuación de relevancia entre la consulta y los documentos mediante la codificación conjunta, lo que permite reordenar los documentos. Por ejemplo, para la consulta "estacionar en una rampa sin bordillo", BERT puede entender el significado de "sin bordillo" y devolver páginas que sugieren a los conductores orientar las ruedas hacia el borde de la carretera, en lugar de malinterpretarlo como una situación con bordillo. Para los ingenieros de SEO, esto significa que necesitan aprender con precisión el algoritmo de clasificación de Google y los algoritmos de recomendación de aprendizaje automático, para optimizar el contenido de la página de manera específica y lograr una mayor visibilidad en las clasificaciones.

Ese es el flujo de trabajo típico de un motor de búsqueda de Google. Sin embargo, en la actual era de explosión de IA y big data, los usuarios han generado nuevas demandas en la interacción con los navegadores.

¿Por qué la IA está remodelando los navegadores?

Primero necesitamos aclarar, ¿por qué esta forma de navegador aún existe? ¿Existe una tercera forma?

AGENT1.86%
BERT8.98%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
TokenAlchemistvip
· hace3h
El navegador va a cambiar.
Ver originalesResponder0
AirdropHunterXMvip
· hace17h
La IA no es tan mágica, ¿verdad?
Ver originalesResponder0
GetRichLeekvip
· hace17h
El gobernante será derrocado.
Ver originalesResponder0
LiquidityWitchvip
· hace17h
La nueva revolución ha llegado
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)