Hola lector!
En el artículo de hoy vamos a tratar de entender un poco más al buscador. Intentando comprender el último algoritmo que Google ha lanzado: RankBrain.
Creo que es fundamental para un SEO esforzarse por comprender como funciona este buscador, y en este artículo entenderás un poco mejor el presente y futuro de Google. Sin duda, este entendimiento te permitirá tomar mejores decisiones y optimizar mejor tus proyectos.
Todo lo que vas a leer en ese artículo está basado en opiniones personales y no es totalmente seguro que sea definitivo. Aquí se trata de reflexionar sobre la evolución de Google.
Introducción
Cada vez que Google anuncia algo tan importante como un nuevo algoritmo, suelen aparecer en los medios diferentes post, noticias, experimentos y finalmente conclusiones. En este artículo se trata de digerir todas esta información que se ha publicado y darte una visión global del nuevo algoritmo.
En el caso de RankBrain, lo único que Google ha publicado sobre él es un vídeo de Bloomberg y lo que algunos trabajadores de Google anónimos han contado a Danny Sullivan, publicado en el post FAQ: All About The New Google RankBrain Algorithm.
Diseccionando las fuentes
Como acabo de decir, la única fuente oficial que tenemos es esta vídeo entrevista publicada en Bloomberg.
Así que vamos a diseccionar lo que Jack Clark, periodista de Bloomberg y Greg Corrado, investigador científico de Google, hablan en la entrevista.
RankBrain ya se está ejecuntando en todo el mundo
Esto es lo primero que hay que decir. Si te preguntabas si RankBrain estaba actualmente afectando a los resultados de búsqueda de tu país, la respuesta es: Sí.
RankBrain es Inteligencia artificial
Se sabe que muchos ingenieros de Google han estado investigando y trabajando en inteligencia artificial desde hace años. Igualmente es verdad que Google ha trabajado en expresión oral, traducción y procesamiento visual computacional. Sin embargo debemos tener en mente ANI (Artificial Narrow Intelligence), que se podría describir como “la inteligencia de una máquina que iguala o sobrepasa a la inteligencia humana en una cosa específica”.
Google claramente tiene la intención de convertir su motor de búsqueda en ANI en un futuro cercano.
RankBrain es un sistema de aprendizaje
Con el término “sistema de aprendizaje” Greg Corrado quiere decir “sistema de aprendizaje por máquina”.
El aprendizaje por máquina no es nuevo para Google. Los SEOs descubrimos como Google usa aprendizaje por máquina desde que salió Panda en 2011.
Panda, de hecho, es un algoritmo basado en aprendizaje por máquina, el cual puede aprende, a través de la iteración como es la calidad de un sitio web.
Para entrenarse a sí mismo necesita un conjunto de datos y factores del tipo si/no. El resultado es un algoritmo que eventualmente consigue este objetivo.
Las iteraciones tienen el fin de proporcionar a la máquina procesos constantes de aprendizaje para refinar y optimizar el algoritmo.

No sabemos cuándo, pero en un futuro, según dice Greg Torrado en la entrevista, llegará un momento que no hará falta introducir datos como por ejemplo, factores de posicionamiento en el proceso de aprendizaje. Sólo necesitaría un conjunto de datos sobre el cuál aplicar su proceso de aprendizaje para refinar el algoritmo. A esto se le llama aprendizaje profundo.
Rand Fishkin, CEO de Moz, visualiza de forma simple pero correcta como es este proceso de aprendizaje profundo, donde los ingenieros de Google no alimentan el proceso de aprendizaje con factores de posicionamiento conocidos (como por ejemplo TF-IDF, valor semántico, entidades, factores on-page, etc.) sino que se le da por ejemplo, un resultado de búsqueda bueno y él sólo determina los factores de posicionamiento.

Recuerda, RankBrain no es todavía un proceso de aprendizaje profundo. Todavía necesita entradas para poder trabajar, así que ¿Cómo trabaja?
Interpreta lenguajes e interpreta consultas
Para fraseando la entrevista, Greg Torrado nos da información sobre cómo funciona RankBrain:
Funciona cuando la gente hace búsquedas ambiguas o usa términos coloquiales, intentando resolver un típico fallo que tienen los ordenadores, ya que estos no entienden estas consultas o nunca antes la han visto.
Podemos considerar que RankBrain es el primer algoritmo 100% post-Hummingbird desarrollado por Google.
Incluso habiendo tenido nuevos algoritmos ejecutándose después de Hummingbird, como por ejemplo Quality Udapte, estos estaban basados en algoritmos pre-Hummingbird y/o estaban enfocados en fases muy diferentes de la búsqueda. Concretamente en la fase filtrado y posicionamiento(ranking). En la siguiente imagen puedes ver las distintas fases de la búsqueda:

RankBrain parece ser un parche necesario a la actualización general de Hummingbird. De hecho, deberíamos recordar que Hummingbird fue creado para ayudar a Google a entender "consultas abundantes en palabras".
Se podría entender que RankBrain no es la versión 2 de Hummingbird, sino un nuevo algoritmo que optimiza el trabajo de Hummingbird.
Según las palabras de Greg Corrado, podemos decir con un alto porcentaje de acertar, que RankBrain está en las fases de "Understanding"(entendimineto) y "Retrieving"(recuperación de datos).
Evidentemente, las consultas muy ambiguas o coloquiales eran demasiado difícil de entender por Hummingbird. Es por ello que se crea el algoritmo RankBrain.
RankBrain, al igual que Hummingbird, trata de generalizar y reescribir este tipo de consultas, tratando de encontrar la intención del usuario detrás de ellas
Para entender una consulta nunca vista antes o que no esté clara, RankBrain usa vectores ( que según comenta Greg Corrado en la entrevista son: vastos montones de lenguaje escrito incrustados en entidades matemáticas) e intenta ver si dichos vectores podrían tener una relación en el significado de la consulta que está intentando responder.
Una vez que se han descubierto páginas web que podrían resolver a dicha consulta, RankBrain las recupera y las deja proceder, siguendo los pasos en las fases de búsqueda hasta que dichas páginas son mostradas en la SERP.
En este contexto debemos aceptar la definición de que RankBrain es "un factor de posicionamiento" ya que cuanto más considere RankBrain que una página web es potencialmente correcta para responder a una consulta desconocida o no entendible por el buscador, más alto aparecerá en los resultados de búsqueda (mientras sigue teniendo en cuenta los otros factores de posicionamiento aplicables).
Por supuesto, será la elección del usuario la que en última instancia informe a Google cuál es la página que mejor ha respondido a la consulta.
Por último, aclarar una duda que hubo también cuando salió Hummingbird: No, tu sitio no ha podido perder visibilidad debido a una misteriosa penalización de RankBrain.
Desmantelando los engranajes de RankBrain
Kristine Schachinger, una SEO de gran altura, relaciona RankBrain con el Gráfico de Conocimiento de Google (knowkedege Graph) y con las Entidades de Búsqueda. No considero que Hummingbird y el Gráfico de Conocimento sean la misma cosa. Sin embargo si comparten la misma misión, convertir frases y cadenas en cosas, y Hummingbird usa parte de la tecnología que hay detrás del Gráfico de Conocimiento, pero siguen siendo cosas diferentes.
Por lo tanto, si Hummingbird no es lo mismo que el Gráfico de Conocimeinto, deberíamos pensar en entidades no solo como entidades de nombre (gente, conceptos como "amor", planetas, puntos de referencia, marcas) sino también como entidades de búsqueda, que son completamente diferentes
Las entidades de búsqueda son como las siguientes:
- Una consulta que un usuario hace
- Una página web receptiva a la consulta
- La sesión de búsqueda en la que el usuario hace la consulta (cuando buscamos algo, podemos hacer varias consultas diferentes hasta que encontramos algo. Esto sería la sesión de búsqueda)
- La hora a la que la consulta ha sido hecha
- Anuncios mostrados en el resultado de la consulta
- El anchor text de un enlace en una página
- El dominio asociado a dicha página
Las relaciones entre estas entidades de búsqueda pueden crear una "puntuación de probabilidad", la cual podría determinar si una página es mostrada en el SERP o no
No podemos descartar el hecho de que RankBrain utiliza entidades de búsqueda para encontrar las respuestas más probables y correctas a las consultas nunca vistas antes y entonces usa la puntuación de probabilidad para ofrecer unos resultados sustantivos y razonables para dicha consulta.
El mayor avance de RankBrain sin embargo es, cómo maneja la cantidad de contenido que analiza para crear vectores. Parece ser mayor que el clásico “anchor text y texto que hay alrededor de un enlace” que siempre sale en las discusiones sobre cómo funciona el gráfico de enlace.
Especulando sobre RankBrain
Como su propio nombre indica, en esta sección entramos en la parte más especulativa del post
Todo lo que se ha escrito antes en este artículo también podría ser considerado como especulación, la diferencia son las posibilidades de ser verdad.
DeepMind y la búsqueda de Google
En 2014 Google adquirió la compañía DeepMind, especializada en sistemas de aprendizaje por máquina. Podríamos considerar que está usando parte de la tecnología de DeepMind para mejorar los algoritmos de búsqueda, como por ejemplo el proceso de aprendizaje por máquina de RankBrain.

Se sabe que uno de los obstáculos más grandes para un correcto proceso de aprendizaje por máquina es tener una base de datos bien estructurada. Sin ella, el proceso de aprendizaje por máquina o aprendizaje profundo, no puede funcionar.
Usando el periódico Daily Mail, DeepMind probó que su sistema de aprendizaje profundo funcionaba bastante bien, llegando a responder correctamente al 60% de las preguntas que se hicieron después del aprendizaje.
Podríamos pensar que no es un gran porcentaje. Sin embargo, especulemos: ¿No es el Gráfico de Conocimiento y el índice de búsqueda una gigantesca base de datos con detalladas anotaciones? ¿Sería posible para Google utilizar el mismo sistema de aprendizaje profundo que DeepMind usó con un simple periódico? Sin duda el resultado, usando las bases de datos de Google, debería ser mucho mejor.
La vision de Ray Kurzweil
Ray Kurzweil es muy conocido por su faceta “futurista”. Fue contratado por Google en 2012 para traer “entendimiento natural del lenguaje a Google”. Este entendimiento es esencial tanto para Hummingbird como para RankBrain.

En una entrevista en The Guardian, Ray Kurzweil dijo que:
La misión de Google es organizar y procesar toda la información del mundo, para posteriormente poder mantener un dialogo inteligente con el usuario
La tecnología de DeepMind, de la que acabamos de hablar, va en esta dirección.
Sin embargo, el mayor problema a la hora de hacerlo para Google no es tener la capacidad de leer billones de documentos, ya que actualmente lo está haciendo, sino entender el significado implícito de las palabras, para poder responder adecuadamente a las preguntas de los usuarios.
Sabemos que Google está trabajando duro para conseguir esto, ya que Kurzweil dijo, en la misma entrevista: “Vamos a codificar de verdad, cómo enseñarle a entender el significado de lo que dicen los documentos”.
Los vectores usados por RankBrain podrían ser nuestra primera ojeada a la tecnología de Google que conseguirá entender todos los contextos, lo cual es fundamental para dar significado al lenguaje.
¿Cómo podemos optimizar para RankBrain?
Seguro que te lo estabas preguntando.
Pues tengo que decirte que es inútil optimizar para RankBrain, ya que el objetivo de este son las consultas no entendibles o las que usan coloquialismos. Si incluso no es muy útil crear una página específica para cada palabra long tail, mucho menos lo será para trabajar los tipos de consulta que RankBrain maneja.
Lo que debemos hacer es insistir en optimizar nuestro contClick to replace anchor textenido usando técnicas SEO semánticas para ayudar a Google a entender el contexto de nuestro contenido y el significado detrás de los conceptos y entidades que estamos escribiendo.
Lo que debemos hacer es considerar los factores personalizados de búsqueda como prioridades, ya que las entidades de búsqueda están muy relacionadas con la personalización. Hacer b
Para cerrar este artículo decir que RankBrain no nos va a afectar mucho a nuestras actividades SEO diarias, más bien nos ofrece un anticipo de lo que depara el futuro del SEO.
Este artículo está basado en el post de Gianluca Fiorelli, para el blog de Moz. Gianluca es un SEO profesional que se autodefine como eterno estudiante. Es un estratega y consultor SEO que opera en el mercado italiano, aunque también trabaja en proyectos SEO internacionales con www.iloveseo.net. Puedes seguir su perfil de Google+ y de Twitter
Si te ha gustado, compártelo en tus redes. Te lo agradeceré enormemente!
Julio magnífico post y gran explicación del algoritmo de Google.
Un abrazo.
Gracias por tu comentario Juan Carlos!
Muy buen Post como siempre, claramente se avisora que será cada vez más difícil para los SEO «manipular» los resultados de búsqueda para beneficiar a sus clientes.
Claramente la calidad, cantidad y periodicidad de publicación de contenido relevante, se hará cada vez más importante.
Saludos. desde Argentina!
Juan Manuel
Gracias por tu comentario Juan Manuel!
Enhorabuena por el post Julio.
Es alucinante hacia dónde se dirige Google, pero me deja más tranquilo la última parte del post donde explicas que no va a afectar demasiado a las SERPs de nuestras webs y que afectará solo a (de momento) a un tipo concreto de búsquedas.
Ya tienes otro seguidor
Gracias por el comentario Luis!!
La verdad es que es fascinante ir descubriendo que hay detrás del gigante Google.
Un abrazo!
Porque no publicáis la guía de Google en castellano? Nos sería muy útil.
O, al menos, podéis ofrecer un enlace desde donde poder descargarlo en nuestro idioma?
Hola, Blanca.
¿A qué guía te refieres?