Eric Kubitz | | von Eric Kubitz

Vergesst die Keywords: Wie Google versucht, uns zu verstehen

In der Web-Analyse konnten wir bisher die Keywords finden, nach denen die Besucher gesucht haben, bevor sie via Google zu uns gekommen sind. Dort steht meist nur noch "not provided". Es scheint, dass die Ära der Keywords zu Ende geht, beendet durch die Suchmaschine. Wir sollten darüber nachdenken, wie Google unsere Suchanfragen wirklich versteht.

Was wollen Suchmaschinen eigentlich?

Eine Suchmaschine möchte zu jeder erdenklichen Anfrage die jeweils beste Antwort geben. Es soll stets die eine Seite an erster Stelle stehen, die wie keine andere die Suchanfrage beantwortet. Und genau darin ist Google eigentlich ziemlich gut.

Es geht Google also um das Verständnis, was der Suchende denn *eigentlich* will. Die Suchmaschine ist auf dem Weg "from Strings to Things". Und da ist es nicht mehr wichtig, ob jemand „Tee aus Asien“ oder „asiatischen Tee“ in den  Suchschlitz eingibt. Beides dürfte ziemlich die gleiche Frage bedeuten.

Und trotzdem werden beide Suchanfragen heute noch in SEO und in SEA ganz unterschiedlich behandelt. Das macht auch irgendwie Sinn. Denn wir müssen nun mal Annahmen über das Suchverhalten treffen und dann bei Google nachschauen, wie häufig nach "Tee aus Asien" gesucht wird und wie häufig nach "asiatischem Tee".

Das verrechnen wir dann mit dem Wettbewerb und entscheiden uns für einen dieser Begriffe. Dafür bauen wir eine Webseite, streuen das Keyword wie Feenstaub darüber und warten gespannt darauf, wie gut das dem Crawler schmeckt.

Was aber, wenn Google versteht, dass beide Suchanfragen das Gleiche bedeuten? Vielleicht wollen uns die Ingenieure in Mountain View genau auf diese Frage stoßen. Auf jeden Fall sollten wir uns darauf vorbereiten, dass Google nach vielen Jahren Entwicklungszeit viel schlauer geworden ist und längst zielführende Konzepte zum tieferen Verständnis von Suchanfragen kennt.

Schon mit dem letzten, wirklich großen Update "Hummingbird" wurde wieder mehr Textverständnis in die Suchmaschine gepumpt. Google möchte damit auch komplexere Anfragen verstehen, die etwa durch das Mikrophon eines Smartphones gestellt werden: "Wo kann ich asiatischen Tee kaufen?" Hier macht es sogar einen Unterschied, ob die Frage auf der Einkaufsstraße ins Handy gesprochen wird oder zuhause. Denn die eine beste Antwort wäre ein hübscher Teeladen in Laufweite, die andere beste Antwort wäre ein günstiger Online-Shop. Aber darum geht es heute hier nicht.

Zunächst einmal müssen die Mathematiker, Linguisten und Ingenieure in Moutain View die Sprache der Menschen so gut verstehen, dass in den Suchergebnissen keine künstliche Trennung zwischen "asiatischem Tee" und "Tee aus Asien" mehr gemacht wird. Nur: Wie soll das eine Maschine kapieren?

Ganz grundlegend muss man bei der Überlegung starten, dass Suchanfragen meist unvollständig sind. „Tee aus Asien“ ist genau genommen gar keine Frage sondern die Beschreibung eines Produktes. Google muss also die Frage selbst zu Ende denken, bevor sie beantwortet werden kann.  

Wie macht die Suchmaschine das?

Erstens ist da der Test: Welche Seite haben Menschen aus den Suchergebnissen gewählt, die zuvor schon „Tee aus Asien“ gesucht haben? Sind viele Klicks in Shops gegangen oder viele Klicks auf lokale Seiten? Daraus kann der Algorithmus lernen und mehr Shops oder mehr lokale Seiten zum Suchbegriff anzeigen. Dann hat Google die Suchanfrage zwar nicht verstanden - liefert aber die demokratisch sinnvollsten Ergebnisse - und zwar vermutlich die gleichen wie für "asiatischen Tee".

Das ist doch schon mal was.
Wenn man etwas tiefer in die Sprachlogik und in die Entwicklungen von Google der vergangenen Jahre eintaucht, dann stößt man auf Entitäten und ihre Eigenschaften: Damit ist gemeint, dass alle „Dinge“ auf der Welt als „Ding“ erkannt und einsortiert werden können.

Wenn Google also von einem Wort weiß, dass es für eine Entität steht und zwar für einen Ort ("München", "Mond") oder das es für eine Entität "Mensch" steht ("Barack Obama", "Max Mustermann"), dann kann der Inhalt einer Suchanfrage viel besser interpretiert werden. Orte bleiben, wo sie sind und können als Ziel dienen. Menschen dagegen wandern herum, haben aber einen Beruf und eine Adresse. Das ist manchmal mehrdeutig, weil "König" ein Name aber auch eine Berufsbezeichnung sein kann. Aber Google wird schnell erkennen, dass die Wörter „Tee aus Asien“ eine Pflanze bzw. ein Produkt bezeichnen, das aus einer bestimmten Weltregion kommt. Wie wahrscheinlich ist es dann wohl, dass jemand etwas anderes damit machen möchte, als es zu kaufen? Vielleicht gibt es einige, die nach der Zubereitung des Tees fragen. Wie häufig das der Fall ist, kann die Suchmaschine wiederum testen, siehe oben. Übrigens: Welche Entitäten es gibt, ist sehr schön auf dem Google-Projekt schema.org zu sehen.

Doch wie bringen wir „Tee aus Asien“ und „asiatischen Tee“ mit Sprachlogik zusammen? Ein Satz besteht aus Subjekt, Prädikat und Objekt. Jedenfalls ziemlich häufig auch in der deutschen Sprache. An unseren beiden Tee-Suchanfragen ist schnell zu erkennen, dass das Prädikat fehlt und wir selbst das Subjekt sind. Vollständig wäre der Satz also so: "Ich will asiatischen Tee kaufen" (oder "zubereiten"). Google wird also wissen, dass beides Objekte und keine Subjekte sind und muss nur noch nach einem Prädikat suchen. Klar wird dann aber auch, dass "aus Asien" die Funktion eines Adjektivs übernimmt - und schon sind wir beim "asiatischen Tee".

Klingt nach Voodoo? Irgendwie schon. Aber wer hätte vor einigen Jahren gedacht, dass das Vertrauen in Backlinks berechnet werden kann? Und das tut Google nun seit dem ersten Penguin-Update ziemlich gut…

Ein weiteres Konzept gibt es noch, das Google hilft, Suchanfragen zu vervollständigen: Die Suchmaschine kennt natürlich beinahe alle Webseiten. Zusätzlich scannt Google auch massenhaft Bücher ein und wirft deren Inhalt in gigantische Datenbanken. Es gibt also niemanden auf der Welt, der mehr in echten Begriffswelten herum forscht. Heraus kommt zum Beispiel der Ngram-Viewer. Dieser bietet Zugriff auf die historische Entwicklung von Begriffen innerhalb der eingescannten Büchern. Eine nette Spielerei, aber das Projekt liefert noch mehr: Die Wahrscheinlichkeit von Wort-Nachbarschaften - und zwar nicht nur online sondern auch offline.

Der Inhalt aller gescannter Bücher wird nämlich für die Verwendung in Datenbanken in Wort-Gruppen aufgeteilt: 1-Wort Gruppen, 2-Wort Gruppen u.s.w.. Damit wird berechnet, wie häufig die gefundenen Wort-Gruppen auftauchen. Ein Beispiel: Welche Häufigkeit haben 4er-Wortgruppen, die mit "Ich wünsche" beginnen? Taucht "Ich wünsche Guten Tag" häufiger als "Ich wünsche frohe Weihnacht" oder "Ich wünsche ein iPhone"? Wird Google also mit einer unfertigen Suchanfrage wie oben konfrontiert, kann die Suchmaschine in ihre Datenbanken schauen und prüfen, welcher Begriff wohl am häufigsten mit den bekannten Wörtern verwendet wurde.  

Ich weiß, das alles ist der Stoff aus dem die Grübel-Kopfschmerzen gemacht sind. Doch genauso ist nun mal die Realität der Suchmaschinen: kompliziert und komplex. Es ist deshalb immer weniger hilfreich, wenn man SEO in ein einfaches Regelwerk wie etwa Bannerwerbung pressen will. Ich schreibe das, weil es für meinen Geschmack immer noch zu viele Seitenbetreiber (und auch SEO-Agenturen) gibt, die ihre Texte mit Keywords vollstopfen und ihren SEO-Etat vollständig ins klassische Linkbuilding stecken. Das sind Konzepte von gestern bzw. vorgestern. Wir sollten gemeinsam an den Konzepten für ein SEO von morgen arbeiten.

Das wollte ich zum Jahresausklang einmal los werden. Allen Komplexitäts-Leugnern aber auch allen Realisten wünsche ich viele ruhige Tage mit viel Zeit zum Lesen und Nachdenken.

Eric Kubitz ist einer der "Digital Leader", einer festen Gruppe von Bloggern, die ihre Meinungen und Kommentare via LEAD digital verbreiten. Mehr zum Autor und den weiteren Mitgliedern der "Digital Leader" lesen Sie hier auf der Übersichtsseite.

Vergesst die Keywords: Wie Google versucht, uns zu verstehen

Artikel bewerten

Vielen Dank, Ihre Bewertung wurde registriert!

Sie können leider nur einmal pro Seite bewerten.

Ihre Bewertung wurde geändert, vielen Dank!

(2) Leserkommentare

Wir freuen uns über Ihre Kommentare.

* Pflichtfeld
** Pflichtfeld, wird nicht veröffentlicht