Search-Strategie | | von Annette Mattgey

So werden Corporate Websites fit für globale Suchanfragen

Globale Konzerne betreiben ihre Corporate Sites häufig in mehreren Sprachen und in der Regel mit spezifischen Ablegern für die einzelnen Länder. Da Internetnutzer durch die gängigen Suchtechnologien daran gewöhnt sind, innerhalb kürzester Zeit die für sie relevanten Ergebnisse zu erhalten, erwarten sie dies auch von Suchfunktionen auf Unternehmenswebseiten. Um ihren Nutzern trotz Mehrsprachigkeit einen hohen Suchkomfort und vor allem relevante Treffer liefern zu können, müssen sich internationale Konzerne fünf zentralen Herausforderungen stellen. Wie sie diese meistern, erklärt Marc Duch, Leiter Search & Web Performance bei Tomorrow Focus Technologies.

1. Schriftzeichen und Zeichenkodierung

Je nach Sprache, in der eine Website betrieben wird, kommen unterschiedliche Zeichensätze (z.B. Lateinisch, Kyrillisch, Chinesisch) und unterschiedliche Leserichtungen (in der Regel von links nach rechts, im Fall von z.B. Arabisch aber von rechts nach links) zum Einsatz.

Bei der Auswahl der Suchtechnologie muss entsprechend sichergestellt werden, dass diese die Indizierung aller möglichen Zeichensätze unterstützt und die Suchschnittstelle die Suchergebnisse in den benötigen Formaten und Zeichensätzen zurückgeben kann – und zwar unabhängig vom Device des Nutzers.

2. Spracherkennung

Um relevante Suchergebnisse liefern zu können, sollte zudem darauf geachtet werden, dass eine Suchlösung die Sprache, in der ein Dokument verfasst ist, automatisch während der Indizierung erkennt. Damit ist gewährleistet, dass eine Filterung nach einer Sprache auch ohne eindeutige URL-Muster (z.B. /de/) funktioniert. Zur Erkennung wird während der Indizierung der Antwort-Header der indizierten Seite ausgewertet. Dort ist optimaler Weise die Sprache des Dokuments hinterlegt. Zusätzlich sollte das gecrawlte Dokument mit Wörterbüchern abgeglichen werden, damit die Sprachzuordnung möglichst perfekt funktioniert.


Beim Ausführen einer Suchanfrage sollte die Suchlösung außerdem versuchen, die Sprache des Nutzers zu erkennen. Hier kommt ebenfalls der Header (diesmal der Request-Header) zum Einsatz, der die eingestellte Sprache des Users übermittelt. Mit dieser Information kann die Suchlösung die zurückgelieferten Ergebnisse entsprechend priorisieren: Ein englischsprachiger Nutzer erhält dann z.B. entweder nur englische Treffer oder die englischen Treffer werden für ihn, im Vergleich zu anderen Sprachen, höher gewichtet. Diese gewichtete Variante kann in Ländern mit mehreren Amtssprachen, z.B. der Schweiz, sehr hilfreich sein.



3. Suchrelevanz in der jeweiligen Sprache (Query Expansion)

Um die Relevanz der Suchergebnisse optimal abzubilden, wird die Suchanfrage im Hintergrund nach dem Abschicken der Anfrage erweitert. Dieses Vorgehen wird als Query Expansion bezeichnet. Bestandteile dieser Query Expansion sollten idealerweise sprachspezifische Synonyme und Wörterbücher sein. Zudem muss die Suchlösung – je nach Sprache – individuelle Algorithmen für die Gewichtung von eingebauten Ranking-Kriterien verwenden.

4. Die Macht der Vorschläge (Query Suggestions)

Das Finden von relevanten Ergebnissen kann Nutzern auch durch ein automatisches Vorschlagen von populären Suchanfragen (Query Suggestions) erleichtert werden, die als Inspiration oder zur Fehlerreduktion dienen. Um den Nutzern, je nachdem, auf welcher Länderwebseite sie sich befinden, die richtigen Vorschläge anzuzeigen, sollte die Suchlösung das Anlegen von länderspezifischen Log-Files ermöglichen. Ein Beispiel, wie das funktioniert, bietet etwa die globale Website von Nivea, die je nach Ursprungsland des Suchers andere Vorschläge bereithält.

Allerdings bergen Query Suggestions, die in der Regel aus häufigen Suchanfragen errechnet werden, auch Risiken:

- Häufig suchen Nutzer nach Informationen, die auf der Seite nicht existieren. In diesem Fall wird ihnen zwar der populäre Suchterm vorgeschlagen, der Klick darauf führt aber zu keinem Ergebnis. Solche „Zero-Result“-Anfragen sollten aus den Suchvorschlägen ausgefiltert werden – idealerweise automatisch.

- Es kann Informationen geben, die von Nutzern zwar gesucht werden, die ein Unternehmen aber nicht in den Suchvorschlägen sehen möchte, z.B.  anzügliche, abfällige oder verleumderische Inhalte. Je häufiger eine Suchanfrage gestellt wird, desto höher erscheint sie in den Ergebnissen. Diese Automatik könnten sich Personen, die einem Unternehmen schaden wollen, zunutze machen. Eine Suchlösung sollte deshalb die Möglichkeit bieten, eine Blacklist mit nicht gewünschten Suchvorschlägen zu erstellen.

5. Performance

Bei kaum einer Web-Applikation ist die Geschwindigkeit aus End-User-Sicht von so großer Bedeutung, wie bei der Suche. Geprägt durch die außergewöhnliche Performance der gängigen Suchmaschinen erwarten Nutzer – insbesondere beim Stöbern – schnellste Antwortzeiten.
 Suchergebnis-Seiten lassen sich mit gängigen Caching-Mechanismen (z.B. Varnish) jedoch nur schwer beschleunigen, da durch die Varianz der Suchanfragen sehr viele Aufrufe unique sind.


Die Suchlösung muss daher konzeptionell auf höchste Performance optimiert werden. Idealerweise muss eine Antwortzeit schneller als eine Sekunde auch in Höchst-Last-Situationen garantiert werden. Entsprechend einfach muss die Lösung durch das Hinzuschalten von weiteren Servern skalieren können.
 Für Suchvorschläge liegt das geforderte Niveau bei 100 ms pro Request.

Marc Duch leitet das Team Search & Web Performance bei Tomorrow Focus Technologies. Er zählt zu den führenden Experten für innovative Suchlösungen und alle Fragen rund um das Thema Search.

So werden Corporate Websites fit für globale Suchanfragen

Artikel bewerten

Vielen Dank, Ihre Bewertung wurde registriert!

Sie können leider nur einmal pro Seite bewerten.

Ihre Bewertung wurde geändert, vielen Dank!

Leserkommentar

Wir freuen uns über Ihre Kommentare.

* Pflichtfeld
** Pflichtfeld, wird nicht veröffentlicht