Sorry Jakob: Nutzer scannen Webseiten nicht, sie erkunden sie!

Über die Rezeption von Webseiten.

Jakob Nielsen, einer der führenden auf Web Usability spezialisierten Experten, hat den Begriff vom scannenden User mit geprägt. So schreibt er zum Beispiel in seiner im Jahr 2000 veröffentlichten Kolumne mit dem Titel „Is Navigation Useful“:„For almost seven years, my studies have shown the same user behavior: users look straight at the content and ignore the navigation areas when they scan a new page. (Remember, users almost always scan – they rarely read carefully online.)“

Das Bild vom Benutzer, der Webseiten scannt, ist irreführend.

Im Wesentlichen unterscheidet Nielsen hier Benutzer, die scannen und solche, die eine Seite sorgfältig lesen. Nach einer Studie, die er schon 1997 durchführte, scannen 79% aller Benutzer und nur etwa 16% lesen Wort für Wort.

Nach eigenen Studien, die wir in Kooperation mit dem Usabilty Labor der Hochschule der Medien Stuttgart (HDM) durchgeführt haben, ist diese Sichtweise nicht nur wenig hilfreich, sondern auch äußerst missverständlich, weil sie zu undifferenziert ist und uns vom Vorgang der Rezeption von Webseiten einen falschen Eindruck vermittelt.

Laut Nielsen schaut der Benutzer sich eine Webseite an, findet darin einzelne hervorgehobene Begriffe und Sätze und erkennt daran, ob der Inhalt für ihn geeignet ist. Diesen Vorgang nennt Nielsen „scannen“.

Nutzer können nur lesen, was sich im unmittelbaren Fokus befindet.

Leider gibt uns das keinen Aufschluss darüber, welche Begriffe oder Sätze ein Benutzer tatsächlich wahrnimmt. Zum einen zeigen Eyetracking-Studien, dass Benutzer nur in Ausnahmefällen eine ganze Webseite „scannen“, zum anderen wissen wir, dass während Sakkadensprüngen (wenn die Augen sich bewegen) nicht gelesen werden kann.

Lesen ist nur während der Fixation möglich, also erst wenn ein Benutzer sein Auge auf eine bestimmte Stelle richtet. „Scannen“ ist also nahezu unmöglich. Was ein User während einer Fixation um die fokussierte Stelle herum wahrnimmt, haben wir in der folgenden schematischen Darstellung versucht abzubilden.

 Fixation um die fokussierte Stelle

Demnach sind im äußeren peripheren Sichtfeld vor allem Bewegungen noch gut erkennbar, aber keine Motive oder gar Texte, ja nicht einmal Farben. Etwas näher sind dann Motive erkennbar, vor allem die Konturen können wahrgenommen werden. Lesen ist also nur im unmittelbaren Fixationspunkt möglich.

Nutzer sind aufgabengetrieben und zielorientiert.

Vielleicht ist auch das Bild vom Surfer falsch. Lenkraketen wären zutreffend!

Wieviel Benutzer tatsächlich lesen, ist sehr kontextabhängig und lässt sich somit quantitativ kaum messen. Die Aussage, dass Benutzer nur zu 16% Prozent Wort für Wort lesen ist deshalb äußerst irreführend. Richtig ist aber, dass Benutzer hochgradig aufgaben-getrieben sind. Selten kommen sie auf Webseiten um zu „browsen“, also einfach mal zu schauen, was es so gibt. Diese Verhaltensweise trifft am ehesten auf Medienangebote (YouTube, Vimeo, Flickr), auf journalistische Webseiten, auf Blogs sowie auf Social Media Angebote wie der Facebook Wall zu.

Auf den Großteil aller anderen Seiten kommen Benutzer mit einem konkreten Anliegen, vor allem auf kommerzielle Angebote mit Produktdarstellungen oder Webseiten mit Fachveröffentlichungen. Auch hier wird in der Orientierungsphase über Übersichtsseiten gehuscht. In solchen Situationen ist es besonders schwer den Benutzer zum Beispiel auch mit wohlgemeinter interner Promotion oder Werbung abzulenken. Benutzer dringen hier sehr zielorientiert auf Detailseiten vor und es wird, wenn der Benutzer die richtigen Stichworte wahrgenommen hat, durchaus Wort für Wort gelesen, womit wir wieder bei der Ausgangspunkt wären.

Aber welcher Mechanismen bedienen Benutzer sich, um sich auf Webseiten zurecht zu finden?

Was sind die richtigen Stichworte und wie findet sie der Benutzer? Wodurch lässt sich ein Benutzer leiten? Was fällt ins Auge, ohne dass ein Benutzer es ignoriert?

Denn dieser vom Benutzer unbewusst angewandte Schutzmechanismus, zu dem auch die sogenannte Banner-Blindness gehört, macht die Sache nicht gerade einfacher. Es kann dazu führen, dass besonders auffällig gestaltete Elemente gar nicht wahrgenommen werden.

Die Antwort ist tatsächlich ziemlich einfach und dann auch wieder schwierig: durch Erfahrung.

Nutzer erkunden Webseiten entsprechend ihrer Erfahrung. Ähnlich wie bei einer Taschenlampe, die in einen Raum leuchtet, erkennen sie jeweils nur den für sie sichtbaren Bereich.

Sie gehen dabei nicht systematisch vor und leuchten den Raum systematisch ab, um anschließend zu entscheiden, wohin sie sich wenden sollen, sondern sie leuchten zunächst gezielt in die Ecken, in denen sie das von ihnen Gewünschte vermuten.

Die DIN EN ISO 9142 110 bietet – wie so oft – ein gutes Gerüst.

Dies wirft vor allem auf den Grundsatz „Erwartungskonformität“ der DIN EN ISO 9142 110 (Grundsätze der Diaologgestaltung) ein Schlaglicht, wobei sich hier vor allem die Frage stellt: Wie entsteht Erwartungskonformität? – Im Web am ehesten durch Gewöhnung.

Pseudostandards wie z.B. ein Logo steht meist oben links, das Suchfeld meist oben rechts, mit nach unten weisenden Pfeilen kann man etwas nach unten aufklappen lassen oder unterstrichene Wörter sind meist verlinkt, helfen den Nutzern Erfahrungswerte aufzubauen, die sie bei der Erkundung von Websites leiten. In einer Studie, die ebenfalls in Kooperation mit der HDM (Nutzererwartungen zur Position von Interface-Elementen auf Webseiten im internationalen Vergleich) entstand, haben wir nachgewiesen, dass solche Pseudostandards sich sogar im internationalen Kontext für die Position von bestimmten Interface Elementen herausbilden.

Aber auch die Grundsätze „Lernförderlichkeit“ und „Selbstbeschreibungsfähigkeit“ sind in diesem Zusammenhang wichtig. Die Lernförderlichkeit erlaubt uns neue oder verbesserte Interaktions- oder Gestaltungsmodelle zu integrieren, sofern sie einen Fortschritt und eine Erleichterung darstellen. Die Berücksichtigung der „Selbstbeschreibungsfähigkeit“ bringt mit sich, dass Metaphern bei visuellen Elementen, sowie Caption und Label bei textuellen Auszeichnungen von Interaktionselementen nur dann funktionieren, wenn sie nicht zu verschlüsselt sind.

Hier ein paar Schlüsse, die wir daraus ziehen können:

Bilder oder Symbole mit klarer Kontur und eindeutiger Metapher können bei der effizienten Rezeption helfen. Im Gegensatz zu rein typographisch organisierten Dialogen verbessern sie die Rezeptionshierarchien.

Wichtig ist auch die Verwendung üblicher Auszeichnungsmethoden (z.B. klare typographische Überschriftenhierarchien).

Interfaceelemente sollten in Platzierung und Form erwartungskonform gestaltet werden. Hier ist der richtige Platz oft bedeutender als eine auffällige Gestaltung. Ein Suchfeld kann sehr zurückhaltend gestaltet werden, so lange es oben rechts zu finden ist.

Veröffentlicht am: 12. März 2014