Hintergrund: Web Search & Ranking in Websuchmaschinen

March 15, 2017 | Author: Josef Kohler | Category: N/A
Share Embed Donate


Short Description

1 Hintergrund: Web Search & Ranking in Websuchmaschinen Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wi...

Description

Hintergrund: Web Search & Ranking in Websuchmaschinen Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg [email protected] @Dirk_Lew

LibRank-Abschlussworkshop Hamburg, 1. März 2016

Gliederung 1. Was bedeutet „nutzerzentriertes Ranking“? 2. Rankingfaktoren in Web-Suchmaschinen 3. Wie gut funktioniert das Ranking? 4. Fazit

1. Was bedeutet „nutzerzentriertes Ranking“?

„Rank as researchers do“ (Anurag Acharya, Google Scholar)

„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden“ (Machill et al. 2003, S. 169)

Charakteristika des Nutzerverhaltens • Kurze Suchanfragen • Power-Law-Verteilung der Suchanfragehäufigkeiten • Kaum Verwendung von Operatoren und Befehlen • Individuell unterschiedliche Formulierung der Suchanfragen (Stark, Magin & Jürgens 2014) • Nutzer geben sich schnell zufrieden • Starke Bevorzugung der vordersten Ergebnisse • Websuche als ein Element im Information-Seeking-Prozess: Springen zwischen Suche und Inhaltsseiten

2. Rankingfaktoren in Web-Suchmaschinen

Gruppen von Rankingfaktoren bei Suchmaschinen • Textstatistik – „Wie gut passen Anfrage und Dokument zusammen?“ – Worthäufigkeiten, Position der Suchbegriffe im Dokument, ... • Popularität – „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses Dokument treffen würde?“ – Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell). • Aktualität – „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ – Datumsangaben, Linkstruktur, ... • Lokalität (=Nutzermodell/Standort) – „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ – Von Länderinterfaces bis zu GPS-Daten • Personalisierung – „Welche Dokumente passen zu mir?“ – Anpassung der Ergebnisse an individuelle Nutzer • Technische Rankingfaktoren – Technische Eigenschaften von Websites bzw. Webservern (kein inhaltliches Kriterium!) Im Detail: Lewandowski, D. (2015). Suchmaschinen verstehen. Berlin Heidelberg: Springer Vieweg. (Kapitel 5)

Gruppen von Rankingfaktoren bei Suchmaschinen vor 1998 • Textstatistik

1998



2001



2004



2009





– „Wie gut passen Anfrage und Dokument zusammen?“ – Worthäufigkeiten, Position der Suchbegriffe im Dokument, ... Popularität – „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses Dokument treffen würde?“ – Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell). Aktualität – „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ – Datumsangaben, Linkstruktur, ... Lokalität (=Nutzermodell/Standort) – „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ – Von Länderinterfaces bis zu GPS-Daten Personalisierung – „Welche Dokumente passen zu mir?“ – Anpassung der Ergebnisse an individuelle Nutzer Technische Rankingfaktoren – Technische Eigenschaften von Websites bzw. Webservern (kein inhaltliches Kriterium!)

Im Detail: Lewandowski, D. (2015). Suchmaschinen verstehen. Berlin Heidelberg: Springer Vieweg. (Kapitel 5)

Zusammenspiel der Rankingfaktoren

Lewandowski, D. (2015). Suchmaschinen verstehen. Berlin Heidelberg: Springer Vieweg, S. 94.

3. Wie gut funktioniert das Ranking?

Anfragetypen in der Websuche nach Broder (2002)

• Informational (informationsorientiert) – Nutzer möchte sich zu einem Thema informieren. – Ziel sind mehrere Dokumente.

• Navigational (navigationsorientiert) – Ziel ist es, eine bestimmte Seite (wieder) zu finden. – Typisch: Suche nach Homepage („Ebay“). – Ziel ist i.d.R. ein Dokument.

• Transactional (transaktionsorientiert) – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. – Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.

Broder, A. (2002). A taxonomy of web search. ACM Sigir Forum, 36(2), 3–10.

Anfragetypen im Bibliothekskontext

Lewandowski, D. (2010). Using Search Engine Technology to Improve Library Catalogs. Advances in Librarianship, 32, 35–54.

Informationsorientierte Anfragen

Lewandowski, D. (2015). Evaluating the retrieval effectiveness of Web search engines using a representative query sample. Journal of the Association of Information Science and Technology, 66(9), 1763–1775.

Navigationsorientierte Anfragen

Lewandowski, D. (2015). Evaluating the retrieval effectiveness of Web search engines using a representative query sample. Journal of the Association of Information Science and Technology, 66(9), 1763–1775.

Snippets vs. Dokumente

Lewandowski, D. (2008). The retrieval effectiveness of web search engines: considering results descriptions. Journal of Documentation, 64(6), 915–937.

Fazit

#1

Ranking versucht auch, „Defizite“ im Nutzerverhalten auszugleichen – und kann diese auch verstärken.

#2

Die Gruppen von Rankingfaktoren in der Websuche sind bekannt und relativ stabil.

#3

„Nutzerzentriertes Ranking“ bezieht sich auf Personen- und Situationsfaktoren. Zur Messung der Qualität der Rankings gibt es unterschiedliche Ansatzpunkte.

Vielen Dank für Ihre Aufmerksamkeit Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information [email protected] Website: www.searchstudies.org

View more...

Comments

Copyright � 2017 SILO Inc.