Bachelorarbeit zum Thema Relevanzsortierung
17. Juli 2015 von maas
Seit heute ist eine Bachelorarbeit der Hochschule für Angewandte Wissenschaften Hamburg (HAW) online verfügbar, die in Kooperation mit dem beluga-Projekt entstanden ist.
Die Autorin Frau Imke Rulik untersucht anhand von realen Suchanfragen in beluga, in wie weit Known Item-Suchen (bei denen der Nutzer/die Nutzerin ein ihm/ihr bekanntes Werk sucht) von thematischen Recherchen unterschieden werden können und entwirft einen einfachen Algorithmus zur Differenzierung der beiden Fälle. Der Algorithmus kann von einem Retrievalsystem wie beluga verwendet werden, um für die vorkommenden Suchanfragentypen unterschiedliche Relevanzrankings einzusetzen. Die individuellen Rankings können bei dem jeweiligen Suchanfragentyp bessere Ergebnisse erzielen, als ein einheitliches Ranking für alle Anfragetypen. So könnte z.B. bei einer Known Item-Suche die Sacherschließungsinformationen niedrig gewichtet werden, bei einer thematischen Suche dagegen hoch.
Die Arbeit zeigt, das durch eine solche Differenzierung bei voraussichtlich 30% aller Known Item-Suchen eine Verbesserung des Rankings zu erwarten ist.
Die Arbeit ist als Open Access-Dokument auf dem Abschlussarbeitenserver der HAW zugänglich:
Eine sehr gute Arbeit mit vielversprechenden Ansätzen zur Verbesserung des Relevanzrankings.
Ist denn geplant, die Ergebnisse in Beluga (optimalerweise auch nachnutzbar für andere VuFind-Nutzer) zu verwenden?
Wir möchten den in der Arbeit entwickelten Algorithmus zumindest in Teilen gerne verwenden. beluga 0.9 besaß schon zwei verschiedene Relevanzsortierungen für unterschiedliche Suchen. Leider kann ich aber noch keinen festen Termiun für die Umsetzung nennen.
[…] Treffern die spezielle Signatursuche genutzt werden kann. Diese Änderung wurde inspiriert von der Bachelorarbeit von Imke Rulik an der HAW Hamburg aus dem Jahr […]