Feeds
Artikel
Kommentare

Obwohl hinter der in solr implementierten Relevanzbewertung recht einfache mathematische Berechnungen stecken, ist die konkrete Konfiguration nicht ganz so trivial, weil dabei viele Parameter eingehen, die optimal einzustellen sind. Weitere Schwierigkeiten ergeben sich daraus, dass es in der Regel weder möglich ist, „belastbare“ Stichproben für alle denkbaren Suchen zu definieren noch überhaupt valide allgemeingültige Kriterien für die Relevanz von bibliothekarischen Daten zu entwickeln. Dennoch gibt es – zumindest bei uns – deutlich „gefühlte“ Qualitätsbewertungen von Relevanzsortierungen. Grund genug für uns, uns mit diesem Thema etwas ausführlicher zu beschäftigen.

Wir haben bereits nach wenigen Versuchen gemerkt, dass sich mit einer „heuristischen“ Herangehensweise das Ranking signifikant verbessern lässt. Heuristisch bedeutet hier, dass wir durch jede Veränderung der Parameter sowohl – exemplarisch – die Struktur der Datengrundlage und die Auswirkungen der Ranking-Berechnungen kennen lernen. Das wiederum gibt uns Hinweise zu weiteren Anpassungen der Parameter – und so weiter. Am Ende ergibt sich hieraus ein stetiger Optimierungsprozess ohne vorab definiertem Ergebnis. Diesen Prozess werde ich hier etwas beleuchten.

An erster Stelle steht hierbei die Analyse der in den durchsuchbaren Indexfeldern vorhandenen Metadaten mit dem Ziel, diese in sinnvolle Einheiten zusammen zu fassen. Dabei kommen insbesondere die Belegungsdichte der einzelnen Felder (oder Kombinationen von ihnen) in Betracht, sowie Abhängigkeiten der Felder untereinander. So haben wir bzgl. des GBV-Index-Auszugs, den wir für Beluga verwenden, beispielsweise festgestellt, dass die Einträge der einzelnen Titelfelder (Kurz- und Langtitel, sowie Titelzusätze) sich in der Regel überschneiden und die Titelzusätze meistens auch den ersten Autorennamen beinhalten. Weiterhin können wir sehen, dass manche Bibliotheken in der Regel Schlagwörter vergeben, andere eher Klassifikationen verwenden. Für übergeordnete Werke wie Serien oder Zeitschriftenbände spielen auch andere Felder eine zentrale Rolle. Zusammen mit einigen weiteren Erkenntnissen aus der Metadatenanalyse haben wir uns entschieden, die Metadaten in die Cluster Titeldaten, Autorendaten, Schlagwörter und Klassifikationen, sowie übergeordete Werke einzuteilen. Dadurch haben wir die Möglichkeit, die Cluster zunächst in sich „auszuwiegen“, um sie dann zueinander in eine sinnvolle Beziehung zu setzen.

Beim „Auswiegen“ der Clusterteile fällt auf, dass das Ranking sich nicht kontinuierlich mit der Änderung der Boostingparameter ändert, sondern es vielmehr jeweils Schwellwerte gibt, bei deren Über- oder Unterschreitung sich das Ranking oft massiv ändert. Diese Schwellwerte hängen natürlich vom Gesamtdatenbestand und auch von den anderen Parametern ab, weshalb sie bei der internen Einstellung der Cluster bestimmt werden sollten. Unsere Strategie ist, die Boostingwerte relativ dicht an diesen Schwellwerten zu orientieren, da sonst die anderen Felder bei der Relevanzbewertung kaum oder gar nicht zu Zuge kommen. Bei der Einstellung der Boostingparameter muss natürlich auch beachtet werden, dass bedingt durch die Feldgrößen (und ggf. durch ein voreingestelltes serverseitiges Boosting) die einzelnen Felder bereits unterschiedliche Gewichte mitbringen. So sind bei unserem GBV-Ausschnitt die Kurztitel um einen Faktor ca. 3 höher bewertet als etwa die Gesamttitel. Neben den Boostingparametern haben wir auch den phrase field Parameter (für Titeldaten) und den Tiebreaker in Betracht gezogen. Während es den Anschein macht, dass der phrase field Parameter in der Regel etwas aufwertet, was aus unserer Sicht nicht unbedingt relevant erscheint (und etwa die Reihenfolge der Suchbegriffe wichtig werden lässt), scheint der Tiebreaker für eine bessere Durchmischung zu sorgen, falls beispielsweise nach Namen gesucht wird, die nicht notwendig den Autor meinen. Darüber hinaus bekommen dadurch auch Ergebnisse ein höheres Gewicht, wenn der Suchbegriff nicht nur in den Titeldaten, sondern auch beispielsweise in den Schlagwort- oder Klassifikationenfeldern vorkommt.

Um die einzelnen Bewertungen zu verstehen und nachzuvollziehen, auf welchen Rang sie die jeweiligen Einträge platzieren, arbeiten wir zunächst mit „known-entity“-Suchen, die obendrein eher kleine Ergebnismengen bringen. So lassen sich dann die Ergebnisse gut mit den eigenen Erwartungen vergleichen und ggf. kann auch beides entsprechend hinterfragt werden. Dabei versuchen wir, zunächst insgesamt ausgewogene Bewertungen zu erzielen (etwa Titel- und Schlagwortdaten), die dann mit offenen Suchen mit großen Ergebnismengen beurteilt werden. Auf der Grundlage dieser Beurteilungen und der Datenqualität der einzelnen Felder (z.B. Belegungsdichte, Qualität der Schlagwörter) werden die einzelnen Boostingparameter wieder verschoben; hier allerdings hauptsächlich in Bezug auf die Bewertung der einzelnen Cluster zueinander. Darüber hinaus ist dies die geeignete Stelle für das Feintuning des Tiebreakers und der allfields-Gewichte und ggf. anderer globaler Parameter.

Schließlich gilt es noch, globale Erwartungen an die Ergebnismengen mit zu berücksichtigen. Dazu gehört in aller Regel das Boosten aktueller Werke mittels einer Boostingfunktion. Dabei ist zu beachten, dass durch ein solches Boosting Zeitschriften benachteiligt werden, da bei ihnen als Erscheinungsjahr das Ersterscheinungsjahr katalogisiert wird. Auch darüber hinaus haben je nach Medium oder Teilbibliothek unterschiedliche Katalogisierungspraxen den Effekt, dass Medien eines bestimmten Formats oder einer bestimmten Bibliothek systematisch benachteilt oder bevorzugt werden. Auch dies sollte mit Hilfe von geeigneten Boostingfunktionen bzw. Boostingqueries abgefangen werden. Dabei können auch eigene Vorlieben (z.B. der Vorrang von Zeitschriften gegenüber einzelnen Artikeln) umgesetzt werden. Wir bevorzugen in allen Fällen additive globale Boostingmechanismen.

Da in diese Überlegungen und Betrachtungen auch Mutmaßungen über die Vorstellungen und Erwartungen der potenziellen Nutzer eingehen, wäre eine externe Evaluation von potenziellen Katalognutzern sinnvoll, um die Ergebnisse einer solchen Evaluation in die Einstellung des Rankings einfließen zu lassen.

Viele kleine Verbesserungen

In den letzen Wochen wurden viele kleine Verbesserungen in beluga eingepflegt. Hier eine Übersicht:

  • Bei vielen Werken werden die Inhaltsverzeichnisse mit indexiert – ein Buch kann also gefunden werden, wenn ein Suchbegriff nur im Inhaltsverzeichnis vorkommt.
  • Die Relevanzsortierung wurde weiter optimiert
  • In der Trefferliste werden jetzt die besitzenden Bibliotheken mit angezeigt
  • Bei Print-Artikeln werden die Ausleihinformationen des enthaltenden Buches angezeigt, sofern bekannt
  • Die Ladegeschwindigkeit der Facetten wurde weiter verbessert
  • Bei bestellten Werken wird jetzt für alle Bibliotheken ein entsprechender Hinweis eingeblendet
  • Bei Detailanzeigen sind die Angaben zur Basisklassifikation jetzt verlinkt, so dass man andere Werke zu dem Thema finden kann

 

Usability und Geschwindigkeit

In dem jetzt beginnenden Wintersemester wird im Rahmen eines Projektseminars von Frau Prof. Ursula Schulz das bestehende beluga auf seine Usability getestet. Die zahlreichen technischen Veränderungen seit Einfühung der Version 2.0 machen diese Tests extrem sinnvoll, damit beluga das erklärte Ziel – ein anwenderfreundliches und nutzerorientiertes Rechercheinstrument zu sein – auch weiterhin erfüllt. Ein weiteres Ziel des Seminars ist die Erarbeitung einer aus Nutzersicht möglichst optimalen Einbindung der Daten aus dem Discoverysystem.

Von Seiten des beluga-Projektes – namentlich der AG beluga – wurde beschlossen, die Ergebnisse des Seminars soweit technisch und finanziell machbar in beluga einfließen zu lassen, so dass die Studie auf jeden Fall nicht nur theoretischen, sondern auch praktischen Nutzen haben wird.

Das beluga-Team freut sich sehr über diese Unterstützung und möchte sich sowohl bei Frau Prof. Schulz als auch bei den Studierenden herzlich dafür bedanken, dass sie beluga als Thema des Seminars möglich gemacht haben.

Darüber hinaus hat beluga einen weiteren Meilenstein hinter sich gebracht: Die Geschwindigkeit und Stabilität des Systems wurden stark verbessert. Zum einen liegt dies an massiven Arbeiten und Verbesserungen von Seiten der Verbundzentrale Göttingen. Zum anderen unterstützt beluga jetzt nachladende Facetten/Filter. Da der Index für die Zusammenstellung der Facetten die meiste Zeit einer Suchanfrage in Anspruch nimmt, werden z.B. die Suchergebnisse jetzt schon vorher angezeigt. Dies führt zu einer gefühlten starken Beschleunigung des Systems – man kann die Treffer schon ansehen, bevor die Facetten angezeigt werden.

Nützlich für die Recherche ist auch, dass seit kurzem in der Kurziste die besitzenden Bibliotheken und die Auflage von Büchern angezeigt werden. Eine Neustrukturierung der Treffer in der Kurzliste macht diese etwas übersichtlicher.

Das Ausschreibungsverfahren für eine Discovery-Lösung in beluga ist abgeschlossen: beluga wird zukünftig den Discovery-Index von Ex Libris – Primo Central – nutzen.

In den nächsten Monaten werden wir intensiv daran arbeiten, den Index in beluga einzubinden. Die besondere Herausforderung liegt darin, ein System an den Start zu bringen, bei dem die Bestände der beluga-Bibliotheken vertreten sind. Das bisherige Konzept von beluga sieht ja eine Gesamtsuche über allen Beständen vor, wobei eine Einschränkung auf einzelne Bibliotheken per Facette möglich ist. Genau dies soll dann zukünftig auch für eine Suche auf den Metadaten aus dem Discovery-Index möglich sein. Voraussetzung ist dabei auch der flächendeckende Einsatz eines Linkresolvers, wobei im Standardfall der Linkresolver von Ex Libris – SFX – zum Einsatz kommen wird.

Am vergangenen Montag wurde ein kleines update für beluga veröffentlicht. Die wichtigste Änderung ist die Verlinkung der von der VZG zur Verfügung gestellten Inhaltsverzeichnisse in den Suchlisten. Liegt ein solches Inhaltsverzeichnis vor (immerhin gibt es insgesamt weit mehr als 2 Millionen), kommt man bequem per Knopfdruck dorthin.

Außerdem sind in den Detailanzeigen die „Ähnlichen Treffer“ gut sichtbar nach rechts oben gerutscht – vorher befanden sie sich am Ende der Seite, wo sie leider immer wieder gerne übersehen wurden.

Ein Thema, das nach wie vor für beluga äußerst spannend ist, ist die Query Type Detection – also die Erkennung, welche Art von Suchanfrage vorliegt. Hat man diesen „Query Type“ erkannt, kann man z.B. individuelle Relevanzsortierungen anwenden. Im alten beluga wurde zwischen thematischer Suche und Suche nach bekannten Werken unterschieden – also „Leben Schiller“ vs. „der kleine Hobbit Tolkien“. Wenn eine Suche nach bekannten Werken („known item search“) vorliegt, können z.B. die Felder Autorenname und Titel stärker gewichtet werden. Bei thematischen Suchen sind dagegen die Schlagworte u.ä. wichtig.

Wie die Query Type Detection im neuen beluga aussehen wird, ist noch unklar, trotzdem wollten wir an dieser Stelle einige Vorüberlegungen nicht verschweigen.

Grundsätzlich gibt es zwei Ansätze:

  1. heuristische Verfahren
  2. Musterklassifikationssverfahren

Heuristische Verfahren können elaborierte „over the thumb“-Regeln sein. So ist z.B. ein guter Hinweis auf eine Known Item Search das Vorhandensein einer Jahreszahl („kleine Hobbit 1986“). Allerdings kann auch diese Regel fehlschlagen, wenn z.B. eine thematische Suche über einem geschichtlichen Ereignis durchgeführt wird. Das Ziel einer guten Heuristik ist es, verschiedene Indizien abzuwägen, anhand derer der Query Type erkannt werden kann. Das Vorhandensein von Autorennamen (ggf. durch geeignete Indexabfragen zu bestimmen), die Länge der Suchanfrage, Jahreszahlen, etc. könnten so einen Strauß an Indizien bilden.

Musterklassifikationssverfahren entsprechen eher wissenschaftlichen Kriterien und versprechen zumindest in der Theorie bessere Ergebnisse, sind dafür aber auch wesentlich schwerer zum Einsatz zu bringen. Grundsätzlich funktionieren diese Verfahren so, dass sie selbstständig die Merkmale lernen, die auf den einen oder anderen Query Type hinweisen. Eine gute Vorverarbeitung der Suchanfrage, die diese Merkmale sauber hervorhebt (also z.B. die Kennzeichnung von Zahlen als Jahreszahlen oder andere Zahlen) erhöht die Chance einer erfolgreichen Musterklassifikation stark.

Als zweites werden eine Trainings- und eine Testmenge an Suchanfragen benötigt, bei denen der Query Type – idealerweise manuell – schon festgestellt wurde. Mit der Trainingsmenge trainiert man die Klassifikatoren, an der Testmenge kann man messen, wie gut die trainierten Klassifikatoren funktionieren. Klassische Erfolgsmaße sind precision und recall, ggf. in dem F-Wert kombiniert.

Die Informatik hat in den letzten Jahrzenten eine große Zahl von Klassifikatoren gefunden – z.B. Bayes-Klassifikatoren, Funktionale Klassifikatoren und die sehr effektiven Support Vector Machines (SVM), die in der Computerlinguistik mit großem Erfolg eingesetzt wurden. Trotzdem wird kein Verfahren – nicht einmal die menschliche Annotation – mit absoluter Genauigkeit erkennen können, was für eine Suchanfrage vorliegt. Im alten beluga war aber ein heuristikbasiertes Verfahren implementiert, das in Verbindung mit individuellen Relevanzsortierungen schon einen Effekt gezeigt hat.

Darüber hinaus gibt es natürlich Suchanfragen, bei denen die Suche nur wenige oder genau ein Ergebnis liefert – die Suche nach einer Signatur oder einer PPN z.B.. In diesen Fällen ist das Relevance-Ranking irrelevant und es kommt eher auf eine gute Indexierung der wichtigen Felder an. Trotzdem kann die Query Type Detection ein sehr wichtiges Werkzeug darstellen, um den Nutzer sicher durch den Dschungel an heterogenen Metadatensätzen zu lenken.

Aktuell geschehen bei beluga sehr viele Dinge im Hintergrund – so läuft zur Zeit die Auswertung der Angebote für einen Discovery-Index, dessen Inhalte den beluga-Nutzern dann ab 2014 zur Verfügung stehen soll.

Trotzdem haben sich in der letzten Zeit auch für die Nutzer positive Änderungen ergeben. Die wohl wichtigste ist seit gestern die Verwendung der Relevanzsortierung als Voreinstellung. Interessanterweise scheinen viele Nutzer davon ausgegangen zu sein, dass diese sowieso schon eingestellt war, da wir des öfteren Kritik in der Form: „das erste Ergebnis ist nicht das relevanteste“ erhielten – was bei der bisherigen Sortierung nach Erscheinungsjahr auch eher ein Zufall gewesen wäre.

Die Umstellung ist das Resultat eines längeren Prozesses, bei dem die VuFind-Relevanzsortierung für unsere Daten optimiert wurde. Zusammengefasst bevorzugt beluga jetzt Monografien („Bücher“) und (e-)Zeitschriften und legt auch mehr Wert auf die Aktualität, als es bei VuFind üblicherweise der Fall ist. Ein besonderes Feature, das das alte beluga beherrschte, ist die Query Type Detection, bei der z.B. erkannt wird, ob eine thematische Suche oder eine Suche nach einem bekannten Werk vorliegt. Anschließend kann dann eine individuelle Relevanzsortierung für den Typ der Suche eingestellt werden – z.B. können bei thematischen Suchen Schlagworte stärker gewichtet werden, als bei Suchen nach bekannten Werken. Dies beherrscht das neue beluga noch nicht, soll es aber wieder unterstützen.

Vorbereitend zu der geplanten Usability-Studie mit Frau Prof. Schulz, unter deren Leitung bereits das alte beluga evaluiert wurde, haben wir auch einige „Basics“ zur Optimierung der Nutzerfreundlichkeit verbessert: So sind die Facetten jetzt im Standard aufgeklappt, zeigen aber zunächst nur die ersten drei Einträge an. Die Linkfarben wurden angepasst und einige schwer verständliche Texte verbessert. Trotzdem sind noch viele Verbesserungen möglich und wir warten sehr gespannt auf die Ergebnisse der Studie.

Ein Dauerthema ist und bleibt die Geschwindigkeit des Systems. Diese hat sich durch die Anschaffung von fünf neuen Indexservern durch die VZG stark verbessert, ist aber immer noch nicht auf dem Niveau von Websuchmaschinen angekommen. Allerdings steht noch die Umstellung auf den verteilten Index (Sharding) aus, von der wir uns einen starken Geschwindigkeitssprung erhoffen.

Eines unserer größten Anliegen bei beluga ist nach wie vor die Geschwindigkeit – es ist frustrierend, wenn man bei einer Recherche mehrere Sekunden auf das Ergebnis warten muss. Aus diesem Grund haben wir in den letzten Wochen einiges getan, um den Wal auf Fahrt zu bringen: Verschiedene Anfragen an den Suchindex (das Herzstück von beluga) wurden zusammengefasst und die Anzeige der „Ähnlichen Titel“, die aus technischen Gründen lange auf sich warten lassen kann, wird jetzt dynamisch nachgeladen. Während vorher also auf der Ergebnis dieser Suche gewartet wurde, ehe man sich die Detailseite eines Werks ansehen konnte, sieht man die wichtigen Informationen schon wesentlich früher.

Trotzdem ist beluga zur Zeit noch langsamer, als wir uns das wünschen würden. Der Grund liegt dafür in der gewaltigen Größe des GBV Central Index, den wir für beluga verwenden und der uns freundlicherweise von der Verbundzentrale Göttingen zur Verfügung gestellt wird. Der Index nähert sich mit großen Schritten der Größe von einem Terabyte (!) und ist somit auch für die extrem leistungsstarken Server in der Verbundzentrale zu umfangreich, weswegen einzelne Suchanfragen sehr lange dauern können.

Natürlich gibt es auch für dieses Problem technische Lösungen – so z.B. der Umstellung auf eine SOLR Cloud, bei der der Index es sich verteilt auf mehreren Servern gemütlich macht. Allerdings ist das eine ziemlich aufwändige Umstellung und trotz der intensiven Arbeiten bei der VZG kann sie noch ein bischen auf sich warten lassen. Wir möchten daher noch um Geduld bitten.

Mit dem Umstieg auf eine Cloud käme auch eine aktuellere Version von SOLR (4.2) zum Einsatz. Diese bringt dann noch weitere Vorteile mit sich, beispielsweise:

  • Bei Tippfehlern werden zukünftig alternative Schreibweisen angezeigt, die garantiert zu Treffern führen
  • Es ist dann möglich, die z.B. im Campus-Katalog beliebte „Titelanfangssuche“ umzusetzen. Suchbegriffe können bisher nur als Phrase oder als Stichwörter gesucht werden, aber manchmal möchte man ein Buch finden, das mit einer bestimmten Wortfolge beginnt.

In den letzten Wochen haben wir außer der Geschwindigkeitsoptimierung vor allem viele Kleinigkeiten bei beluga verbessert: Die Verwaltung von Literatur mit den Merk- und Literaturlisten wurde optimiert (und wird noch weiter verbessert werden), Einzelbände von Zeitschriften werden wesentlich eingängiger dargestellt. Für Smartphone-Besitzer haben wir stark an der mobilen Recherche mit beluga gearbeitet, so dass man auch in dem Bus oder der S-Bahn schon sehen kann, wo das Buch steht, das man gleich braucht. Und darüber hinaus wurden noch zahlreiche weitere Dinge optimiert.

Die wichtigste Neuerung soll aber an dieser Stelle betont werden, auch wenn sie für die meisten Nutzerinnen und Nutzer unsichtbar ist: beluga wurde in Bezug auf die Barrierefreiheit, insbesondere für die Verwendung der Software mit Sehhilfen und Screenreadern optimiert. Die Schaffung von Barrierefreiheit in öffentlichen Räumen – und virtuelle öffentliche Räume wie beluga gehören dazu – ist extrem wichtig und leider technisch nicht ganz leicht umsetzbar. Trotzdem haben wir uns sehr viel Mühe gegeben, beluga z.B. durch die Einführung spezieller Tags so zu gestalten, dass auch Nutzer z.B. mit Sehbehinderung beluga für ihre wissenschaftlichen Recherchen verwenden können.

Und die Zukunft? Für beluga läuft gerade das Ausschreibungsverfahren für einen Discovery-Index, über den dann ein wesentlich leichterer Zugang zu E-Artikeln in wissenschaftlichen Zeitschriften und Ebooks möglich ist. Weiterhin ist gerade eine Usability-Evaluation des Systems geplant, damit beluga auch weiterhin trotz aller umfangreichen Arbeiten ein eingängiges und leicht nutzbares Tool bleibt. Langweilig wird es also um den Wal auch in den nächsten Monaten nicht werden.

Beluga im Februar

Trotz der Grippewelle (die auch das beluga-Team leider erwischt hat) haben wir auch im Februar einige Neuerungen an den Start gebracht.

Wichtigstes neues Feature ist die Facettierung nach Fachbibliotheken. Diese wird bisher allerdings nur für das Bibliothekssystem Uni Hamburg angezeigt, das aber auch mit Abstand die meisten Standorte und Fachbibliotheken besitzt. Auf Anfrage können wir diese Facettierung auch gerne für andere Bibliotheken umsetzen.

Nach Auswahl der Facette „Bibliothekssystem…“ wird jetzt eine neue Facette eingeblendet, bei der das Suchergebnis auf die Fachbibliotheken eingeschränkt wird.

Bild fachbereichs-Facetten

Bild: Facettierung nach Fachbibliotheken

Facetten können ab sofort übrigens wieder an derselben Stelle abgewählt werden, an der sie auch ausgewählt wurden – bisher waren sie kompakt unter dem Suchschlitz zu finden.

Eine weitere Verbesserung ergibt sich jetzt für die nicht deutschsprachigen Nutzer von beluga: Die Ausleihinformationen werden jetzt auch auf Englisch angezeigt, wenn diese Sprache ausgewählt wurde.

Außerdem wurden viele kleine Detailsverbesserungen – insbesondere bei der Darstellung und Verknüpfung von elektronischen Dokumenten – vorgenommen.

Als einer der nächsten Schritte steht vor allem die weitere Optimierung der Geschwindigkeit von beluga an – dazu sollen Oprimierungen am Code vorgenommen werden. Außerdem wird im nächsten Monat aller Voraussicht nach ein weiterer Server für den Index zur Verfügung gestellt werden.

beluga im Januar

Zeitschriften

Im Januar hat sich vor allem bei der Darstellung von Zeitschriften bei beluga etwas getan.

So werden jetzt noch oberhalb der Standort- und Ausleihinformationen die Informationen über vorhandene Bände angezeigt. Über diese kommt man mittels einfachem Klick zu dem Katalogeintrag des Einzelbandes, wenn man diesen z.B. aus dem Magazin bestellen möchte oder genauere Informationen benötigt.

Da die Bandliste recht umfangreich werden kann, kann diese mittels Mausklick ein- und ausgeklappt werden. Im Standard ist sie eingeklappt – sonst würden bei einigen Journals erst nach seitenweisem Scrollen die Standortinformationen sichtbar werden.

Ein weiteres Feature ist die Verlinkung von Online- bzw. Druckausgabe. Diese wird in den allgemeinen Metadaten im oberen Teil der Detailanzeige einer Zeitschrift angezeigt. Die Suche geschieht dabei über die ZDB-ID. Auf diese Weise können sich Nutzer sehr schnell einen Überblick darüber verschaffen, ob die von ihnen gesuchte Print-Zeitschrift vielleicht nur wenige Klicks entfernt zugänglich ist – oder andersherum, ob der online nicht verfügbare Band nicht eventuell doch nur wenige Schritte enternt im Lesesaal steht.

Planung: Facettierung nach Fachbibliotheken

Zur Zeit arbeiten wir unter anderem an der  Facettierung nach Fachbibliotheken des Bibliothekssystems Hamburg – für Nutzer, die sich an einem Bibliotheksstandort befinden und auf die Schnelle nur Werke haben wollen, die sich in „Greifreichweite“ befinden, ist dies eine große Hilfe.  Die Fachbibliotheksfacetten sollen dabei nicht zusammen mit den schon vorhandenen Bibliotheksfacetten angezeigt werden, sondern in einer separaten Liste, die eingeblendet wird, wenn das Bibliothekssystem als Facette ausgewählt wurde.

Wenn dieses Feature technisch einwandfrei umgesetzt wurde spricht natürlich nichts dagegen, es auch für die anderen wissenschaftlichen Bibliotheken zu verwenden, sofern diese über mehrere Standorte verfügen.

Planung: Discoverysysteme

Ein ständig aktuelles Thema für beluga ist natürlich auch die Integration eines Index, der Artikeldaten enthält. Solche Indexe können von verschiedenen kommerziellen Anbietern lizensiert werden. Auf diese Weise könnte sich beluga in ein Allzweckwerkzeug zur Literaturrecherche verwandeln, in dem nicht nur Zeitschriftentitel und Monografien, sondern auch Artikeldaten mit einem direkten Link auf den elektronischen Volltext (wenn vorhanden) recherchierbar sind.

Die besondere Herausformderung für uns ist dabei natürlich die Umsetzung für alle interessierten, an beluga beteiligten Bibliotheken. Aus diesem Grund werden in Kürze detaillierte Gespräche mit den jeweiligen Anbietern erfolgen, bei denen auch speziell für diese Anforderung eine möglichst optimale Lösung gefunden werden soll.

Wartezeiten?

Wer in der vergangenen Woche in beluga recherchiert hat, musste eventuell etwas länger auf die Suchergebnisse warten, als bisher. Der Grund hierfür waren umfangreiche Wartungsarbeiten der Verbundzentrale an dem Index. Diese sind abgeschlossen, so dass die Recherchen wieder zügiger möglich sind. Trotzdem wollen wir beluga auch weiterhin beschleunigen. Zum einen wird die Verbundzentrale weitere Rechenkapazität für den Index bereitstellen, zum anderen müssen wir natürlich auch unseren eigenen Code regelmäßig optimieren. Auf jeden Fall wird der Wal auch zukünftig noch mehr Fahrt aufnehmen!

 

beluga geht an den Start!

Ab heute wird beluga in der neuen Version als offizielle Alternative zum Campus- bzw. Regionalkatalog auf den Seiten der SUB angeboten. Das neue beluga ist ab sofort unter der bekannten URL http://beluga.sub.uni-hamburg.de zu erreichen.

beluga Startseite

In beluga lassen sich die Bestände zahlreicher wissenschaftlicher Bibliotheken in Hamburg recherchieren, wobei zukünftig noch weitere Bibliotheken hinzukommen werden. Die Nutzung von GBV Discovery als Rechercheindex ermöglicht uns, auch die über 6 Millionen Titel aus den deutschen Nationallizenzen recherchierbar zu machen, was für die Nutzer natürlich einen sehr großen Vorteil bedeutet.

Das Design von beluga wurde vollständig überarbeitet und modernisiert, wobei aber die Nutzerführung des alten beluga weitgehend übertragen wurde. Auf diese Weise profitiert das neue System weiterhin von den Nutzerstudien, die bei der Entwicklung von beluga 1.0 eine zentrale Rolle gespielt haben (vgl. Fokusgruppen, Usability-Labor). Natürlich ist geplant, auch das neue System einer Usability-Evaluation zu unterziehen.

Technisch basiert das System auf einer modifizierten VuFind-Installation und dem SOLR 3.6-Index GBV Discovery, der uns freundlicherweise von der Verbundzentrale Göttingen zur Verfügung gestellt wird. Die Verwendung der Open-Source-Software VuFind erlaubt uns zukünftig die verhältnismäßig unaufwändige Integration eines RDS (Resource Discovery Systems) und wir profitieren natürlich direkt von Entwicklungen in der VuFind Community und können ggf. selbst etwas zu der Entwicklung dieser Software beitragen. Durch die Bereitstellung von GBV Discovery nimmt die Verbundzentrale den Bibliotheken die sehr anspruchsvolle und logistisch komplexe Aufgabe der Metadatenkonvertierung und –indexierung für einen lokalen, auf Suchmaschinentechnologie basierenden Katalog ab, wovon das neue beluga direkt profitiert.

Der nächste, in Planung befindliche Schritt ist die Einbindung von Artikeldaten, die z.Zt. nur in geringem Umfang in beluga enthalten sind. Möglich wäre hierfür die Verwendung eines kommerziellen RDS und/oder die Erweiterung von GBV Discovery.

Wir hoffen, dass das neue System positiv von den Nutzern aufgenommen wird und eine solide Basis für die nächsten Entwicklungsschritte darstellt.

« Neuere Artikel - Ältere Artikel »