Anfang der Woche war ich in der dänischen Staatsbibliothek in Aarhus zu Gast – hauptsächlich, um dort über unseren Chatbot Stella zu berichten, aber das Ganze wurde dann ein ein Informationsaustausch in beide Richtungen, denn mit Summa entwickelt die Bibliothek seit 2006 eine eigene Rechercheplattform, die aus beluga-Perspektive natürlich hochinteressant ist. Ein Überblick:
- Die Idee zur Entwicklung von Summa entwickelte das Team von Birte Christensen-Dalsgaard im Rahmen ihres freitäglichen Google-Days – einem Tag, an dem man sich gänzlich einem Thema eigener Wahl widmen kann.
- Nach einer Segmentierungsstudie über unterschiedliche Arten von Bibliotheksbenutzern stand fest, dass etwas für die große Gruppe der “Drive-In-User” getan werden muss, die schnellen Service und unkomplizierte Recherchedienste wünschen.
- Summa ist in Java geschrieben – der Quellcode soll ab September open source sein. Für den Index wird Lucene verwendet, die Metadaten (aus den Bibliothekssystemen Horizon und Aleph sowie OAI-Repositories und weiteren Datenquellen) werden nicht auf ein einheitliches internes Format gebracht, sondern mit XSLT-Transformationen behandelt.
- Titelbilder und Inhaltsverzeichnisse kommen vom kommerziellen Anbieter Syndetics. Der Web-Service von Amazon erlaubt nur einen Download pro Sekunde und ist daher nicht performant genug.
- Es wird angestrebt, auch möglichst viele Daten aus Fachbibliografien in Summa zu integrieren. Mit CSA ist bereits eine entsprechende Vereinbarung zur Bereitstellung der Metadaten getroffen. Außerdem arbeitet man in Dänemark daran, einen nationalen Pool an bibliografischen Metadaten aufzubauen.
- Fester Bestandteil von Treffermengen sind die Kontaktdaten von FachreferentInnen.
- Gute Ranking-Ergebnisse wurden durch das Boosting der Felder Titel und Schlagwort erzielt, der Mechanismus wird aber noch weiter verbessert.
- Die Drilldowns sind derzeit sehr umfassend: quasi alle Bestandteile der bibliografischen Beschreibung können zur nachträglichen Eingrenzung von Suchbegriffen verwendet werden. Nutzungsstudien zeigen aber, dass hauptsächlich Eingrenzungen nach Materialart, Schlagwort, Sprache und besitzender Bibliothek vorgenommen werden.
- Der Einsatz von Summa wird derzeit auch von einer öffentlichen Bibliothek vorbereitet. Hierfür wurde eine “Sidebar” in der Trefferliste entwickelt, die in die knackigen Rubriken “Sortieren, Limitieren, Inspirieren” gegliedert ist.
- Verfügbarkeitsinformationen werden bereits in der Kurzliste angezeigt – die jeweiligen Buttons informieren sogar über die voraussichtliche Wartezeit bis zur Verfügbarkeit eines entliehenen Mediums.
Die Bibliothek bietet umfassende Informationen, u.a. ein White Paper, zu Summa in englischer Sprache – und ausprobieren kann man Summa natürlich auch!
Update: Mehr über die Dänemark-Reise auch im netbib-Weblog.
Tags:aarhus, andere projekte, dänemark, summa

Hübsch…
Geht letztendlich in die gleiche Richtung wie das, was als Primo verkauft wird: Indexierung von Daten aus diversen Quellen und Anbieten dieser Daten über “einen Suchschlitz”[tm].
Allerdings eine Bemerkung aus technischer Sicht: Die Daten müssen auch hier irgendwie in ein “einheitliches Format” gebracht werden, sonst lassen sie sich nicht sinnvoll gemeinsam indexieren. Mag sein, dass das “einheitliche Format” bei Summa nur aus einem Feld besteht (eine Idee, mit der ich auch schon experimentiert habe, darf man aber ja nicht laut erzählen, denn das ist ja Frevel an den hochstrukturierten Ausgangsdaten). Dann ist vor dem Indexieren aber eben immernoch Konvertieren (bzw. wie XSLT ja schon sagt: Transformieren) notwendig: Die Abbildung der beliebig komplexen Ausgangsformate auf dieses eine Indexfeld…
Nett auch, dass über Lucene/Solr Open Source Software langsam in die Bibliothekswelt einzieht…