Feeds
Artikel
Kommentare

Der beluga-Server hatte am vergangenen Wochenende eine ganze Menge zu tun: Alle Datensätze von beluga – immerhin mehr als 6,1 Millionen – wurden aus den bibliografischen Quelldaten neu erzeugt und in das System eingespielt. Zum Glück für die Entwickler lief das Ganze automatisch ab bzw. musste nur einmal per Befehl angestoßen wurden – so war das freie Wochenende zumindest für die Menschen dann doch möglich.

Hintergrund der Reindexierung ist eine Korrektur der Standortfacette. Diese hatte in der Vergangenheit nämlich zu Verwirrung geführt, da in ihr ursprünglich nur die Sonderstandorte verzeichnet waren – also z.B. Magazine, Semesterapparate oder Lesesääle. Seit gestern wird für jedes Werk zusätzlich die Bibliothek oder die übergeordnete Organisation in der Facette angezeigt.

Vorteile bringt das vor allem den kleineren beteiligten Bibliotheken, die oft nur wenige Sonderstandorte verwenden, und im Fall von Onlinemedien. Ab jetzt sind also auch Aufsätze, EBooks und EZeitschriften in den Suchergebnissen der Standortfacette enthalten.

Weiterhin wird die AG beluga in Kürze ihren ersten Zwischenbericht verfassen, der als Planungsgrundlage für die nächsten Entwicklungsschritte dienen wird. Die AG wurde im August eingesetzt, um die wichtigsten Desiderata auf professionelle und bibliothekarisch fundierte Weise festzustellen.

Im November steht dann die Erweiterung der AG an, so dass Mitglieder aller an beluga beteiligten Bibliotheken in ihr vertreten sind und gemeinsam über die Zukunft des Projektes entscheiden können.

Viele kleine Verbesserungen

Um beluga weiterhin fit für den Einsatz im “echten Leben” zu machen, hat sich in den letzten Wochen so einiges getan…

Nicht ganz unproblematisch war die Covereinbindung: Google Books und Library Thing liefern zwar viele Titelbilder, aber die ganz aktuellen Werke, die in beluga unter “Neuerscheinungen” zu sehen sind, erhalten bei den beiden Anbietern meistens erst später ein Cover. Aus diesem Grund mussten die Cover bei den Neuerscheinungen leider verschwinden, dafür sind sie jetzt in der Detailanzeige zu sehen.

Um die Kurzanzeige übersichtlicher zu gestalten verfügt beluga jetzt über alle Icons, die sich auch in einem Pica-OPAC zu finden sind. So können Nutzer auf einen Blick erkennen, ob es eine Monografie, eine Zeitschrift, eine Online-Ressource oder ein Audiodatenträger ist… u.v.m…!

Für Personen, die auf bestimmte Funktionen des OPACs nicht verzichten möchten zeigt beluga neuerdings immer einen Link auf den jeweiligen lokalen Katalog an (vorher war dies nur der Fall, wenn ein Buch vorgemerkt werden musste).

Und nicht zuletzt werden Nutzer, die in beluga nicht fündig geworden sind (“0 Treffer”) jetzt auf den GVK und die damit verbundenen Fernleihmöglichkeiten verwiesen. So lange beluga ausschließlich GBV-Bibliotheken umfasst, scheint uns das die beste Wahl zu sein. Bei einer möglichen Erweiterung um nicht-GBV-Bibliotheken werden wir zukünftig ggf. noch weitere Kataloge anzeigen.

Im kürzlich erschienenen BIX-Magazin (Sonderheft von B.I.T. online) ist der Artikel “Stöbern, Inspirieren lassen, Weiterverarbeiten: Der Bibliothekskatalog 2.0″ veröffentlicht worden, in dem auch Bezug auf beluga genommen wird. Der Artikel hat einen allgemein einführenden Charakter und beschäftigt sich mit der Gegenwart und Zukunft des Katalogs 2.0.

Anonyme Literaturlisten

Beluga erlaubt es ja, persönliche Merklisten zu erstellen und diese durch Freigabe öffentlich zur Verfügung zu stellen. Bisher wurde in dem Link stets der Nutzername mit angegeben, was eventuell nicht immer gewünscht ist. Aus diesem Grund wurden die Nutzernamen jetzt durch anonyme IDs ersetzt.

Im Umkehrschluss bedeutet dies aber auch, dass in eventuell schon verlinkte URLs der Nutzername durch die ID ersetzt werden muss.

Umzug erfolgreich!

Beluga ist zum Monatsanfang auf ein neues Produktivsystem umgezogen. Das Frontend arbeitet jetzt teilweise deutlich schneller, zusätzlich sind die bibliografischen Informationen ab sofort wieder tagesaktuell.

Für das beluga-Team ist der Umzug ein Grund zu feiern: das System wurde konsolidiert, der Code stellenweise gründlich aufgeräumt und für die Prozesse – insbesondere die SOLR-Indizes – steht weitaus mehr Arbeitsspeicher zur Verfügung als bisher. Somit ist beluga zukünftig nicht nur für eine größere Anzahl von Nutzern und Bibliotheken gewappnet, sondern auch weiterhin offen für Weiterentwicklungen am Interface und an den Services.

Umzug auf neue Hardware geplant

Das Jahr 2010 ist und war für beluga sehr abwechslungsreich. Insbesondere die personellen Änderungen wie der Wechsel von Anne Christensen nach Lüneburg so wie das Ende der Förderungszeit und der anstehende Übergang in den Regelbetrieb markieren dabei – leider – das Ende einer sehr spannenden und produktiven Ära.

Dies bedeutet aber keinesfalls, dass sich der Wal jetzt träge durch die Weltmeere treiben lässt – gerade das Ziel, beluga zukünftig stabil einer noch größeren Anzahl von Nutzern verfügbar zu machen, wird uns in den nächsten Monaten auch weiterhin vor viele inhaltliche, technische und organisatorische Herausforderungen stellen.

Der Anfang des Jahres 2011 wird aus diesem Grund für beluga den Umzug auf eine leistungsstärkere Produktionsumgebung mit sich bringen. Der Wechsel auf  schnellere Hardware und die Umstellung des Betriebssystems und der Java-VM auf 64 Bit-basierte Versionen wird die Geschwindigkeit und Belastbarkeit von beluga stark erhöhen. Auch das Dateisystem, auf dem der  – mittlerweile mehr als 100 GB umfassende – Index gespeichert ist, wird von ext3 auf ein flexibleres und schnelleres System umgestellt. Trotz des “technischen” Starts in das neue Jahr freuen wir uns aber natürlich weiterhin sehr über Lob und Kritik in allen Bereichen.

Auf jeden Fall möchte sich das beluga-Team bei allen Freunden, Nutzern und Kritikern noch einmal bedanken und wünscht – für alle, die es feiern – ein frohes Weihnachtsfest und einen guten Start in das neue Jahr.

beluga: Projektübergabe

Goodbye: Anne Christensen, Hello: Jan Frederik Maas

Wie bereits berichtet ist das Projekt beluga offiziell beendet und befindet sich in Vorbereitung auf den Live-Betrieb an den Hamburger Hochschulen. Dabei hat ab Dezember Dr. Jan Frederik Maas die Zügel in der Hand und wird nicht nur die Markteinführung von beluga, sondern auch die weitere Entwicklung der Rechercheplattform verantworten. Der Computerlinguist  ist im Oktober 2009 von der TIB/UB Hannover an der Stabi Hamburg gekommen und gleich in das beluga-Entwicklungsteam eingestiegen.

In Zukunft gibt es also an dieser Stelle Nachrichten aus seiner Feder zu lesen.  Ich verabschiede mich aus dem Projekt, um zum 1.1.2011 an die Bibliothek der Leuphana Universität Lüneburg zu wechseln – und die dort in Vorbereitung befindliche Touchpoint-Installation hoffentlich mit Erfahrungen aus dem beluga-Projekt bereichern können.

Allen, die die Entwicklung von beluga hier im Blog und über andere Kanäle begleitet und verfolgt haben, an dieser Stelle noch einmal ein herzliches Dankeschön!

Der Endspurt bei beluga ist beendet, und zu Ende der Projektlaufzeit in dieser Woche gibt es deswegen eine neue Version unserer Rechercheplattform: Optisch unverändert, aber mit vielen neuen Daten und neuen Funktionalitäten. Mit beluga sind jetzt die Bestände aller antragstellenden Bibliotheken plus der Hamburger Lehrerbibliothek durchsuchbar, insgesamt knapp 6 Millionen Titel.  Für jede der neu hinzugekommenen Bibliotheken haben wir eine neue DAIA-Klasse geschrieben, um möglichst genaue Verfügbarkeitsinformationen geben zu können – das grundsätzliche Problem, dass diese Informationen von jeder Bibliothek unterschiedlich konzipiert und kodiert worden sind, macht die Sache aber mitunter noch holprig. Und auch sonst gibt es beim Thema Verfügbarkeit noch einen recht großen Verbesserungsspielraum:  Angefangen mit der Sortierung der Informationen nach der optimalen Verfügbarkeit bis zur Integration von Geodaten zur Beantwortung von Fragen wie “Welches verfügbare Exemplar ist am nächsten zu meinem aktuellen Standort?” sind noch diverse Funktionalitäten denkbar, mit denen der Weg vom Nachweis zum eigentlichen (physischen) Bestand leichter gangbar wird.

Dass eine möglichst geschmeidige Verfügbarkeitsanzeige relativ weit oben in der Anforderungsliste von Benutzerinnen und Benutzer steht, ist eine von vielen anderen Erkenntnissen, die uns die Fokusgruppen-Interviews und Usability-Tests bei beluga gebracht haben. Der partizipative Ansatz bei beluga war ja so eine Art Alleinstellungsmerkmal des Projektes auf der Landkarte der verschiedenen Katalog 2.0-Initiativen von Bibliotheken, Verbünden und Software-Anbietern. Auf Grundlage der Rückmeldungen von Studierenden und Lehrenden haben wir u.a. auf die Möglichkeit zur Erzeugung von user-generated Content verzichtet und auch die soziale Ader von beluga weitestgehend vernachlässigt. Worauf wir uns stattdessen konzentriert haben, ist die Optimierung von Trefferlisten – das suchmaschinen-verwöhnte Publikum erwartet die relevantesten Publikationen auf der ersten Seite und ist wenig geneigt, die zweite, dritte oder weitere Trefferseiten anzusehen.  Diesem hinreichend bekannten Phänomen versuchen wir in der neuen beluga-Version durch einen neuen Algorithmus für das Relevance Ranking Rechnung zu tragen, der insbesondere die Ergebnisse bei thematischen Suchen verbessert. Wie? Indem wir Listen von populären AutorInnen und Verlagen zu Rate ziehen, die wir entweder maschinell (AutorInnen) oder intellektuell (Verlage) erstellt haben. Publikationen von diesen AutorInnen bzw. aus diesen Verlagen werden höher gerankt, ebenso Einführungsliteratur. Darüber hinaus werden auch weiterhin bewährte Faktoren wie z.B. die Aktualität eines Werkes mit in die Relevanzberechnung einbezogen. Dieser neue Algorithmus greift allerdings nur dann, wenn tatsächlich eine thematische Suche durchgeführt wird – sollte die Eingabe nahe legen, dass es sich um eine Known-Item-Suche handelt, wenden wir andere Regeln an, um das gesuchte Werk möglichst zielsicher zu identifizieren und an der Spitze der Treffermenge zu präsentieren.  Uns ist durchaus bewusst, dass für die Beurteilung der Relevanz eines Werkes noch viele weitere Faktoren eine Rolle spielen – unsere jetzige Lösung wollen wir deswegen als einen ersten Versuch verstanden wissen, neben bibliografischen Daten auch noch andere Faktoren in das Ranking einzubeziehen und die Möglichkeiten zu nutzen, die Solr für den Umgang mit Suchanfragen bereithält.

Wir hoffen, dass wir mit dem neuen Relevance Ranking sowie den bestehenden Optionen zum nachträglichen Einschränken von Suchergebnissen den hohen Erwartungen von Studierenden und Lehrenden an die Suchfunktionalitäten gerecht werden.  Für die Stöbernden unter den Suchenden haben wir außerdem ein Neuerwerbungs-Browsing eingeführt, mit dem wir neue Titel im Bestand der beteiligten Bibliotheken prominent platzieren.  Die schlechte Verfügbarkeit von Buchcovern lässt das etwas weniger attraktiv aussehen als gedacht – wir benutzen derzeit den LibraryThing-Webservice, sind aber mit den Ergebnissen noch nicht so ganz zufrieden. Zum Thema Mashup sei der Vollständigkeit halber noch erwähnt, dass wir neben den Links zu den bibliotheksseitig erstellten Inhaltsverzeichnissen und zu Google Book Search nun auch auf PaperC verweisen.

Und dann haben wir noch an den Export-Optionen gearbeitet: Literaturangaben lassen sich nun auch im den Formaten BibTex, RIS, Endnote und Text herunterladen. Diese Möglichkeiten haben bislang noch gefehlt, da wir uns am Anfang des Projektes stärker darauf konzentriert haben, eine Verbindung zwischen beluga-Katalog und E-Learning-Plattformen herzustellen. Diese Verbindung besteht natürlich weiterhin und ist nun noch um den Export nach OLAT ergänzt worden. Für die neuen Exportformate haben wir uns mächtig gestreckt  und uns dafür entschieden, einen eigenen Konverter für die Daten aus dem beluga-Internformat nach MODS zu schreiben, um bessere Kontrolle über die Qualität der Ergebnisse  zu haben und auch dann noch flexibel zu sein, wenn der beluga-Index um Daten anwachsen sollte, die nicht in der GBV-Verbunddatenbank enthalten sind: Deren unAPI-Schnittstelle hatte uns bislang die MODS-Daten geliefert, die wir wiederum für die Belieferung an unsere lokale refbase-Installation brauchen, um damit die Vielzahl der gewünschten Zitierstile zu erzeugen. Da beluga nun selbst MODS-Daten erzeugt, steht dem weiteren Anwachsen des Indexes nichts mehr im Wege.

Was jetzt noch fehlt, ist der Umzug des gesamten Systems auf einen leistungsstärkeren Server. Dieser ist bereits beschafft und wird in Kürze in Betrieb genommen, so dass beluga noch im Wintersemester 2010/11 für die Studierenden und Lehrenden der Hamburger Hochschulen bereit gestellt werden kann.  Bislang hat beluga von Seiten seiner künftigen Zielgruppen viele Vorschusslorbeeren erhalten: Viele TeilnehmerInnen aus den Fokusgruppen und Usability-Tests sowie die E-Learning-Community vor Ort benutzen beluga bereits seit längerem an Stelle des herkömmlichen Kataloges und loben die Optik und die Funktionalität des neuen Tools.  Damit hat beluga schon ein wichtiges Ziel erreicht, nämlich ein Instrument zu sein, das gerne benutzt wird.

Als Thomas Hapke und ich die Idee “beluga” im September 2007 auf der GBV-Verbundkonferenz vorstellten, haben wir dabei ein Zitat aus der Nachhaltigkeitsbewegung benutzt: Global denken, lokal handeln. Warum? Weil wir rechtfertigen wollten, warum wir uns in Hamburg selbst an die Entwicklung eines Katalog 2.0 wagen wollten, während es auch damals schon mit vuFind und Co. einige Lösungen gab, die man hätte einsetzen können. Wir wollten aber bestehende Lösungen (zum Beispiel aus den ViFas für die Normierung von Metadaten) nutzen, um eigene Erfahrungen mit Suchmaschinentechnologie zu machen, unabhängig über Oberflächen entscheiden zu können und vor allem unsere im Projektantrag gemachten Versprechen bezüglich der partizipativen Entwicklung und der Anbindung der neuen Plattform an die Lernmanagementsysteme einhalten zu können. Wir waren – und sind – immer noch von dem Glauben beseelt, dass man den aktuellen Anforderungen an die neuen Kataloge am besten zunächst auf lokaler Ebene begegnet, nämlich über einen engen Kontakt mit der Zielgruppe und deren Wünschen, der Berücksichtigung der lokalen Gegebenheiten (welche Lernmanagementssysteme sind vorhanden) und der eigenen Ziele und Ressourcen.

In der “Make or Buy”-Frage haben wir uns also sehr bewusst für das “Make” entschieden und sind damit dem Vorbild anderer Bibliotheken gefolgt, die die Entwicklung solcher “Discovery Layer” wie beluga ebenfalls komplett selbst in die Hand genommen haben, z.B. Libris in Schweden, Summa in Dänemark, der KUG in Köln. Dass wir dabei ebenso wie genannten Projekte auf Open-Source-Lösungen in Punkto Suchmaschinentechnologie, Entwicklungsframework, Literaturverwaltung  etc. gesetzt haben, zeigt, dass die “Make or buy”-Entscheidung im Grunde so nicht mehr gibt: Wer sich aufmacht, einen Katalog 2.0 zu entwickeln, wird sicher kaum je an bereits bestehenden Komponenten vorbeikommen, diese in seine Architektur einbauen und für die eigenen Zwecke anpassen. Von Grund auf selbst gemacht haben wir beluga also nicht – jedoch sehr bewusst auf die “Buy”-Schiene, also den Einsatz von kommerziellen Tools verzichtet. Zumal es eben auch auf dem kommerziellen Sektor keine maßgeschneiderten Lösungen für die Funktionen gab, die wir besonders gut machen wollten, nämlich die Anbindung an die Lernmanagementsysteme.

Warum ich das erzähle? Weil mir einer kürzlich angestellten historischen Betrachtung der Bibliotheksautomation aufgegangen ist, dass es so eine Art Goldgräberstimmung in den Bibliotheken schon einmal gegeben haben muss – nämlich damals in den 1970er Jahren, als sich man sich langsam zu regionalen Katalogisierungsverbünden zusammenschloss und einzelne Bibliotheken damit bekommen, so etwas wie ein integriertes Bibliothekssystem selbst zu entwickeln. Und ganz offensichtlich waren die damals in einzelnen Bibliotheken entstandenen Lösungen die Keimzelle für so manches kommerzielles Produkt, wie man beispielsweise im PICA-Museum nachlesen kann (niederländische Sprachkenntnisse vorausgesetzt). Marshall Breeding hat eine interessante Übersicht dazu erstellt, wie sich dann im Laufe der Zeit die erstmals große Vielfalt von kleinen Lösungen durch “Merger and Acquisitions” auf dem Markt der Hersteller von Bibliothekssystemen über die Jahre systematisch reduziert hat. Ken Chad hat auf dieses Phänomen die Theorie der “Disruptive Technologies” angewendet und aufgezeigt, dass der aktuelle Trend zum (Wieder-) Selbermachen von Software-Lösungen im Grunde eigentlich unausweichlich war:  “Disruptive Libraries: The Potential for New Services” heißt sein lesenswerter Vortrag dazu.

Aber noch mal zurück zu den Pionieren in den 1970er Jahren:  Die Kollegen (es ist wohl davon auszugehen, dass es eher Männer waren) haben sich also ihre eigenen Lösungen gebaut. Dass sie dabei konsequent ihre lokalen Bedarfe im Auge gehabt haben, halte ich für gegeben. Klar: Die Zeiten waren andere, ein “Public Access Catalog”  war noch nicht dafür gedacht, von Usern in Eigenregie benutzt zu werden, sondern nur mit Anleitung durch Fachpersonal. Das Erbe dieser Zeit spüren wir mitunter noch bei den hoch spezialisierten Funktionen, die so manche OPACs noch haben und die die Bibliothekarin freuen, aber vom Publikum konsequent ignoriert werden (Stichwort: Erweiterte Suche!).  Wir haben heute eher die BenutzerInnen und ihre Bedürfnisse im Blick – zwangsweise, möchte man sagen, denn ein Monopol auf wissenschaftliche Information haben Bibliotheken nicht mehr. Auch das hat sich seit den 1970er Jahren geändert. Und: Open Source ist erfunden. Uns stehen Lizenzmodelle zur Verfügung, mit denen wir unsere Eigenbau-Produkte einer Community zur Verfügung stellen können und damit so manche Mittelsmänner überflüssig gemacht in Angst versetzt. Es gibt also viele gute Gründe für Bibliotheken, Softwareentwicklung zu betreiben. Im Teilen von Code müssen wir bei beluga zwar noch besser werden, aber das Teilen von Erfahrungen funktioniert schon mal gut, oder?

Diese bibliothekarische Gretchenfrage wurde am vergangenen Wochenende auf dem BibCamp in Hannover diskutiert – zunächst in einer Session mit der Leitfrage, warum die Bibliotheken eigentlich nicht ans Netz wollen.  Meine These dazu: Die Bibliotheken meinen, sie seien im Netz – schließlich hat man doch extra in das WebOPAC-Modul investiert und ein CMS für die Erstellung der Website eingekauft.  Dass jedoch reicht mittlerweile nicht mehr – Präsenz in Facebook, Digitalisate bei Google Books, offene Kataloge mit freien, verlinkbaren Metadaten, so und ähnlich lauten die Anforderungen an Bibliotheken ungefähr 20 Jahre nach der Erfindung des World Wide Web. Außerdem haben sich die Art und Weise, wie gelernt, studiert, Wissen organisiert und publiziert durch die neue Medienrevolution dramatisch verändert – was von Bibliotheken oft ignoriert und von BenutzerInnen mit Sätzen wie “I’ve got Google, why do I need you” bestraft wird. Konsequent also die Forderungen, die in vielen Sessions auf dem BibCamp immer wieder auftauchten: Mehr Know-How für BibliothekarInnen, Erforschung der Benutzerbedürfnisse mit neuen Methoden, Organisationsentwicklung und Innovationsmanagement.

Aber neben Gretchen- wurden auch weitaus konkretere Fragen diskutiert.  Ebenfalls ein häufiges Thema waren die Websites von Bibliotheken, die in der Regel unverbunden neben deren Katalogen, Weblogs, EZB- und DBIS-Seiten stehen. Das neue Ziel: eine Integration von allen Nachweissystemen, Volltexten und Benutzungsinformationen, wie sie beispielsweise im neuen Portal der USB Köln realisiert ist. Dem Thema Katalog 2.0 waren mehrere Sessions gewidmet: In “OPAC mit vuFind” wurde bestätigt, was hier im beluga-Blog anlässlich der Version 0.9 auch schon Thema war: Die Anbindung der neuen Discovery Layer an die Bibliothekssysteme und ihre Verfügbarkeitsinformationen ist ein großes Problem. Gleichzeitig wurde deutlich, dass die Installation von fertigen Open Source-Lösungen wie vuFind keine allzu großen technischen Herausforderungen birgt und schnell zu Erfolgen führen kann, wie das entsprechende Projekt an der TUB Hamburg-Harburg zeigt.

Mit einer speziellen Facette des Katalog 2.0 haben wir uns in der Session “Der beratende Katalog” beschäftigt, die auf diese Überlegungen zurückgeht und im Kern das Ergebnis brachte, dass weniger der intellektuelle Aufwand bei der Erstellung von Auswahllisten sinnvoll erscheint, sondern vielmehr die Investition in automatische Indexierung, ein Mashup mit Library Thing und vor allem die Weiterarbeit an dem vielversprechenden Thema Relevance Ranking. Das Eingangsstatement dieser Session sowie weitere Diskussionsergebnisse in diesen Folien:

Ältere Artikel »