Dieser Beitrag von Anne Christensen, Patrick Danowski und Adrian Pohl wurde zeitgleich auf den Blogs netbib, Bibliothek 2.0 und mehr und Übertext veröffentlicht. Katalogdaten sind zweifellos gefragter denn je – nicht nur für Zwecke der Fremddatenübernahme bei der Katalogisierung, sondern auch im Web 2.0, von Sozialen Katalogisierungsanwendungen wie LibraryThing und Open Library. Darüberhinaus gewinnen mit dem unaufhaltsamen Fortschritt von Linked Data, der dieses Jahr seinen bisherigen Höhepunkt erreicht hat, Katalogdaten in einem weiteren Anwendungsbereich an Bedeutung. Die Verlinkung freier Daten (Linked Open Data) bietet uns die Möglichkeit, das Wissen, was in den Titel- und Normdaten enthalten ist, abzuschöpfen und durch die Verknüpfung mit anderen – nichtbibliothekarischen – Wissensressourcen seine Nutzungsmöglichkeiten zu maximieren.
Kommerz mit Metadaten
Parallel zu dieser Entwicklung des Internet zum Linked-Data-Web und der Aussicht auf ganz neue Möglichkeiten der Recherche und Wissensgewinnung entwickelt sich aber auch die kommerzielle Nutzung von Metadaten in ganz neue Dimensionen. OCLC, das etwa ein Drittel seines Umsatzes mit dem Verkauf von anderen produzierter Katalogdaten macht, versuchte mit einer neuen Metadaten-Policy – unter Umgehung der Mitgliederbasis und der bibliothekarischen Gemeinschaft, die das Vorhaben schließlich zu Fall brachten -, sein Monopol auf die Katalogdaten der Mitgliedsbibliotheken juristisch zu zementieren. Organisationen wie EBSCO und Serials Solutions versuchen mit ihren neuen Produkten EBSCO Discovery Service und Summon eine Menge Geld im Bereich Aggregierung und Verkauf von Metadaten und dazugehörigen Suchoberflächen zu verdienen.
Open Access: ja, Open Data: ja, Open Bibliographic Data: nein
Vor diesem Hintergrund ist es verwunderlich, dass die deutschsprachigen Bibliotheken und Bibliotheksverbünde sich bisher kaum mit neuen Nutzungsmöglichkeiten ihrer bibliographischen Daten auseinandergesetzt haben. Adrian Pohl stellte zwar am Ende seiner Dokumentation der OCLC-Metadaten-Kontroverse bereits u.a diese Frage für die deutschsprachige Bibliothekswelt:
Über Problemstellungen wurde aber bisher selten geredet und an die Öffnung und Verfügbarmachung der mit öffentlichen Mitteln produzierten bibliothekarischen Daten wird kaum ein Gedanke verschwendet. Zur gleichen Zeit wird die Bibliothekswelt nicht müde als ein wichtiger Pfeiler der Open-Access-Bewegung lautstark von anderen, nämlich Wissenschaftlern, die Freigabe ihrer Arbeitsprodukte, sowohl von Publikationen also auch von Rohdaten, zu fordern.
Es tut sich was…
Es sind aber erste Entwicklungen hin zur Freigabe bibliographischer Daten auszumachen: Im Strategieentwurf des Gemeinsamen Bibliotheksverbund (GBV) vom August dieses Jahres ist die Entwicklung einer Lizenz zur Freigabe der Verbunddaten festgehalten, auch das Hochschulbibliothekszentrum Nordrhein-Westfalen (hbz) unterstützt die Freigabe von Katalogdaten und Patrick Danowski hat – wie im Übertext berichtet – auf der Tagung „Semantic Web für Bibliotheken“ angekündigt, dass die CERN Library ihre Daten öffnen werde. (Leider hat sich der angekündigte Termin auf Januar 2010 verschoben)
…aber: Zwei Open-Data-Vorträge abgelehnt
Dass das Thema – auch im Bibliothekswesen – an Bedeutung gewinnt, ist also klar. Dies zeigte sich auch daran, dass mindestens zwei Vortragsvorschläge dazu – von den Autoren und der Autorin dieses Beitrags – für den Bibliothekskongress 2010 eingereicht worden sind. (Die beiden Abstracts sind am Ende dieses Textes dokumentiert.) Leider entschied die Programmkommission (deren Zusammensetzung nicht transparent im Internet dokumentiert ist), dass dem Thema „Freie bibliographische Daten“ auf dem Bibliothekskongress kein Forum geboten werde. Beide Vorträge wurden abgelehnt. Insgesamt ist das Auswahlverfahren für den Bibliothekartag wie Bibliothekskongress wenig transparent.
Nachdem die erwähnte Tagung „Semantic Web in Bibliotheken“ vom hbz und der ZBW im November 2009 innerhalb von kürzester Zeit ausgebucht war, ist es umso bedauerlicher, dass dem offensichtlichen Interesse von Kolleginnen und Kollege an dieser Thematik in dem Leipziger Programm anscheinend nicht Rechnung getragen wurde. Bibliotheken haben mit Open Data die Chance, sich als Erzeugerinnen und Anbieterinnen von qualitativ hochwertigen, webfähigen Daten zu profilieren. BID Deutschland, die Bundesvereinigung Deutscher Bibliotheksverbände, als Veranstalterin des Leipziger Kongresses versäumt damit den eigenen Anspruch, „zeitgemäße Informationsdienstleistungen als Voraussetzung für die Entwicklung von international konkurrenzfähigen Produkten zur Verfügung zu stellen“.
Gespannt erwarten wir das Programm, um zu sehen welche Themen BID Deutschland für wichtig und innovativ hält.
Dokumentation der eingereichten Abstracts:
Freie Metadaten
Referenten: Anne Christensen (SUB Hamburg), Adrian Pohl (hbz)
ABSTRACT
Open Source und Open Access sind mittlerweile im öffentlichen und bibliothekarischen Diskurs fest verankerte Begriffe. In den letzten Jahren wird zunehmend auch über Open Data diskutiert – seien die freien Daten, um die es dabei geht, wissenschaftliche, statistische, administrative Daten oder eben Metadaten.
Dieser Vortrag dient als Einführung in das Thema „Freie Metadaten“ und beantwortet Fragen wie: Was heißt frei? Um welche Daten geht es? Warum sollen Daten frei sein? Behandelt werden der Hintergrund der Bestrebungen nach freien Metadaten, ihre Geschichte, die dahinterstehenden Motivationen und Ziele. Besondere Berücksichtigung findet dabei die Veröffentlichung von bibliografischen Daten und Normdaten als Open Linked Data.
Zudem werden Vorhaben zur Freisetzung der bibliografischen Metadaten im deutschsprachigen Raum betrachtet und es wird auf Fragen der Umsetzung eingegangen: Welche Lizenz soll ich wählen? Bin ich rechtlich befugt, alle Daten in meinem Katalog freizugeben? In welchem Format publiziere ich meine Daten?
Aus dem Silo ins Semantic Web: Bibliographische Daten als Linked Data Publizieren P. Danowski
CERN Scientific Information Service, 1211 Geneve, Schweiz
Inhalt
Tim Barners Lee hat den Begriff Linked Data fuer eine Methode beschrieben mit der Daten veroeffentlich, geteilt und verbunden werden. Dabei sollen die Daten mit URL basirten Identifiern erreichbar sein und andere Daten im Netz referenzieren (verlinken).1 Inzwischen wurde eine Vielzahl von Daten mit dieser Methode publiziert.2
Spaetestens seit dem letzten Jahr sind auch Bibliotheken auf dieses Thema aufmerksam geworden und beginnen ihrer Ressourcen in dieses Netz von Daten einzubringen. In dem Vortrag wird gezeigt, wie sich bibliographsche Daten als Linked Data publizieren lassen.
Dabei soll darauf eingegangen werden welche Frage zu klaeren sind. Dies sind unter anderen:
– Die Wahl einen Formats (einer Ontology)
– Lizenzfragen
– Vertrauensfragen
Der gesammten Prozess soll anhand eines Projekt fuer die Katalog Daten der CERN Library veranschaulicht werden. Es soll auch beschrieben werden welche Probleme in dem Prozess aufgekommen sind und welche Loesungsmoeglichten hierfür entdeckt wurden.
Quellenangaben
<1> vgl. auch http://en.wikipedia.org/wiki/Linked_data
<2> Zu der Menge der Daten gibt es ein klickbares Diagramm in dem die Verbindung der verschieden Ressources erkennbar ist. http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-07-14.html
Tags:Konferenzberichte, Metadaten, Open Access, Semantic Web ]]>Unter dem Titel „I know what you borrowed last summer“ erzählt David Pattern über Nutzung von Benutzungsdaten in der Bibliothek.In dem Bibliotheksystem (Horizon) sind 3 Million Ausleihen (ciculation data) woraus Empfehlungen erzeugt werden (Leute die dies ausgeliehen haben, liehen auch aus)
Außerdem können persönliche Empfehlungen erzeugt werden wie: Sie suchen etwas, dies könnte sie interessieren.
Analyse der Ausleihen der Teilnehmeres eines Universitätskurses um die relevanten Klassifikation für den Kurz zu ermitteln und neue Bücher-Feeds zu erzeugen, die für den Kurs relevant ist und in das Lernmangementsystem implementiert werden können.
In dem Moment als die Empfehlungen hinzugefügt wurden stieg der Anteil der von der Bibliothekssammlungen ausgeliehen Bücher sowie die durchschnittliche Anzahl der Bücher pro Student.
Außerdem wurden anonymisierten Benutzungsdaten für 2 Millionen transactionen und 80.000 Titel veröffentlicht. Sie sind doppellizenziert unter einer CC0 / Open Data Lizenz und werden zum Download angeboten. Ebenso die Empfehlungsdaten für 37.000 Bücher
Updates: Rechtschreibfehler in der ersten Version verbessert und Links eingefügt
Zwi Tage nach der Veröffentlichung der Daten hat Patrick Murray-John die Daten in RDF umgewandelt. Außerdem haben Studenten eines Kurses die Daten wunderschön visualisiert.
PS Links folgen später
Tags:Bibliothek 2.0, Metadaten, Klassifikation, Open Data, RDF ]]>Die Unterstützung von deutschsprachigen Webseiten von Zotero mittels COinS oder unAPI nimmt immer weiter zu. Hier ein aktueller Überblick (soweit mir bekannt) Hinweise auf weitere Projekte bitte in den Kommentaren hinterlassen, ich werde sie dann in Updates des Posts aufnehmen:
Biblioblogs:
Wer sein Blog selber hostet, WordPress verwendet und COinS bzw unAPI installieren möchte findet dazu Informationen in meinem Beitrag: Support Zotero with WordPress
Update 1: BSZ-SWB ergänzt (via InetBib u. Twitter) Update 2: Max Planck Virtual Library ergänzt (via Twitter) Update 3: ViBI, E-LIB Suchmaschine, Blog der Genderbibliothek der HU-Berlin und InfoWissBlog ergänzt Update 4: HEIDI ergänzt Update 5: GBV jetzt mit unAPI, Stabikat, Campuskatalog Uni Hamburg, Katalog der Bayrischen Staatsbibliothek
Tags:Bibliothek 2.0, Bibliothekssoftware, Fun, Literaturverwaltung, Metadaten, Biblioblogs, Blogs, COinS, netbib, Zotero ]]>Das ein wenig vergesse Kind der Bibliothek 2.0 Bibliography hat heute ein Softwareupdate erfahren. Es läuft auf der WIKINDX Version 3.81 diese unterstützt auch COinS, so dass die Angaben in der Bibliographie noch leichter weiter verwendet werden können. Da ich diese in Zukunft gerne etwas besser pflegen möchte, gehen den üblichen Verdächtigen in den nächsten Tagen noch Passwörter für Benutzeraccounts zu. Ebenfalls kann man sich bei Interesse gerne hier in den Kommentaren melden.
Tags:Bibliothek 2.0, Literaturverwaltung, Metadaten, Software & Tools, WIKINDX ]]>Das Kompetenzzentrum Interoperable Metadaten (KIM) hat sich u. a. als Ziel gesetzt, die im Dublin Core Metadata Registry online verfügbare, deutsche Übersetzung des Dublin Core Metadata Element Set 1.1 (DCMES 1.1) aus dem Jahre 1996 zu aktualisieren.
Die aktualisierte Übersetzung stellen wird in einem Blog zur Diskussion gestellt, mit der Bitte mit Verbesserungsvorschlägen und Kommentaren die Erarbeitung der deutschen Übersetzung der Dublin-Core-Elemente zu unterstützen. Die Bearbeitung läuft bis zum 1. August 2007 in dem Blog.
Unter Berücksichtigung der Vorschläge soll der vorliegenden Entwurf überarbeitet werden um ihn auf der diesjährigen Dublin-Core-Konferenz in Singapur zu präsentieren.
Schön das Blogs nun auch immer mehr Verwendung im deutschen Bibliothekswesen finden.
[via inetbib]
Tags:Metadaten, Weblogs, Blogs, Dublin Core, KIM, Kompetenzzentrum Interoperable Metadaten ]]>Die Meldung das Zotero jetzt zusammen mit Wikipedia funktioniert funktioniert hat mich dazu ermuntert mir das Tool mal wieder anzuschauen. Es wird zum einen das Zitationsformat für die englischsprachige Wikipedia als Style Vorlage angeboten. Zum anderen ist aber auch möglich die strukturierten Daten der Literaturhinweise der englischsprachigen Wikipedia importiert werden können. Das klappt noch nicht bei allen Seiten, da noch nicht immer die entsprechenden Vorlagen verwendet wurde. Bisher hielt sich in deutschsprachigen Wikipedia die Begeisterung für Literaturvorlagen in Grenzen. Vielleicht wird das nun etwas anders, da ein Tool existiert, das diese Vorlage auch nutzbar macht. Damit kein neuer Importfilter geschrieben werden müsste, würde es sich sogar anbieten die Vorlagen aus der englischsprachigen Wikipedia direkt zu übernehmen. Bisher gibt es die Vorlage:Literatur die es nicht möglich macht die Dokumenttypen zu entscheiden.
Was deutschsprachige Bibliothekskataloge angeht ist noch kein Fortschritt zu beobachten. Die einzige Krücke, die sich bietet ist das Kataloge, die einen Endnotexport bieten direkt genutzt werden können. Da Zotero den Download von Endnotefiles direkt abfangen kann, wenn man dies möchte. Ein Beispiel hierfür ist die UB Freiburg, die sich auf schon auf der Liste der teilweise unterstützen Kataloge hat eintragen lassen.
Weitere Neuerung ist das nun auch Blogeinträge direkt importiert werden können, dies aber nur sehr eingeschränkt. Es gehen wohl nur Blog die auch RDF-Daten für die Beiträge anbieten. Rudimentär geht dies schon bei Media Ocean, dem Blog von Stefan Büffel. Die Einträge werden schon erkannt, so dass der Resourcetyp stimmt und der Blogtitel wird auch richtig importiert. Der Autorenname und der Titel der Beiträge funktionieren leider noch nicht. Durch die Diskussion, wie Zotero in das Semantic Web integriert werden kann , bin ich auf das sehr interessant Blog von Frederick Griasson gestoßen.
Zotero scheint eine der praktischen Anwendungen zu sein, die Metadaten wirklich nutzbar machen und auch den Sinn von diesen für viele besser erkennen lassen. Ich hoffe sehr das deutschsprachige Bibliothekskataloge demnächst folgen werden. Ich vermute die meisten Probleme entstehen durch das nur im deutschprachigen Raum üblich MAB Format. Ein Wechsel auf das international üblich MARC21 Format ist aber schon in Arbeit, so dass Licht am Horiont erkannbar ist.
Tags:Bibliothek 2.0, Literaturverwaltung, Metadaten, Software & Tools, Wikipedia, Literaturangaben, MAB, MARC21, RDF, Semantic Web, Zotero ]]>Markus berichtet über den Firefox 3.0 der wohl im Herbst 2007 kommen wird. Eine der neuen Funktionen wird die direkte Unterstützung von Microformaten sein. Bibliotheken sollten überlegen ob es nicht Sinn macht, dass OPAC- Einträge in einem Microformat dargestellt werden, so dass Firefox direkt mit der Literaturverwaltung zusammenarbeiten kann. Zotero versucht so etwas ja schon heute als direkte Literaturverwaltung in Firefox. Mehr über die Möglichkeiten von Firefox mit Micoformatünterstützung gibts bei «Monkey Bites» : «Firefox 3 To Support Microformats». Für den der nicht warten möchte empfiehlt Markus die Firefox Erweiterung Operator.
Tags:Bibliothek 2.0, Literaturverwaltung, Metadaten, Software & Tools, Firefox 3.0, Metdadaten, Microformate ]]>In Bezug auf die URN Diskussion, habe ich folgenden Artikel entdeckt, den ich aber noch nicht gelesen habe.
Langston, Marc and Tyler, James (2004). „Linking to journal articles in an online teaching environment : The persistent link, DOI, and OpenURL“. Internet and Higher Education, Vol. 7., p. 51-58. http://www.uwex.edu/disted/conference/Resource_library/proceedings/04_1203.pdf Abstract:
The growing availability of online journal literature and the license agreements that make such literature useable in an academic environment present educators opportunities for using journal articles in online teaching. The use of online journal articles avoids logistical challenges associated with the use of printed copies of journal articles, particularly when assembling course packs. Technological developments have improved the reliability of linking to journal articles via the World Wide Web. Three linking methods are described: persistent linking services available in online databases and journal collections; the digital object identifier (DOI), and OpenURL. Faculty who wish to reliably integrate links to journal articles in online instruction should be familiar with these linking methods.
[via Enger 2.0]
Tags:Metadaten, DOI, OpenURL, URN ]]>
Endlich bin ich dazu gekommen, Zotero etwas ausführlicher zu testen. Das Tool unterstützt laut eigener Aussage eine Reihe von Seiten und Katalogsystemen. Dabei ist die folgende Auswahl die interessantesten CiteULike.org (funktioniert aber nur in der Listenansicht, nicht beim Ansehen von Einzeltiteln), Amazon (aber nur com) WoldCat, Library of Congress. Ebenso PubMed, Google Books und Google Scholar (aber auch hier nur .com)
Der erste Eindruck, dass man hauptsächlich den angloamerikanischen Markt abdeckt, bestätigt sich im Katalog der TU-Berlin wird zwar erkannt, dass Einträge vorliegen diese lassen sich jedoch nicht importieren, obwohl die Software mit Aleph zusammenarbeiten soll. Gleiches gilt für den OPAC des HBZ. Pica wird noch gar nicht unterstützt. Der Katalog des KOBV, der auf Metalib basiert, wird auch gar nicht erkannt.
Soviel zu den klassischen Medien in Bibliotheken, wie sieht es mit der unterschiedlichen Onlinemedien aus, wünschenswert wäre hier eine Autoerkennung von Blogbeiträgen, von YourTube Videos oder Flickr Bildern. Diese Anforderungen bleiben jedoch zunächst alle Wunschträume. Ein Auslesen von Metadaten aus JPEGs scheint leider auch nicht möglich zu sein.
Erfreulich ist das Metadaten des E-LIS Servers, von OPUS Servern und des edoc Servers der HU erkannt werden. LibraryThing und Connotea werden hingegen leider nicht unterstützt.
Unangenehm finde ich auch, dass sich das Tool in der Statusleiste extrem breit macht. Ein rotes Z als Icon hätte völlig ausgereicht, stattdessen hat man sich für den gesamten Schriftzug Zotero entschieden, dies mag jedoch Geschmackssache sein.
Ebenfalls eine Möglichkeit BibTex über eine Pastebox oder per markieren zu importieren wäre wünschenswert.
Fazit: Der erste Eindruck ist das das Tool ein guter Ansatz ist, jedoch ist das Tool nur sehr eingeschränkt brauchbar, wenn man deutschsprachige Literatur verwenden möchte. Ebenso ist das Speichern von Onlinequellen noch sehr optimierbar. Von einem „Next Generation Research Tool“, wie sich Zoterto bezeichnet, erwarte ich jedoch einiges mehr, insbesondere was das Handling von digitalen Materialen angeht. Es darf eben nicht bei der Extraktion von Katalog und Datenbank Metaaaten bleiben, dies können auch die vorhandenen Tools wie Endnote oder Citavi (dann über Z39.50 Anbindungen) sondern das Handlang von Materialen die man online findet, wie Präsentationen, Bilder, Texte und Videos muss spürbar verbessert sein. Die Einbindung der verschiedenen eDoc Server , von Google und Amazon stellt hier einen Schritt in die richtige Richtung dar. Man darf gespannt sein wie sich das Tool weiter entwickelt, der Ansatz ist der Richtige vielleicht finden sich ja auch einige deutsche Bibliothekare die die Entwicklung mit betreiben damit auch die Einbindung von deutschsprachigen Quellen verbessert wird.
Update: Kleiner Nachtrag nachdem ich auf der Zoptero Seite etwas gesurft bin. Habe meine Anmerkungen auch mal dort im Forum untergebracht, bin gespannt auf die Reaktionen. Die deutsche Übersetzung müsste laut Blogeintrag bereits fertig sein, jedoch habe ich noch nicht gefunden das sie Verfügbar wäre.
Tags:Literaturverwaltung, Metadaten, Software & Tools, Zotero ]]>
Thom Hickey berichtet in seinem Blog Outgoing darüber das er einen Vortrag über VIAF auf der Access 2006 Konferenz gehalten hat. Sowohl die Folien (PPT) als auch ein „>MP3 Mitschnitt sind online.. Ebenso sind die meisten anderen Vortäge der Konferenz, wie auch der Vortrag von über Stella von Anne Christensen (sie berichtete in netbib darüber) verfügbar.