Since last year i talked about Open Bibliographic Data. During my time at CERN I managed that CERN as one the first libraries is publishing there data unter a public domain weaver. At the IFLA Pre-Conference (that I was not able to attend) Jens Vigen from CERN spoke about this project. After him spoke Anders Söderbäck about „Why Open Access to Bibliographic Metadata Matters, for Libraries and for the World.“ I hope the slides will be online soon.
On sunday in the „semantic web and libraries“ session (08:30 – 12:45 | Room: F4-6) I will give a presentation about „Step one: blow up the silo! – Open bibliographic data, the first step towards Linked Open Data“. A Paper with the main ideas you will find already online. Also I publishes already my presentation on slideshare. If you are in Gothenburg I hope You will join the session.
Heute habe ich eine Mail von Dan Brickley erhalten, der auf Flickr eine Visualisierung der UDC Klassen der bibliographischen Daten der CERN Library bereitgestellt hat. Ich bin begeistert, so viel zum Thema nicht intendierte Nutzung der Daten.

Wie ich schon auf der SWIB09 angekuendigt hatte, veroeffentlicht das CERN die Bibliographischen Daten aller am CERN katalogisierten Buecher unter der Public Domain Dedication Licence und unter CC0.
In der Ankuendigung erklaert Jens Vigen, Head Librarian des CERN:
Books should only be catalogued once. Currently the public purse pays for having the same book catalogued over and over again. Librarians should act as they preach: data sets created through public funding should be made freely available to anyone interested. Open Access is natural for us, here at CERN we believe in openness and reuse. There is a tremendous potential. By getting academic libraries worldwide involved in this movement, it will lead to a natural atmosphere of sharing and reusing bibliographic data in a rich landscape of so-called mash-up services, where most of the actors who will be involved, both among the users and the providers, will not even be library users or librarians. Our action is made in the spirit of the Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities; bibliographic data belongs to the cultural heritage.All other signatories should align their policy accordingly“
Ich hoffe das noch viele Bibliotheken dieser Idee folgen werden. Zu der Publikation der Daten gibt es ach ein kleines Video:
Tags:Open Access, Semantic Web ]]>Dieser Beitrag von Anne Christensen, Patrick Danowski und Adrian Pohl wurde zeitgleich auf den Blogs netbib, Bibliothek 2.0 und mehr und Übertext veröffentlicht. Katalogdaten sind zweifellos gefragter denn je – nicht nur für Zwecke der Fremddatenübernahme bei der Katalogisierung, sondern auch im Web 2.0, von Sozialen Katalogisierungsanwendungen wie LibraryThing und Open Library. Darüberhinaus gewinnen mit dem unaufhaltsamen Fortschritt von Linked Data, der dieses Jahr seinen bisherigen Höhepunkt erreicht hat, Katalogdaten in einem weiteren Anwendungsbereich an Bedeutung. Die Verlinkung freier Daten (Linked Open Data) bietet uns die Möglichkeit, das Wissen, was in den Titel- und Normdaten enthalten ist, abzuschöpfen und durch die Verknüpfung mit anderen – nichtbibliothekarischen – Wissensressourcen seine Nutzungsmöglichkeiten zu maximieren.
Kommerz mit Metadaten
Parallel zu dieser Entwicklung des Internet zum Linked-Data-Web und der Aussicht auf ganz neue Möglichkeiten der Recherche und Wissensgewinnung entwickelt sich aber auch die kommerzielle Nutzung von Metadaten in ganz neue Dimensionen. OCLC, das etwa ein Drittel seines Umsatzes mit dem Verkauf von anderen produzierter Katalogdaten macht, versuchte mit einer neuen Metadaten-Policy – unter Umgehung der Mitgliederbasis und der bibliothekarischen Gemeinschaft, die das Vorhaben schließlich zu Fall brachten -, sein Monopol auf die Katalogdaten der Mitgliedsbibliotheken juristisch zu zementieren. Organisationen wie EBSCO und Serials Solutions versuchen mit ihren neuen Produkten EBSCO Discovery Service und Summon eine Menge Geld im Bereich Aggregierung und Verkauf von Metadaten und dazugehörigen Suchoberflächen zu verdienen.
Open Access: ja, Open Data: ja, Open Bibliographic Data: nein
Vor diesem Hintergrund ist es verwunderlich, dass die deutschsprachigen Bibliotheken und Bibliotheksverbünde sich bisher kaum mit neuen Nutzungsmöglichkeiten ihrer bibliographischen Daten auseinandergesetzt haben. Adrian Pohl stellte zwar am Ende seiner Dokumentation der OCLC-Metadaten-Kontroverse bereits u.a diese Frage für die deutschsprachige Bibliothekswelt:
Über Problemstellungen wurde aber bisher selten geredet und an die Öffnung und Verfügbarmachung der mit öffentlichen Mitteln produzierten bibliothekarischen Daten wird kaum ein Gedanke verschwendet. Zur gleichen Zeit wird die Bibliothekswelt nicht müde als ein wichtiger Pfeiler der Open-Access-Bewegung lautstark von anderen, nämlich Wissenschaftlern, die Freigabe ihrer Arbeitsprodukte, sowohl von Publikationen also auch von Rohdaten, zu fordern.
Es tut sich was…
Es sind aber erste Entwicklungen hin zur Freigabe bibliographischer Daten auszumachen: Im Strategieentwurf des Gemeinsamen Bibliotheksverbund (GBV) vom August dieses Jahres ist die Entwicklung einer Lizenz zur Freigabe der Verbunddaten festgehalten, auch das Hochschulbibliothekszentrum Nordrhein-Westfalen (hbz) unterstützt die Freigabe von Katalogdaten und Patrick Danowski hat – wie im Übertext berichtet – auf der Tagung „Semantic Web für Bibliotheken“ angekündigt, dass die CERN Library ihre Daten öffnen werde. (Leider hat sich der angekündigte Termin auf Januar 2010 verschoben)
…aber: Zwei Open-Data-Vorträge abgelehnt
Dass das Thema – auch im Bibliothekswesen – an Bedeutung gewinnt, ist also klar. Dies zeigte sich auch daran, dass mindestens zwei Vortragsvorschläge dazu – von den Autoren und der Autorin dieses Beitrags – für den Bibliothekskongress 2010 eingereicht worden sind. (Die beiden Abstracts sind am Ende dieses Textes dokumentiert.) Leider entschied die Programmkommission (deren Zusammensetzung nicht transparent im Internet dokumentiert ist), dass dem Thema „Freie bibliographische Daten“ auf dem Bibliothekskongress kein Forum geboten werde. Beide Vorträge wurden abgelehnt. Insgesamt ist das Auswahlverfahren für den Bibliothekartag wie Bibliothekskongress wenig transparent.
Nachdem die erwähnte Tagung „Semantic Web in Bibliotheken“ vom hbz und der ZBW im November 2009 innerhalb von kürzester Zeit ausgebucht war, ist es umso bedauerlicher, dass dem offensichtlichen Interesse von Kolleginnen und Kollege an dieser Thematik in dem Leipziger Programm anscheinend nicht Rechnung getragen wurde. Bibliotheken haben mit Open Data die Chance, sich als Erzeugerinnen und Anbieterinnen von qualitativ hochwertigen, webfähigen Daten zu profilieren. BID Deutschland, die Bundesvereinigung Deutscher Bibliotheksverbände, als Veranstalterin des Leipziger Kongresses versäumt damit den eigenen Anspruch, „zeitgemäße Informationsdienstleistungen als Voraussetzung für die Entwicklung von international konkurrenzfähigen Produkten zur Verfügung zu stellen“.
Gespannt erwarten wir das Programm, um zu sehen welche Themen BID Deutschland für wichtig und innovativ hält.
Dokumentation der eingereichten Abstracts:
Freie Metadaten
Referenten: Anne Christensen (SUB Hamburg), Adrian Pohl (hbz)
ABSTRACT
Open Source und Open Access sind mittlerweile im öffentlichen und bibliothekarischen Diskurs fest verankerte Begriffe. In den letzten Jahren wird zunehmend auch über Open Data diskutiert – seien die freien Daten, um die es dabei geht, wissenschaftliche, statistische, administrative Daten oder eben Metadaten.
Dieser Vortrag dient als Einführung in das Thema „Freie Metadaten“ und beantwortet Fragen wie: Was heißt frei? Um welche Daten geht es? Warum sollen Daten frei sein? Behandelt werden der Hintergrund der Bestrebungen nach freien Metadaten, ihre Geschichte, die dahinterstehenden Motivationen und Ziele. Besondere Berücksichtigung findet dabei die Veröffentlichung von bibliografischen Daten und Normdaten als Open Linked Data.
Zudem werden Vorhaben zur Freisetzung der bibliografischen Metadaten im deutschsprachigen Raum betrachtet und es wird auf Fragen der Umsetzung eingegangen: Welche Lizenz soll ich wählen? Bin ich rechtlich befugt, alle Daten in meinem Katalog freizugeben? In welchem Format publiziere ich meine Daten?
Aus dem Silo ins Semantic Web: Bibliographische Daten als Linked Data Publizieren P. Danowski
CERN Scientific Information Service, 1211 Geneve, Schweiz
Inhalt
Tim Barners Lee hat den Begriff Linked Data fuer eine Methode beschrieben mit der Daten veroeffentlich, geteilt und verbunden werden. Dabei sollen die Daten mit URL basirten Identifiern erreichbar sein und andere Daten im Netz referenzieren (verlinken).1 Inzwischen wurde eine Vielzahl von Daten mit dieser Methode publiziert.2
Spaetestens seit dem letzten Jahr sind auch Bibliotheken auf dieses Thema aufmerksam geworden und beginnen ihrer Ressourcen in dieses Netz von Daten einzubringen. In dem Vortrag wird gezeigt, wie sich bibliographsche Daten als Linked Data publizieren lassen.
Dabei soll darauf eingegangen werden welche Frage zu klaeren sind. Dies sind unter anderen:
– Die Wahl einen Formats (einer Ontology)
– Lizenzfragen
– Vertrauensfragen
Der gesammten Prozess soll anhand eines Projekt fuer die Katalog Daten der CERN Library veranschaulicht werden. Es soll auch beschrieben werden welche Probleme in dem Prozess aufgekommen sind und welche Loesungsmoeglichten hierfür entdeckt wurden.
Quellenangaben
<1> vgl. auch http://en.wikipedia.org/wiki/Linked_data
<2> Zu der Menge der Daten gibt es ein klickbares Diagramm in dem die Verbindung der verschieden Ressources erkennbar ist. http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-07-14.html
Tags:Konferenzberichte, Metadaten, Open Access, Semantic Web ]]>Manu Sporny hat ein Video über die RDFa Basics erstellt. In dem Video erklärt er RDF, CURIEs, N3 und basic RDFa in 8 Minuten:
Tags:Semantic Web, Video, basic RDFa, CURIEs, Manu Sporny, N3, RDF ]]>
Thom Hickey berichtet in seinem Blog Outgoing darüber das er einen Vortrag über VIAF auf der Access 2006 Konferenz gehalten hat. Sowohl die Folien (PPT) als auch ein „>MP3 Mitschnitt sind online.. Ebenso sind die meisten anderen Vortäge der Konferenz, wie auch der Vortrag von über Stella von Anne Christensen (sie berichtete in netbib darüber) verfügbar.
Markus Trapp hat ja schon auf die aktuelle Ausgabe der iX und den Artikel über Microformats hingewiesen. Jedoch finde cih den Artikel der sich direkt davor befindet „Smartes Chaos. Web 2.0 versus Sematic Web“ von Cai Ziegler noch interessanter. Insbesondere erinnert mich die Gegenüberstellung von Semantic Web und Folksonomien stark an den Vergleich mit der bibliothekarischen Sacherschließung:
„Folksonomien entsagen den ordnenden Prinzipien, die in den strengen Strukturen der Taxonomie zu finden sind. Und genau darin liegt ihre Stärke: Die Vergabe eines Tags bedarf keines großen Aufwands und ist in wenigen Sekunden vollzogen; Surfer weisen Labels zu, die ihnen gerade in den Sinn kommen und ihnen am besten geeignet erscheinen, das dahinter stehende Konzept zu beschreiben.“
Das Semantic Web wird sich nur dann durchsetzen, wenn es zusammen mit dem Web 2.0 funktioniert. Ein reines Sematic Web hält Cai Ziegler für gescheitert. Insbesondere durch die Probleme der Vereinbarkeit von verschiedenen Taxonomien und Ontologien:
„Tatsächlich handelt es sich um in der Künstlichen Intelligenz altbekannte Probleme, seit Jahrzehnten ungelöst, nun in ein neues Gewand frisch verpackt.“
Nun Jakob Voß würde diesem sicher widersprechen und SKOS als Lösung für genau dieses Problem präsentieren. (Er hat am 17.10.06 im Berliner Bibliothekswissenschaftlichen Kolloquium einen Vortrag dazu gehalten) Jedoch bin ich mir nicht so ganz sicher ob sich dies, auch wenn es ein W3C Standart wird, durchsetzen können. Denn wir können nicht darum herum das Ontologien und Taxonomien erstellt werden müssen und dass diese dann auch noch intellektuell aufeinander gemappt werden müssen. Dies mag in Spezialanwendungen wie bestimmten Datenbanken durchaus praktisch sein, jedoch habe ich meine Zweifel, dass sich so etwas für das Web insgesamt durchsetzen wird.
Update: Direkt noch ein kleiner Nachtrag aus den Kommentaren die auf Markus seinen Beitrag erfolgten. Harald Sack weißt dort auf seinen interessanten Beitrag: “ how to connect semantic web and web 2.0“ hin. Von Benjamin Nowack stammt der Hinweis das der Beitrag in der RDF Community zerrissen wurde und inhaltliche Fehler enthält (leider sagt er nicht welche
) Ebenso weißt er auf seine Präsentation Semantic Web und Web2.0 hin.
Ich persönlich sehe nach Durchsicht all dieser Quellen nicht, wie das Problem der Eindeutigkeit (Semantic Web) und kontrollierten Vokabularen gegenüber dem Sozial Tagging (mehrere Begriffe für dasselbe Konzept) gelöst sein soll. Microformats sind daher natürlich nur ein Semantic Web light, weil sie genau diese Problematik umgehen.
Tags:Semantic Web, Benjamin Nowack, Folksonomy, iX, Jakob Voss, Markus Trapp, Microformats, SKOS ]]>
Gerade ging es im VIAF Kontext um Semtatic Web, da entdecke ich wie Markus Trapp ausführliche Informationen zu weiterführender Literatur liefert: Zum einen das Buch
Pellegrini, Tassilo; Blumauer; Andreas (Hrsg.): Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer Verlag, Berlin 2006 ISBN 3-540-29324-8 bzw. 978-3-540-29324-8
Dazu gibts eine Vorstellung von Mark Buzinkay, der an Buch mitgeschrieben hat, sowie eine Rezension von Heiner Wittmann. Ebenfalls finden sich alle Abstracts online. Weitere Quellen die Markus empfiehlt:
[via Text und Blog]
Tags:Semantic Web, ISBN 3-540-29324-8 ]]>Auf der Inetbib Liste berichtet Joachiam Eberhardt das im aktuellen Newsletter des Standardisierung der DNB über die aktuellen Stand des Projekts Virtual International Authority Files berichtet wird. VIAF ist ein gemeinsames Projekt der Deutschen Nationalbibliothek , der Library of Congress und dem OCLC Computer Library Center Ebenfalls weißt er auf den Bericht von der IFLA hin.
In diesem Bericht ist auch über den Anspruch von VIAF zu lesen:
Gegenwärtige Ansätze zur Zukunft des Web empfehlen die Nutzung von Ontologien, um das Web für maschinelle und automatische Prozesse intelligenter zu machen. Der VIAF könnte – kombiniert mit anderen kontrollierten Vokabularien und Normdateien anderer Anbieter, wie zum Beispiel Abstract- und Indexierungs-Dienste, Archive, Museen, Verlage etc. – einer der Grundbausteine für ein „semantisches Web“ sein. Bibliotheken haben jetzt die Gelegenheit, einen großen Beitrag für diese Zukunft zu leisten, und sollten helfen, die Vision Realität werden zu lassen. Für den Erfolg der gemeinsamen Vision ist es sehr wichtig, dass der VIAF allen Nutzern weltweit frei zugänglich gemacht
Ich hoffe die Umsetzung sieht genausogut aus, wie sich das liest. Denn nur mit einem Tool das jeder frei verwenden kann, der es benötigt kann es für das Sematic Web geeignet sein. Schön das diese Einsicht bei den Normdateien Einzug erhält.
Ich wünsche mir ja immer noch, dass man im Bereich der Klassifikationen ebenfalls dorthin gelangt und es eine freie internationale gute Klassifikation gibt. Dann müssten zum Beispiel nicht alle Virtuellen Fachbibliotheken ihre eigenen Fachklassifikationen entwickeln.
[via InetBib]
Tags:Bibliothek 2.0, Open Access, Semantic Web, AuthorityFiles, Classifikation, DeutscheNationabibliothek, Klassifikation, LibraryOfCongress, Normdatei, OCLC, SematicWeb, VIAF ]]>