" />

Archiv für die Kategorie: 'Open Access'

Since last year i talked about Open Bibliographic Data. During my time at CERN I managed that CERN as one the first libraries is publishing there data unter a public domain weaver. At the IFLA Pre-Conference (that I was not able to attend) Jens Vigen from CERN spoke about this project. After him spoke Anders Söderbäck about “Why Open Access to Bibliographic Metadata Matters, for Libraries and for the World.” I hope the slides will be online soon.

On sunday in the “semantic web and libraries” session (08:30 - 12:45 | Room: F4-6) I will give a presentation about “Step one: blow up the silo! - Open bibliographic data, the first step towards Linked Open Data”. A Paper with the main ideas you will find already online. Also I publishes already my presentation on slideshare. If you are in Gothenburg I hope You will join the session.


Tags:,

Heute habe ich eine Mail von Dan Brickley erhalten, der auf Flickr eine Visualisierung der UDC Klassen der bibliographischen Daten der CERN Library bereitgestellt hat. Ich bin begeistert, so viel zum Thema nicht intendierte Nutzung der Daten.


Tags:,

Wie ich schon auf der SWIB09 angekuendigt hatte, veroeffentlicht das CERN die Bibliographischen Daten aller am CERN katalogisierten Buecher unter der Public Domain Dedication Licence und unter CC0.

In der Ankuendigung erklaert Jens Vigen, Head Librarian des CERN:

Books should only be catalogued once. Currently the public purse pays for having the same book catalogued over and over again. Librarians should act as they preach: data sets created through public funding should be made freely available to anyone interested. Open Access is natural for us, here at CERN we believe in openness and reuse. There is a tremendous potential. By getting academic libraries worldwide involved in this movement, it will lead to a natural atmosphere of sharing and reusing bibliographic data in a rich landscape of so-called mash-up services, where most of the actors who will be involved, both among the users and the providers, will not even be library users or librarians. Our action is made in the spirit of the Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities; bibliographic data belongs to the cultural heritage.All other signatories should align their policy accordingly”

Ich hoffe das noch viele Bibliotheken dieser Idee folgen werden. Zu der Publikation der Daten gibt es ach ein kleines Video:


Tags:,

Dieser Beitrag von Anne Christensen, Patrick Danowski und Adrian Pohl wurde zeitgleich auf den Blogs netbib, Bibliothek 2.0 und mehr und Übertext veröffentlicht.
Katalogdaten sind zweifellos gefragter denn je - nicht nur für Zwecke der Fremddatenübernahme bei der Katalogisierung, sondern auch im Web 2.0, von Sozialen Katalogisierungsanwendungen wie LibraryThing und Open Library. Darüberhinaus gewinnen mit dem unaufhaltsamen Fortschritt von Linked Data, der dieses Jahr seinen bisherigen Höhepunkt erreicht hat, Katalogdaten in einem weiteren Anwendungsbereich an Bedeutung. Die Verlinkung freier Daten (Linked Open Data) bietet uns die Möglichkeit, das Wissen, was in den Titel- und Normdaten enthalten ist, abzuschöpfen und durch die Verknüpfung mit anderen - nichtbibliothekarischen - Wissensressourcen seine Nutzungsmöglichkeiten zu maximieren.

Kommerz mit Metadaten

Parallel zu dieser Entwicklung des Internet zum Linked-Data-Web und der Aussicht auf ganz neue Möglichkeiten der Recherche und Wissensgewinnung entwickelt sich aber auch die kommerzielle Nutzung von Metadaten in ganz neue Dimensionen. OCLC, das etwa ein Drittel seines Umsatzes mit dem Verkauf von anderen produzierter Katalogdaten macht, versuchte mit einer neuen Metadaten-Policy - unter Umgehung der Mitgliederbasis und der bibliothekarischen Gemeinschaft, die das Vorhaben schließlich zu Fall brachten -, sein Monopol auf die Katalogdaten der Mitgliedsbibliotheken juristisch zu zementieren. Organisationen wie EBSCO und Serials Solutions  versuchen mit ihren neuen Produkten EBSCO Discovery Service und Summon eine Menge Geld im Bereich Aggregierung und Verkauf von Metadaten und dazugehörigen Suchoberflächen zu verdienen.

Open Access: ja, Open Data: ja, Open Bibliographic Data: nein

Vor diesem Hintergrund ist es verwunderlich, dass die deutschsprachigen Bibliotheken und Bibliotheksverbünde sich bisher kaum mit neuen Nutzungsmöglichkeiten ihrer bibliographischen Daten auseinandergesetzt haben. Adrian Pohl stellte zwar am Ende seiner Dokumentation der OCLC-Metadaten-Kontroverse bereits u.a diese Frage für die deutschsprachige Bibliothekswelt:

“Wie stehen deutsche Bibliotheken im Allgemeinen zu einem Urheberrecht auf bibliografische Metadaten und zu einer Einschränkung des Zugangs auf diese Daten? Wie zum freien Zugang und zur kostenlosen Verbreitung von Metadaten?” (S.288)

Über Problemstellungen wurde aber bisher selten geredet und an die Öffnung und Verfügbarmachung der mit öffentlichen Mitteln produzierten bibliothekarischen Daten wird kaum ein Gedanke verschwendet. Zur gleichen Zeit wird die Bibliothekswelt nicht müde als ein wichtiger Pfeiler der Open-Access-Bewegung lautstark von anderen, nämlich Wissenschaftlern, die Freigabe ihrer Arbeitsprodukte, sowohl von Publikationen also auch von Rohdaten, zu fordern.

Es tut sich was…

Es sind aber erste Entwicklungen hin zur Freigabe bibliographischer Daten auszumachen: Im Strategieentwurf des Gemeinsamen Bibliotheksverbund (GBV) vom August dieses Jahres ist die Entwicklung einer Lizenz zur Freigabe der Verbunddaten festgehalten, auch das Hochschulbibliothekszentrum Nordrhein-Westfalen (hbz) unterstützt die Freigabe von Katalogdaten und Patrick Danowski hat - wie im Übertext berichtet - auf der Tagung “Semantic Web für Bibliotheken” angekündigt, dass die CERN Library ihre Daten öffnen werde. (Leider hat sich der angekündigte Termin auf Januar 2010 verschoben)

…aber: Zwei Open-Data-Vorträge abgelehnt

Dass das Thema - auch im Bibliothekswesen - an Bedeutung gewinnt, ist also klar. Dies zeigte sich auch daran, dass mindestens zwei Vortragsvorschläge dazu - von den Autoren und der Autorin dieses Beitrags - für den Bibliothekskongress 2010 eingereicht worden sind. (Die beiden Abstracts sind am Ende dieses Textes dokumentiert.) Leider entschied die Programmkommission (deren Zusammensetzung nicht transparent im Internet dokumentiert ist), dass dem Thema “Freie bibliographische Daten” auf dem Bibliothekskongress kein Forum geboten werde. Beide Vorträge wurden abgelehnt. Insgesamt ist das Auswahlverfahren für den Bibliothekartag wie Bibliothekskongress wenig transparent.

Nachdem die erwähnte Tagung “Semantic Web in Bibliotheken” vom hbz und der ZBW im November 2009 innerhalb von kürzester Zeit ausgebucht war, ist es umso bedauerlicher, dass dem offensichtlichen Interesse von Kolleginnen und Kollege an dieser Thematik in dem Leipziger Programm anscheinend nicht Rechnung getragen wurde. Bibliotheken haben mit Open Data die Chance, sich als Erzeugerinnen und Anbieterinnen von qualitativ hochwertigen, webfähigen Daten zu profilieren. BID Deutschland, die Bundesvereinigung Deutscher Bibliotheksverbände, als Veranstalterin des Leipziger Kongresses versäumt damit den eigenen Anspruch, “zeitgemäße Informationsdienstleistungen als Voraussetzung für die Entwicklung von international konkurrenzfähigen Produkten zur Verfügung zu stellen”.

Gespannt erwarten wir das Programm, um zu sehen welche Themen BID Deutschland für wichtig und innovativ hält.

Dokumentation der eingereichten Abstracts:

(weiterlesen…)


Tags:, , ,

Etwas spät aber noch zu schaffen: Bis morgen kann eine Umfrage zur OCLC Policy Änderung beantwortet werden. In der Umfrage ist die persönliche Meinung nicht der der Institution gefragt. Einen deutschsprachigen Text zur Darstellung der Diskussion findet sich im Bibliotheksdienst 03/09 von Adrian Pohl.
Bibliotheken sollten im Kontext berücksichtigen, das sie fordern, dass wissenschaftliche primär Daten frei sein sollen. Wieso dann nicht auch bibliographische Primärdaten?


Tags:, , , , ,

Letztes Jahr auf dem Bibliothekskongress habe ich in meinem Vortrag zu Wikisource gesagt das gemeinfreie Materialien ,Gemeinfrei bleiben müssen. Etwas weiter habe ich dies in meinem Vortrag  ”New Rights on Public Domain via Digitalization?“ auf dem IFLA Satellite Meeting „Rethinking Access“ in Boston ausgeführt und die Position vieler Bibliotheken den Entwicklungen im Web 2.0 gegenübergestellt:


Gleichzeitig während die IFLA stattfand hat die EU Kommission ein Papier herausgegeben in der “Communication on Europe’s cultural heritage at the click of a mouse” heißt es sehr eindeutig in dem Bereich “Hindernisse für die Nutzung von gemeinfreiem Material” :

In den nationalen Rechtsvorschriften können Hindernisse für die Nutzung von gemeinfreien Werken enthalten sein. Diese Hindernisse können die Zugänglichkeit und Nutzbarkeit des Materials z. B. über Europeana beschränken. Auf diese Frage gehen nur wenige Mitgliedstaaten ein. Die geringe Reaktion in diesem Bereich deutet darauf hin, dass in vielen Mitgliedstaaten noch keine Maßnahmen ergriffen wurden und das Thema größerer Aufmerksamkeit bedarf. [...] In diesem Zusammenhang ist besonders zu betonen, dass gemeinfreie Werke diese Eigenschaft bei einer Formatänderung nicht verlieren sollten. So sollten sie gemeinfrei bleiben, wenn sie digitalisiert und über das Internet bereitgestellt werden.” (Hervorhebung von mir)

In dem zugehörigen Staff Paper wird noch etwas ausführlicher auf das Thema eingegangen: 

Member States seem to have taken hardly any action to identify and eliminate barriers to the online accessibility of works in the public domain held by public institutions. Most Member States do not address the issue in their reports. Some (e.g. Finland) indicate that they did look into the matter and did not find any problem. A few Member States report that there are provisions in the national legislation that limit the online accessibility of public domain works (e.g. Portugal, Sweden, Greece): 

  • Legislation on public access to documents held by public bodies: the general principle of free access to information may be limited on grounds such as personal data protection (privacy) or State security. [...] This affects in particular archives; 
  • Legal provisions in the area of copyright giving the State certain exclusive rights in relation to public domain material; 
  • Legal provisions concerning the protection of the cultural heritage, providing that reproduction and dissemination of cultural heritage belonging to or held by the State is subject to a licence and to the payment of a fee, even if it is in the public domain. 

In particular the last two types of barriers can create unnecessary problems for making the public domain material accessible through Europeana. No actions are reported to address this type of barriers. 

Etwas versteckt im Bereich Public Private Partnership ist der Hinweis:

Public domain content in the analogue world should remain in the public domain in the digital environment. If restrictions to user access and use are necessary in order to make the content available at all, these restrictions should only apply for a limited time period; [...]“

Nachdem die EU-Kommission im Rahmen der Europeana so eindeutig Stellung bezogen hat wäre es wünschenswert, wenn etwas analoges für die Deutsche Digitale Bibliothek folgen würde. Auf der IFLA habe ich erfahren das in die World Digital Library der UNESCO und der Library of Congress nur gemeinfreies Material einfließen wird und zwar nur Material das digital gemeinfrei ist, so dass vielleicht für die eine oder andere Institution einen weiteren Anlass gibt der 2007 veröffentlichten “Wikimedia-Empfehlungen für Rechte bei Digitalisierungsprojekten” zu folgen.   

[Danke an Patrick Peifer von der Nationalbibliothek in Luxemburg für den Hinweis auf die EU Texte]


Tags:, , , , , , , ,

In der aktuellen Ausgabe von Science wird eine erste Bilanz des reCAPTCHA Projekts gezogen. In dem Projekt wir eine neue Anwendung des Captcha Codes (Completely Automated Public Turing test to tell Computers and Humans Apart übersetzt “voll automatischer öffentlicher Turing-Test, um Computer und Menschen zu unterscheiden”) erprobt. Der Code wird eingesetzt um Spam beispielsweise in Blogkommentaren abzuwehren und sicher zu stellen das wirklich ein Mensch vor dem Computer sitzt. Dies funktioniert meisten, jedoch versuchen auch Spamer immer bessere Methoden (Ausführliche Informationen dazu im Telepolis Artikel “Der Captcha Krieg“)

Die Erkennungsrate von reCaptcha liegt bei 99%. “An jedem Tag würden über 100 Millionen dieser Tests gelöst. Das seien mehr als vier Millionen Wörter. Inzwischen wurden über 17.000 Bücher auf diese Weise bearbeitet. Die Fehlerquote liege bei unter einem Prozent. ” Verwendet wird es bereits auf über 40,000 Webseiten. Als Quelle dienen dabei Dokumente und Zeitungen aus dem Internet Archive der Open Content Alliance.

Ein weiteres Beispiel was mit freien Inhalten möglich ist.

(weiterlesen…)


Tags:, , , , , ,

Heise und Golem berichtet das Google den Dienst Knol nun offiziell startet, bisher war dieser nur in einer closed beta Phase. Bisher sind alle Artikel auf englisch, auch wird der Anspruch die Frage “Was ist eigentlich ….? ” meist von den Artikel nicht erfüllt. Bisher sind einige medizinische Fachartikel vertreten. Knol wird teilweise als Wikipedia Konkurrenz gehandelt. Im Gegensatz zur Wikipedia jedoch, setzt Google nicht auf komplett freies Wissen und Weiterverwendung sondern überlässt den Autoren die Wahl welche Lizenz verwendet wird.

Hier liegt meiner Meinung aber eine Stärke der Wikipedia, da hierdurch eine Reihe von interessanten Projekten wie DBpedia erst ermöglicht werden.

Somit ist Google Knol vielmehr eine Publikationsplattform für Artikel, die mindestens frei zugänglich sind. Diese können zusätzlich auch noch mit Werbung angereicht werden. Aufgrund der unterschiedlichen Ansätze kann Google Knol nicht als Wikipedia Konkurrent angesehen werden. Anders sieht dies bei Dokumentenservern aus, da Google Knol ja eine ähnliche Zielgrupe anspricht (Experten im weitesten Sinne).

Somit sollte man sich Google Knol einmal genauer ansehen und wir sollten uns wieder einmal Fragen, was wir daraus für uns ableiten. Geht freies wissenschaftliches Publizieren vielleicht doch etwas einfacher als wie es viele Dokumentenserver anbieten?

Ach ja, die Bereiche Information und Bibliothek sind bisher bei Google Knol nur sehr schwach vertreten.


Tags:, , , , ,

Der erste Vortragende ist Brian Rosenblum von der University of Kansas. Der Hauptfokus des Vortrags liegt auf “Electronic Publishing Services”. Er starte mit der Motivation wieso Bibliotheken Verlage werden sollen:

- Aufbauen auf dem existierenden digitalen Aktivitäten
- Bewerben der Veränderungen im wissenschaftlichen Publizieren
- Erhöhen der Sichtbarkeit des lokalen Publizierens
- Sie können das gesamte Journal Framework unterstützen
- Erstellen einer Cyberinfrastructur
- Erhöhen der Sichtbarkeit der Bibliothek

Insgesamt kann man das der Bibliotheksauftrag unterstützt wird. Bibliotheken können die Bereiche unterstützen die sie bereits gut können für andere Bereichen können Partnern und Kooperationen gebildet werden. Eine Beispiele dafür:

- SPO (University of Michigan) : Ein Beispielprojekt ist Philosopher’s Imprint und das intersannte kollaborative Übersetzungprojekt der Encyclopédie von Denis Diderot und Jean le Rond d’Alembert.
- Cornel University wo unter anderem arXiv.org gehostet wird.
- PennState Library
- California Digital Library eScholarship
- Stanford University HighWire Press
- University of Kansas Digital Initiatives: Pilot Projekt wie elektronisches Publizieren unterstützt werden kann durch Software und Partner. Start mit drei Open Access Journals.

Nach dieses Beispielen folgten eine Übersicht über Software Tools:

  • Open Journal Systems : Große Nutzerzahl aber nciht so flexibel
  • DPubS läßt sich besser auf verschiedene Modele anpassen
  • DSpace Mehr ein Archivierungssystem und weniger zur Unterstützung des Publikationsprozesses. Leider gibt noch keine Verbindung zwischen Archivierungs- und Journalpoduktionssoftware wir Open Journal System. Dies ist aber bereits in Arbeit.

Wie kommt man nun an den Content? Zunächst muss man der Universität Partner finden und sich mit diesen über die Modalitäten einigen. Außerdem kann die Bibliothek helfen Journale die an der Universität produziert werden ins elektronische Zeitalter zu überführen. Daten müssen transformiert, strukturiert und Metadaten erstellt werden. Dies muss im Workflow berücksichtig werden.

Mögliche erste Schriite können sein:

  • Herausfinden was in der Universität passiert
  • Mit Herausgebern von Journalen sprechen
  • Communities of Practice finden und beitreten
  • Mögliche Partner finden.

Tags:, , , ,

Ich habe entdeckt, dass das “Open Innovation” Buch von Telepolis, in dem unter anderen Kurt Jansson, Jakob Voss und ich einen Artikel über Wikipedia veröffentlich haben, komplett auf Wissensgesellschaft.org zum Download bereitsteht. (PDF)

Die kompletten bibliographischen Daten: Olga Drossou, Stefan Krempl,Andreas Poltermann (Hg.): Die wunderbare Wissensvermehrung, Heise Verlag 2006 (ISBN 3-936931-38-0)


Tags:, , , , , , , ,