11 PM | 23 Sep

Einbetten von Google Books Inhalten

Google erlaub ab sofort auch das einbetten von Google Books Inhalten in die eigene Webseite. Eingebette Bücher lassen sich sogar durchsuchen. Außerdem bitete Google eine möglichkeit für kontextsensitive Links an, die nur dann aktiv sind wenn Google eine Vorschau zu dem Buch anbietet. Verwendet wird dieses Feature bereits vom WorldCat und von den Bibliotheken der  University of Texas und der University of California

eingesetzt. Mehr Informationen gibt es unter: http://code.google.com/apis/books/

[via ReadWriteWeb , Golem.de]

Tags:
10 PM | 23 Sep

DC2008: Ein Blick von Außen

An der Dublin Core Conference 2008 kann ich leider nicht teilnehmen, deshalb bleibt mir nichts anderes übrig als die Repräsentation der Konferenz im Web zu verfolgen. Zur Zeit hab ich nur den Beitrag von Jakob gefunden. Schön ist jedoch das die Folien der gelaufenen Vorträge schon im Programm veröffentlicht sind. Übrigens auch wenn man es der Seite nicht ansieht, ist die Konferenzwebseite mit WordPress als CMS gestaltet worden. Schön wäre es nur gewesen, wenn man die Präsentationstitel aus dem Programm auch als einzelne Elemente speichern könnte [z.B. mittels COinS oder RDFa für einzelne Objekte auf der Webseite]. Das wären dann semantische Metadaten in der Anwendung gewesen :-)

Update: Ergänzung in eckigen Klammern später hinzugefügt.

Tags:
09 PM | 22 Sep

Tech News Watch

Mal wieder ein neues Experiment. Ich habe keine Ahnung wie gut es funktioniert. Da mir beim Lesen meiner RSS Feeds immer das eine oder andere interessante über den Weg läuft, das keinen kompletten Beitrag wert ist oder ich gerade keine Zeit habe, werde ich und hin und wieder einfach die Schlagzeilen mit kurzen Kommentaren rebloggen. Dies gilt insbesondere für die Technik-News Seiten , die mich als Informatiker insbesondere interessieren aber nicht unbedingt für jeden so spannend sind. Somit werden die meist zitierten Seiten in diesem neuen Bereich heise.de, golem.de, TechChrunch und ReadWriteWeb sein.

Heute gleich die ersten Schlagzeilen von heute:

* Feldversuch für mobile E-Paper-Zeitung von Telekom und dpa. Testpersonen in Berlin mit iPhone ausgestattet: Das iPhone als Lesegerät für eContent (golem.de)

* Wordia – das Mitmachwörterbuch. Nutzer erklären Lieblingswörter in selbstgedrehten Videos: Alternativen zum klassischen Text (golem.de)

* OpenOffice 3.0 soll noch im September fertig werden: Alternative zum bearbeiten von Word und PDF Dateien, als lizenzfreier Ersatz zu Word und Acrobat (heise.de)

* CBS Launches Eyemobile for iPhone to Target Citizen Journalists : Das iPhone zum fotografieren für Bürgerjournalisten. Obwohl beim reinen Fotografieren auch Bürger-Paparazzi entstehen können (TechCrunch)

* Jay Adelson Hints That Facebook Connect Is the Future of Digg Facebook kann sich nun mit anderen Web 2.0 Diensten verbinden. Es startet mit Digg. (TechCrunch)

* RWW Live: Data Portability. Der RWW Podcast über Datenportabilität und Open Data. (ReadWriteWeb)

* SlotMusic: Musiktitel auf Flashspeicher anstatt CDs. Vertrieb von DRM freie Musik auf neuer Medienform (Flashspeicher) Vielleicht in Zukunft auch für Bibliotheken interessant. Nur das Kopierproblem ist in diesem Fall natürlich nicht gelöst. (MacLife)

Leider wird mir die Zeit fehlen einen solchen Überblick regelmäßig zu produzieren. Aber eine Fortsetzung wird es sicherlich geben :-)

Tags:
07 AM | 18 Aug

Bücher mit reCAPTCHA transkribieren

In der aktuellen Ausgabe von Science wird eine erste Bilanz des reCAPTCHA Projekts gezogen. In dem Projekt wir eine neue Anwendung des Captcha Codes (Completely Automated Public Turing test to tell Computers and Humans Apart übersetzt „voll automatischer öffentlicher Turing-Test, um Computer und Menschen zu unterscheiden“) erprobt. Der Code wird eingesetzt um Spam beispielsweise in Blogkommentaren abzuwehren und sicher zu stellen das wirklich ein Mensch vor dem Computer sitzt. Dies funktioniert meisten, jedoch versuchen auch Spamer immer bessere Methoden (Ausführliche Informationen dazu im Telepolis Artikel „Der Captcha Krieg„)

Die Erkennungsrate von reCaptcha liegt bei 99%. „An jedem Tag würden über 100 Millionen dieser Tests gelöst. Das seien mehr als vier Millionen Wörter. Inzwischen wurden über 17.000 Bücher auf diese Weise bearbeitet. Die Fehlerquote liege bei unter einem Prozent. “ Verwendet wird es bereits auf über 40,000 Webseiten. Als Quelle dienen dabei Dokumente und Zeitungen aus dem Internet Archive der Open Content Alliance.

Ein weiteres Beispiel was mit freien Inhalten möglich ist.

Read more

Tags:, , , , , ,
09 AM | 24 Jul

Google startet Knol – ein Konkurrent für Dokumentenserver?

Heise und Golem berichtet das Google den Dienst Knol nun offiziell startet, bisher war dieser nur in einer closed beta Phase. Bisher sind alle Artikel auf englisch, auch wird der Anspruch die Frage „Was ist eigentlich ….? “ meist von den Artikel nicht erfüllt. Bisher sind einige medizinische Fachartikel vertreten. Knol wird teilweise als Wikipedia Konkurrenz gehandelt. Im Gegensatz zur Wikipedia jedoch, setzt Google nicht auf komplett freies Wissen und Weiterverwendung sondern überlässt den Autoren die Wahl welche Lizenz verwendet wird.

Hier liegt meiner Meinung aber eine Stärke der Wikipedia, da hierdurch eine Reihe von interessanten Projekten wie DBpedia erst ermöglicht werden.

Somit ist Google Knol vielmehr eine Publikationsplattform für Artikel, die mindestens frei zugänglich sind. Diese können zusätzlich auch noch mit Werbung angereicht werden. Aufgrund der unterschiedlichen Ansätze kann Google Knol nicht als Wikipedia Konkurrent angesehen werden. Anders sieht dies bei Dokumentenservern aus, da Google Knol ja eine ähnliche Zielgrupe anspricht (Experten im weitesten Sinne).

Somit sollte man sich Google Knol einmal genauer ansehen und wir sollten uns wieder einmal Fragen, was wir daraus für uns ableiten. Geht freies wissenschaftliches Publizieren vielleicht doch etwas einfacher als wie es viele Dokumentenserver anbieten?

Ach ja, die Bereiche Information und Bibliothek sind bisher bei Google Knol nur sehr schwach vertreten.

Tags:, , , , ,
01 PM | 08 Jul

LibraryThing möchte freies Klassifikationsystem

Letztes Jahr auf der IFLA habe ich noch gesagt das DDC und UDC aufpassen müssen, da das Web nach einem freien Klassifikationssystem „hungert“ (siehe dazu Folie 18 meiner Präsentation). Heute kündigt Tim Spalding von Library Thing an, das er die Arbeit an einer solchen freien Klassifikation unterstützen wird: Die Open Shelves Classification (OSC). Dabei soll die Klassifikation die folgenden Bedigungen erfüllen:

Read more

Tags: