Neuen Kommentar schreiben

Sehr interessanter Artikel auf Forbes "How Much Of The Internet Does The Wayback Machine Really Archive?": http://bit.ly/Wayback-Machine
 

Fast 20 Jahre, mehr als 23 Petabyte, über 445 Milliarden Webseiten - und dennoch ein Tropfen auf den heißen Stein, ein ganz geringer Teil des Internets nur. Da Verfahren und Algorithmen nicht bekannt sind, lässt sich der Wert des Internet Archive nur sehr bedingt einschätzen. Oft bestimmen auch nur Zufälle die Webseiten und die Häufigkeit der Snapshots. Ein bisschen seltsam ist es schon, dass 2 pornografische Seiten, ein Hotel auf Hawai und verschiedene Shops ganz oben auf der Liste der am häufigsten gecrawlten Seiten stehen.


Bei PROJECT CONSULT hatten wir uns auch daher entschlossen, selbst alle unsere Webseiten zu archivieren (leider ohne die Social Media Kanäle, die wir zusätzlich nutzen). In einem Blogbeitrag hatten wir den Nutzen des Internet Archive direkt mit unseren archivierten Webseiten bei Qumram verglichen: http://bit.ly/PC_Web-Archive


Die Bewahrung der Geschichte des Webs ist immer noch ungelöst. Und wie vor Jahrzehnten von mir schon angemerkt, wie befinden uns im Dunklen Zeitalter der frühen Informationskultur. Trotz all der verfügbaren Informationen aus Sicht von Archivaren und Historikern in einem sehr dunklen Zeitalter.
 

Die Antwort von David Rosenthal auf den Forbes Artikel: "You get what you get and you don't get upset" mit interessanten Zitaten zu Kalev Leetaru von Niels Brügger (Aarhus University) und Michael Neubert (Library of Congress) nimmt es aber eher leicht, da eine vollständige und gut erschlossene Archivierung sowieso nicht möglichist.