Viele Webseiten verschwinden einfach – und damit oftmals Wissen

Foto von Taylor Vick auf Unsplash

Ein Beitrag des Pew Research Centers widmet sich einem relevanten Thema: dem Verschwinden von Online-Inhalten. Die Studie soll zeigen, dass ein erheblicher Teil der digitalen Informationen, die vor einigen Jahren noch zugänglich waren, heute nicht mehr verfügbar ist. Genauer gesagt, ist etwa ein Viertel aller Webseiten, die zwischen 2013 und 2023 existierten, inzwischen verschwunden oder unzugänglich, so die Autoren.

Besonders betroffen seien Inhalte auf Webseiten, die für kurzfristige Veranstaltungen oder spezifische Projekte erstellt wurden. Doch auch Bildungsressourcen, wissenschaftliche Arbeiten und wichtige Dokumente von historischen Ereignissen können der „Link-Verrottung“ zum Opfer fallen. Dies bedeutet, dass Links, die einst zu gültigen Seiten führten, nun auf Fehlerseiten stoßen oder ins Leere führen.

Die Studie des Pew Research Centers hebt hervor, dass dies nicht nur ein technisches Problem darstellt, sondern auch Konsequenzen für die Informationsfreiheit und Transparenz hat. Die Verfügbarkeit von Daten und Informationen im Internet sei entscheidend für Forschung, Bildung und demokratische Prozesse. Wenn diese Informationen verschwinden, gehen wertvolle Ressourcen und historisches Wissen verloren.

Der Bericht fordert deshalb stärkere Anstrengungen in der Web-Archivierung und die Entwicklung von Strategien, um die langfristige Verfügbarkeit von Online-Inhalten sicherzustellen. Institutionen, Unternehmen und Einzelpersonen sind aufgerufen, bewusster mit der Speicherung und Archivierung digitaler Inhalte umzugehen, um deren Haltbarkeit zu gewährleisten.

Da geht der erste Blick eines Nutzers sicher zur Wayback Machine von Internet Archive – für mich eines der Internet-Kulturgüter, deren Schutz an erster Stelle stehen sollte. Die haben schon um 850 Mrd. Seiten archiviert – und bei der heutigen Geschwindigkeit und den größeren Datenmengen ist das Archivieren mit immer größeren Herausforderungen verbunden. Auf der anderen Seite wird vermutlich kein System der Welt erkennen, was wirklich schützenswert ist. Sicher nicht die unzähligen Bot- und KI-Seiten, die sicherlich einen großen Teil ausmachen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

23 Kommentare

  1. Einige löschen sicher auch wegen der Impressums Sache. Früher konnte man seinen Blog usw noch frei betreiben, heute schwebt immer die Gefahr, das jemand einen Abmahnt. Ja als Privatmensch ist man davon befreit, aber die Grenzen sind schwimmend und wenn die Klage da ist, muss man erstmal Geld in die Hand nehmen und Aktiv werden. Nö danke. Oder man bekommt Besuch, mir war das alles zu blöd und hab dann lieber gelöscht. Schade um die ganzen Anleitungen aber so is es dann.

    • cryptosteve says:

      genau aus dem Grund habe ich meine Seiten vom Netz genommen. Es gab immer wieder Abmahnwellen und ich bin immer allen entgangen, hatte aber zunehmend Befürchtung, dass das nicht so bleibt.

      Sehr schade.

    • Das Impressum hält mich davon ab eine Website für meine Fotos zu starten.
      Eventuell wenn ich noch bessere Bilder mache, hole ich mir eine Briefkasten Impressum bei einem Anbieter wie Postflex für ca 130€ im Jahr.

    • Ernstgemeinte Frage: Was ist denn jetzt so schwer daran eine Seite als Impressum bereitzustellen? Dort ist ein Standardtext drauf den es in zahlreichen Vorlagen gibt. Eigene Kontaktdaten rein, fertig. Das macht man einmal und dann nie wieder.

      • Jeve Stobs says:

        Als Privatperson möchte man ungern seine Privatadresse veröffentlicht wissen und irgendwelchen Angriffen von anonymen Akteuren ausgesetzt sein. Ob das Spam oder sonstige Belästigung ist.

      • Es geht um die eigene private Anschrift.

      • Morethanevil says:

        Schreib deine Privatadresse rein und hoffe das Trolle dir keine Pizza schicken, oder ein Stalker vor deiner Tür ist.

        Aus diesem Grund habe ich bei Anschrift.net eine Adresse gebucht für 80€ im Jahr. Günstiger wird es nicht, ich bin zufrieden damit

        Eine Briefkastenadresse darf es nicht sein, die Anschrift muss ladungsfähig sein, es muss jemand die Post persönlich entgegen nehmen. Das ist bei Anschrift.net der Fall

  2. Zum Glück haben wir KI. Die scannt das alles, wenn sie nicht gerade halluziniert, um uns dann weiterhin mit dem Wissen aufzuklären. Ist natürlich Ironie, denn gerade KI wird ja auch dafür sorgen, dass sich die wenigsten überhaupt noch die Mühe machen, etwas festzuhalten, wenn Nutzer eh nur Zusammenfassungen einer KI lesen. Wissen gibt es dann überhaupt nicht mehr, nur noch angelernten Bullshit von Reddit Nutzermeinungen.

    Man verzeih mir meine bittere Zukunftsvision. KI wird natürlich selbst so klug, dass wir Menschen gar nicht mehr brauchen und kreativ ist sie ja auch, also brauchen wir auch keine Künstler mehr. Und Anwälte auch nicht, weil KI auch Recht und ordnung automatisieren kann…

  3. Ich mache mir viel mehr Sorgen um das ganze Wissen, das in Discord Channels verloren gehen wird, da die, anders als z.B. Reddit, nicht indexiert werden und somit nicht im Web Archive auftauchen werden.

  4. Otakufrank says:

    Ist bei Menschen auch nicht anders. Mit jedem Menschen der stirbt, geht wertvolles Wissen und Erfahrungen verloren.

  5. Damit ist dann erst recht Schluss mit dem Recht im Internet vergessen zu werden.

    • Das ist was anderes. Da geht es um die Wahrung der Persönlichkeitsrechte und hauptsächlich um die Speicherung von personenbezogenen Daten und deren Löschung, wenn der Zweck der Erfassung nicht mehr besteht.

  6. Sehr zwiespältiges Thema. „Früher“ sind Inhalte auch verschwunden, wenn keiner mehr ein Exemplar eines Buches oder einer Tageszeitung aufgehoben hatte. Selbst wenn konnte man deren Inhalte nicht einfach so der ganzen Menschheit zur Verfügung stellen. Aber genau daran haben wir uns gewöhnt.

    Es gibt aber auch Inhalte, die man aus Gründen nicht mehr weiterhin zur Verfügung stellen möchte, und da kommt die Waybackmaschine – ich weiß nicht, ob mir das recht wäre, und wie sieht’s da eigentlich mit dem Urheberrecht aus?

    Bestimmt ist bei den nicht mehr verfügbaren Webseiten auch viel Schwund dabei, dynamisch generierte Inhalte, abgekupfertes, sinnlose Kommentare wie meiner…

    Es ist schon so, dass viele nützliche Sachen verschwunden sind, vielleicht aber auch „dank“ Suchmaschinen nur nicht mehr leicht auffindbar. Wenn ich danach suche, wie ich in einer Linux-Konfigurationsdatei ein paar Zeichen ändern muss und dann als erstes ein halbes Dutzend YouTube-Videos dazu vorgeschlagen bekomme: WTF?

    • Bei archive.org kann man ‚beantragen‘ (verlangen), dass die eigenen gespeicherten Inhalte gelöscht werden, funktionierte jedenfalls vor 10J reibungslos.

      archive.ph, .is, … dürften da aber eine grössere Herausforderung darstellen.

  7. Betreibe den Blog auf eine Sprache und lass das Impressum weg. Da kommt kein deutscher Anwalt auf die Idee dir was böses anzutun.

  8. Vor allem Leistungsschutz – und Urheberrechte sind das Problem – denn z. B. die Musikindustrie will ja die Grenze, von der ab Aufnahmen als gemeinfrei zur Verfügung gestellt werden immer weiter zurücksetzen. Desgleichen werden Pojekte wie gutenberg von den Interessenverbänden der Buchindustrie auch mit immer weitergehenden Forderungen überzogen. Werke wie Aufnahmen, Bücher , Bilder usw. sollten nach einer Generationsspanne“, also 30, maximal 50 jahren gemeinfrei gestellt werden . Dann könnten Dienste viel unproblematischer nicht mehr aktuellen content in einer Art „Midrofilmarchiv“ speichern wie Zeitungen das tun. So weit wie möglich komprimiert, indexiert also durchsuchbar (auch die Texte und Fotos) und entsprechend verschlagwortet. Das sollte öffentlich finanziert werden und zum Beispiel in die hand von Universitäten oder Staatsarchiven gelegt werden. Alle Menschen sollten frei auf die Inhalte und Informationen zugreifen können. Urheber- und Leistungsschutzrechte werden viel zu oft als Recht auf Ausbeutung allgemeiner Informationen und Kulturgüter mißbraucht. Eigentum verpflichtet, auch dazu es nach einer gewissen Zeit der monetarisierung der Allgemeinheit frei zur Verfügung zu stellen. Denn kein autor, kein Künstler lebt ohne Leistungen der Gemeinschaft die er annimmtz, egal ob er produktiv ist oder eine Schreib- oder Mal- oder sonstige Produktivitätsblockade hat. Diese Sicherheit , immer eine ihn stützende Gemeinschaft hinter sich zu haben sollte er irgendwann dieser Gemeinschaft zurückgeben in dem er seine Werke dieser Allgemeinheit schenkt.

  9. Steht irgentwo geschrieben, das Wissen auf Webseiten unendlich erhalten bleiben muss ?

    Ich hab schon etliche Webseite über Google gefunden, die seit Jahren nicht mehr aktualisiert wurden – irgentwann wir die Domainregistrierung/Webhosting nicht mehr bezahlt, weil dem Eigentümer es egal ist / er keine Lust oder Zeit mehr hat und dann schaltet der Provider die Seite eben ab und weg ist alles.

  10. Heisenberg says:

    Und das Internet welches noch vorhanden ist, das ist ein ganz anderes als früher, inzwischen ist alles nur noch ein werbe- und Konzern Internet, das freie Internet der Vielfältigkeit ist tot!

    Die Algorithmen sind mit Absicht verstümmelt und viel schlechter als früher, bzw zudem auch viel content verloren gegangen.

    Die verstümmelten Algorithmen sehe ich als Angriff auf die Menschheit, da man sich jetzt nicht mehr so gut durchs Internet bewegen kann, und z.b nicht schnell an die benötigten Informationen kommt.
    Das raubt einen lebenszeit ohne ein quasi an der selbstfortbildung, gut dass Generation tiktok davon nichts weiß und es kein Aufstand gibt. 🙂

  11. FriedeFreudeEierkuchen says:

    Die Wayback Machine ist auf Spenden angewiesen und die scheinen nicht wirklich gut zu fließen. Server und Speicherplatz kosten vermutlich eine ganze Menge Geld. Seit Google den Cache abgeschafft hat, ist noch wichtiger geworden, dass das Wayback Machine Projekt gut finanziert ist.

  12. Das merke ich vor allem im Retro-Gaming. Was früher noch so einfach zu finden war ist heute ganz weg oder nur nach stundenlangem Try & Error auf irgendwelchen Archivseiten zu finden. Dabei hieß es immer: Das Internet vergisst nichts. Doch, in dem Fall schon.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.