BlogKI

In einem Land vor unserer Zeit …

… als die Welt noch nicht von den Produkten generativer KI kontaminiert war

John Graham-Cumming, Softwareentwickler, Autor und Vorstandsmitglied von Cloudflare, sammelt auf seiner Website Low-background Steel (pre-AI) Datenbestände, die vor dem Siegeszug der generativen KI entstanden sind. Aber wozu? Und was hat Stahl überhaupt mit KI zu tun?

Im Zuge der Entwicklung von Atomwaffen fanden bis in die 60er Jahre oberirdische Atombombentests statt, und die dabei freigesetzten Radionuklide verteilten sich weltweit in der Atmosphäre. Bei der Stahlherstellung wird Luft oder reiner Sauerstoff (der aber auch der Luft entnommen wird) in das flüssige Roheisen geblasen, und seit den ersten Atomexplosionen 1945 wurde der Stahl dabei unweigerlich radioaktiv, denn die Radionuklide aus der Luft wurden im erkaltenden Stahl eingeschlossen. Die Strahlungswerte waren zwar so niedrig, dass davon keine relevante Gesundheitsgefahr ausging. Die Radioaktivität des Stahls wurde aber zum Problem, wenn man ihn zur Herstellung von Strahlungsmessgeräten verwenden wollte, deren Messergebnisse verfälscht worden wären. Für solche Zwecke wurde also sogenannter Low-background Steel benötigt, der nicht radioaktiv kontaminiert war. Aber woher nehmen? Eine gute Quelle solchen Stahls waren Schiffe, die vor 1945 gesunken und unter Wasser vor den Auswirkungen der Atomwaffentests bewahrt geblieben waren. Die Schiffe der kaiserlichen Flotte beispielsweise, die 1919, nach dem Ende des Ersten Weltkriegs, in Scapa Flow von ihren Besatzungen versenkt worden waren, damit sie nicht in die Hände der Siegermächte fielen. Erst in diesem Jahrhundert ist die Radioaktivität in unserer Atmosphäre wieder so weit abgeklungen, dass in den letzten Jahren hergestellter Stahl erneut unproblematisch ist und man nicht länger Schiffswracks bergen muss, um strahlungsarmen Stahl zu gewinnen.

Da auch strahlungsarmes Blei benötigt wird, kam es bereits zu Konflikten zwischen Physikern und Archäologen. Letztere fürchten nicht ohne Grund um die Reste antiker römischer Wasserleitungen, deren Blei Begehrlichkeiten weckt, weil Physiker es zur Abschirmung, etwa von Experimenten zur Entdeckung Dunkler Materie benötigen. Beim Blei sind allerdings nicht die Spätfolgen der Atombombentests das Problem: Rohes Blei enthält schon von Natur aus einen gewissen Anteil von Uran, das bei der Verarbeitung zu einem immer noch radioaktiven Blei-Isotop zerfällt. Dieses wiederum zerfällt sehr langsam mit einer Halbwertszeit von 22 Jahren. Nur in antikem Blei ist es schon so weitgehend zu einem nicht radioaktiven Isotop zerfallen, dass es sich für die Zwecke der Physiker eignet.

John Graham-Cumming griff auf den Stahl als Metapher zurück, als er sein Projekt zur Bewahrung des Internet vor dessen Kontaminierung durch die generative KI startete. Heutzutage müssen wir ja bei fast allen Inhalten im Internet damit rechnen, dass sie von einer KI produziert worden sind, seien es Bilder, Texte oder auch Programmcode. Das ist in mehrfacher Hinsicht problematisch. Wenn Wissenschaftler Texte im Internet untersuchen, um beispielsweise die Häufigkeit von Wörtern zu ermitteln, würden die Ergebnisse durch KI-Texte verfälscht. Die größte Gefahr droht, wenn KI-generierte Inhalten wiederum zum Training neuer KI-Modelle verwendet werden, was im ungünstigsten Fall zum Kollaps der Modelle führen kann.

Davor könnte man sich schützen, wenn die Herkunft der Inhalte gekennzeichnet wäre; dazu gibt es ja bereits Ansätze wie CAI/C2PA, doch haben sie sich noch nicht allgemein durchgesetzt. Auf der sicheren Seite ist nur, wer auf Material zurückgreift, das vor der Kontaminierung durch die KI entstanden ist, also vor 2022. Auf Low-background Steel (pre-AI) sind nun Quellen solchen Materials aufgelistet – beispielsweise GitHubs Arctic Code Vault, ein Schnappschuss allen Open-Source-Codes auf GitHub am 2. Februar 2020, sicher verwahrt in einem aufgelassenen Kohlebergwerk jenseits des Polarkreises. Oder eine Sicherung der Wikipedia vom August 2022. Wer auf Graham-Cummings Website noch nicht aufgeführte Schätze KI-freien Datenmaterials kennt, kann sie dort melden.


Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis sowie einige Seiten als Kostprobe.

Zeig mehr

Michael J. Hußmann

Michael J. Hußmann gilt als führender Experte für die Technik von Kameras und Objektiven im deutschsprachigen Raum. Er hat Informatik und Linguistik studiert und für einige Jahre als Wissenschaftler im Bereich der Künstlichen Intelligenz gearbeitet.

Ähnliche Artikel

Kommentar

  1. Sehr interessant! Das mit dem Stahl und Blei wusste ich noch nicht. Da ich als Fotograf in der Archäologie arbeite, muss ich ab jetzt unsere Stahl- und Bleireserven gut behüten, nicht nur das schnöde Gold! 😉

Schreibe einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Schaltfläche "Zurück zum Anfang"