Der Social-Media-Riese Twitter sagt, ein neues System zur Verhinderung der Verbreitung von Material über sexuellen Missbrauch von Kindern (CSAM) auf seiner Plattform sei „nahtlos implementiert“ worden, eine Testtechnologie, die von der gemeinnützigen Gruppe Thorn entwickelt wurde.
Der Twitter Safety-Account gab am Dienstag bekannt, dass er an einem Betatest der KI-gestützten Safer-Lösung der Gruppe teilgenommen hat, um proaktiv textbasiertes Material mit sexueller Ausbeutung von Kindern zu erkennen, zu löschen und zu melden.
„Durch unsere fortlaufende Partnerschaft mit Thorn tun wir mehr, um eine sichere Plattform zu schaffen“, schrieb der Twitter-Safety-Account. „Diese Arbeit baut auf unseren unermüdlichen Bemühungen zur Bekämpfung der sexuellen Ausbeutung von Kindern im Internet auf, mit dem konkreten Ziel, unsere Fähigkeiten bei der Bekämpfung hochschädlicher Inhalte zu erweitern, bei denen ein Kind unmittelbar gefährdet ist.“
„Diese selbst gehostete Lösung wurde nahtlos in unsere Erkennungsmechanismen integriert, sodass wir uns auf Hochrisikokonten konzentrieren konnten“, heißt es weiter.
Thorn wurde 2022 von den Schauspielern Demi Moore und Ashton Kutcher ins Leben gerufen und entwickelt Tools und Ressourcen, die sich auf den Schutz von Kindern vor sexuellem Missbrauch und Ausbeutung konzentrieren. Im April unterzeichneten Google, Meta und OpenAI eine von Thorn und seiner befreundeten Non-Profit-Organisation All Tech is Human abgegebene Zusage, Leitplanken für ihre KI-Modelle durchzusetzen.
„Wir haben aus unseren Betatests viel gelernt“, sagte Rebecca Portnoff, Vizepräsidentin für Datenwissenschaft bei Thorn Entschlüsseln. „Obwohl wir schon zu Beginn wussten, dass sich sexueller Kindesmissbrauch in allen Arten von Inhalten manifestiert, auch in Texten, haben wir in diesem Betatest konkret gesehen, wie maschinelles Lernen/KI für Texte in großem Maßstab reale Auswirkungen haben kann.“
Wie Portnoff erklärte, umfasst das Safer-AI-Modell ein Sprachmodell, das auf Texte zum Thema Kindersicherheit trainiert wird, und ein Klassifizierungssystem, das Multi-Label-Vorhersagen für Textsequenzen generiert. Die Vorhersagewerte reichen von 0 bis 1 und geben an, wie sicher das Modell ist, dass der Text für verschiedene Kategorien der Kindersicherheit relevant ist.
Während Portnoff nicht offenlegen konnte, welche anderen Social-Media-Plattformen am Betatest der Safer-Produktreihe teilnahmen, sagte sie, die Reaktion anderer Unternehmen sei positiv gewesen.
„Einige Partner teilten mit, dass das Modell besonders nützlich sei, um schädliche sexuelle Missbrauchsaktivitäten von Kindern zu identifizieren, gemeldete Nachrichten zu priorisieren und Ermittlungen gegen bekannte Täter zu unterstützen“, sagte Portnoff.
Aufgrund der Verbreitung generativer KI-Tools seit der Einführung von ChatGPT im Jahr 2022 haben Internet-Überwachungsgruppen wie die in Großbritannien ansässige Internet Watch Foundation Alarm geschlagen, weil in Dark-Web-Foren eine Flut von KI-generierter Kinderpornografie kursiert und es sich dabei um illegales Material handelt könnte das Internet überfordern.
Die Ankündigung des Twitter-Sicherheitsteams erfolgte Stunden bevor die Europäische Union das Unternehmen aufforderte, Berichte über „schwindende Ressourcen für die Inhaltsmoderation“ zu erklären.
Im jüngsten Transparenzbericht, den Twitter den EU-Regulierungsbehörden vorgelegt hat, heißt es, dass die Kostensenkungsmaßnahmen von Elon Musk die Größe des Inhaltsmoderationsteams der Plattform seit Oktober 2023 um fast 20 % reduziert und die Anzahl der überwachten Sprachen von 11 auf 7 gesenkt haben.
„Die Kommission fordert außerdem weitere Einzelheiten zu den Risikobewertungen und Minderungsmaßnahmen im Zusammenhang mit den Auswirkungen generativer KI-Tools auf Wahlprozesse, die Verbreitung illegaler Inhalte und den Schutz der Grundrechte“, heißt es in der Forderung weiter.
Die EU eröffnete im Dezember 2023 ein formelles Verfahren gegen Twitter wegen Bedenken, dass das Unternehmen in mehreren Bereichen gegen das Gesetz über digitale Dienste verstoßen hat, darunter Risikomanagement, Inhaltsmoderation, „dunkle Muster“ und Datenzugriff für Forscher.
Die Kommission sagte, Twitter müsse die angeforderten Informationen bis zum 17. Mai bereitstellen und bis zum 27. Mai weitere Fragen beantworten.
Herausgegeben von Ryan Ozawa.
Bleiben Sie über Krypto-Neuigkeiten auf dem Laufenden und erhalten Sie tägliche Updates in Ihrem Posteingang.