“LlavaGuard” hat die Fähigkeit, auch komplexe Anforderungen zu erfüllen, da es sich durch seine Anpassungsfähigkeit an verschiedene rechtliche Vorschriften und Benutzeranforderungen auszeichnet. Zum Beispiel kann das Tool zwischen Regionen unterscheiden, in denen Aktivitäten wie der Konsum von Cannabis legal oder illegal sind. “LlavaGuard” kann auch bewerten, ob Inhalte für bestimmte Altersgruppen angemessen sind und sie entsprechend einschränken oder anpassen. Bisher waren solch feinkörnige Sicherheitstools nur für die Analyse von Texten verfügbar. Bei der Filterung von Bildern wurde bisher nur die Kategorie “Nacktheit” implementiert, nicht jedoch andere wie “Gewalt”, “Selbstverletzung” oder “Drogenmissbrauch”, sagt Friedrich.
“Nicht nur markiert “LlavaGuard” problematische Inhalte, sondern gibt auch detaillierte Erklärungen zu seinen Sicherheitsbewertungen, indem es Inhalte kategorisiert (z.B. “Hass”, “Illegale Substanzen”, “Gewalt”, usw.) und erklärt, warum sie als sicher oder unsicher eingestuft werden. Diese Transparenz macht unser Tool so besonders und ist entscheidend für das Verständnis und Vertrauen”, erklärt Friedrich. Sie macht “LlavaGuard” zu einem unschätzbaren Werkzeug für Forscher, Entwickler und politische Entscheidungsträger.