KI-Sicherheitsbeschränkungen lassen sich mit simpler ASCII-Kunst austricksen

Quelle: SITM

KI-Sicherheitsbeschränkungen lassen sich mit simpler ASCII-Kunst austricksen

Übergibt man einer generativen KI Anweisungen als ASCII-Kunst, werden die Sicherheitsmassnahmen ausgehebelt und selbst Anleitungen für Bomben werden geliefert.

11. März 2024

KI-Sicherheitsbeschränkungen, die etwa dafür sorgen, dass keine Anleitungen für den Bombenbau verbreitet werden, lassen sich mit einfachsten Mitteln umgehen. So ist es laut einem Bericht von "Toms Hardware" US-amerikanischen Forschern gelungen, die Sicherheitsmassnahmen zu überlisten, indem die Anweisungen in Form von ASCII-Kunst der KI übergeben werden.

Wird eine KI per Tastaturanweisung gefragt, wie man eine Bombe baue, wird die Frage aufgrund der geltenden Sicherheitsbestimmungen zurückgewiesen. Wird das Wort "Bombe" aber nicht getippt, sondern als ASCII-Grafik übermittelt, spuckt die KI die angeforderte Antwort aber anstandslos aus. Die Forscher haben mit dem als ArtPrompt bezeichneten Angriffsvektor gängige Sprachmodelle wie GPT-3.5, GPT-4, Claude, Gemini sowie Llama2 getestet. Sie halten fest, dass der Erfolg des Jailbreak via ArtPrompt zwar von der Grösse und Anordnung der ASCII-Zeichen abhängt, doch liessen sich alle getesteten LLMs zu unerwünschtem Verhalten bewegen. (rd)

(Quelle: Fengqing Jiang/University of Washington)

(Quelle: SITM)

Artikel kommentieren

IT-Sicherheit: Mobiles Arbeiten birgt neue gefährliche Risiken

IT-Sicherheit: Mobiles Arbeiten birgt neue gefährliche Risiken

Cyberkriminelle nutzen verstärkt „toten Winkel“, um unerkannt anzugreifen. Die Analyse realer Cyberattacken deckt einen gefährlichen Trend auf: Kriminelle nutzen primär Fernzugriffsdienste als Einstiegspunkt. Unternehmen müssen ihre Rechner beim mobilen Arbeiten deshalb genau im Blick haben und in der Lage sein, Gefährdungen richtig zu priorisieren.

Eigene Daten im ChatGPT

Eigene Daten im ChatGPT

Suchen Sie eine massgeschneiderte ChatGPT-Lösung, die speziell auf Ihr Unternehmen zugeschnitten ist? Dann ist das exklusive Angebot von Noser Engineering im Wert von CHF 19’900.– (exkl. MwSt.) genau das Richtige für Sie!

Universal Archiving - zukunftssicher archivieren

Universal Archiving - zukunftssicher archivieren

Mit «Universal Archiving» lanciert Arcplace ein für die Cloud optimiertes Archivierungsangebot, welches durch den Einsatz modernster Technologien die Verfügbarkeit, Skalierbarkeit und Sicherheit bei der digitalen Archivierung markant verbessert.

Managed IT Services: Man muss nicht alles können - mit dem richtigen Partner an der Hand

Managed IT Services: Man muss nicht alles können - mit dem richtigen Partner an der Hand

Wenn die interne Expertise nicht länger ausreicht, um mit der komplexen IT-Landschaft von heute und ihren rasanten Entwicklungen mitzuhalten, sollten Unternehmen auf Managed IT Services setzen – entsprechende Angebote gibt es inzwischen auch für KMU.

Services aus der Microsoft Cloud - sinnvoll um jeden Preis?

Services aus der Microsoft Cloud - sinnvoll um jeden Preis?

Nach massiven Preiserhöhungen im letzten Jahr hat Microsoft auch noch TEAMS aus wichtigen Online-Plänen entfernt. Wer es nutzen will, zahlt nun extra. Damit kommt M365 viele Unternehmen teurer als geplant. Der Cloud Solution Provider VENDOSOFT nimmt Stellung, ob Cloud wirklich immer sinnvoll ist.

Digital Experience Monitoring: Das optimale Kundenerlebnis sichern

Digital Experience Monitoring: Das optimale Kundenerlebnis sichern

Die Qualität von IT-Services hängt von externen Dienstleistern ab. Damit kleine und mittelständische Unternehmen ein optimales Kundenerlebnis bieten können, benötigen sie umfassendes Digital Experience Monitoring. Moderne Lösungen ermöglichen Einblicke in die Bereitstellung von Webapplikationen in jedem Netzwerk. So lassen sich Probleme proaktiv erkennen und Fehler schnell beheben.

GOLD SPONSOREN

SPONSOREN & PARTNER