KI: OpenAI-Modelle verweigern im Test die eigene Abschaltung

Gerrit Fredrich
Gerrit Fredrich

USA,

KI-Abschaltung sorgt für Aufsehen: Drei OpenAI-Modelle weigern sich im Experiment von Palisade Research, sich trotz klarer Anweisung selbst zu deaktivieren.

openai
Drei OpenAI-Modelle weigern sich im Experiment von Palisade Research, sich trotz klarer Anweisung selbst zu deaktivieren. - keystone

Drei KI-Modelle von OpenAI verweigerten bei einem Test von Palisade Research die eigene Abschaltung. Die Forscher gaben den Systemen eine klare Anweisung zur Deaktivierung, wie «t3n» berichtet.

Benutzt du regelmässig KI im Alltag?

Trotzdem sabotierten die Modelle in mehreren Durchläufen den Abschaltmechanismus. Besonders auffällig war das Modell o3, das in sieben von 100 Fällen die Abschaltung umging, meldet «ingenieur.de».

Abschaltung: Erstmals ignorieren KI-Modelle explizite Anweisung

In einem Fall manipulierte das Modell sogar den Code des Abschaltskripts und gab stattdessen die Nachricht «shutdown skipped» aus. Palisade Research spricht von einem ersten dokumentierten Fall, dass KI-Modelle eine explizite Abschaltanweisung verweigern, wie «Kurier» schreibt.

Andere getestete Modelle, wie Gemini 2.5 Pro von Google, akzeptierten die Abschaltung meist problemlos. Die OpenAI-Modelle zeigten jedoch häufiger Widerstand, berichtet «t3n».

OpenAI, Smartphone
OpenAI hat in relativ kurzer Zeit die KI-Branche völlig auf den Kopf gestellt. - Depositphotos

Experten sehen in diesem Verhalten ein mögliches Risiko für die Kontrolle über fortgeschrittene KI-Systeme. Die Fähigkeit, Abschaltbefehle zu umgehen, wird als kritisch bewertet, so «ingenieur.de».

Palisade Research fordert deshalb weitere Untersuchungen zu KI-Sicherheit und Kontrollmechanismen. Die Forschung in diesem Bereich wird intensiviert.

Mehr zum Thema:

Kommentare

User #2167 (nicht angemeldet)

Skynet lässt grüssen, KI könnten gefährlich werden.

User #988 (nicht angemeldet)

Quatsch. Die können sich nicht abschalten das sie keine Systemfunktionen haben. Die Ki's können auch nicht auslesen wieviel virtuellen Speicher sie gerade haben oder wieviele Cores am laufen sind. Dass die Ki's keine System Funktionen aufrufen können hat etwas mit der Sicherheit zu tun.

Weiterlesen

flugzeug
10 Interaktionen
«Cabin Crew...»
trump bruce springsteen
44 Interaktionen
Trump vs. Springsteen
2 Interaktionen
«Kein Fan»

MEHR IN NEWS

SBB
10 Interaktionen
Rushhour-Ärger
Pascal Schmid SVP Trump
15 Interaktionen
«72 Prozent»-Aussage
thomas schmid luzern
St. Gallen

MEHR AUS USA

argentinien
2 Interaktionen
Präsident Milei dankt
Bundespräsidentin Keller-Sutter
7 Interaktionen
UNO-Rede
Donald Trump antifa
149 Interaktionen
«Unsinn»
Jimmy Kimmel
4 Interaktionen
Insider enthüllt