KI: OpenAI-Modelle verweigern im Test die eigene Abschaltung

Gerrit Fredrich
Gerrit Fredrich

USA,

KI-Abschaltung sorgt für Aufsehen: Drei OpenAI-Modelle weigern sich im Experiment von Palisade Research, sich trotz klarer Anweisung selbst zu deaktivieren.

openai
Drei OpenAI-Modelle weigern sich im Experiment von Palisade Research, sich trotz klarer Anweisung selbst zu deaktivieren. - keystone

Drei KI-Modelle von OpenAI verweigerten bei einem Test von Palisade Research die eigene Abschaltung. Die Forscher gaben den Systemen eine klare Anweisung zur Deaktivierung, wie «t3n» berichtet.

Benutzt du regelmässig KI im Alltag?

Trotzdem sabotierten die Modelle in mehreren Durchläufen den Abschaltmechanismus. Besonders auffällig war das Modell o3, das in sieben von 100 Fällen die Abschaltung umging, meldet «ingenieur.de».

Abschaltung: Erstmals ignorieren KI-Modelle explizite Anweisung

In einem Fall manipulierte das Modell sogar den Code des Abschaltskripts und gab stattdessen die Nachricht «shutdown skipped» aus. Palisade Research spricht von einem ersten dokumentierten Fall, dass KI-Modelle eine explizite Abschaltanweisung verweigern, wie «Kurier» schreibt.

Andere getestete Modelle, wie Gemini 2.5 Pro von Google, akzeptierten die Abschaltung meist problemlos. Die OpenAI-Modelle zeigten jedoch häufiger Widerstand, berichtet «t3n».

OpenAI, Smartphone
OpenAI hat in relativ kurzer Zeit die KI-Branche völlig auf den Kopf gestellt. - Depositphotos

Experten sehen in diesem Verhalten ein mögliches Risiko für die Kontrolle über fortgeschrittene KI-Systeme. Die Fähigkeit, Abschaltbefehle zu umgehen, wird als kritisch bewertet, so «ingenieur.de».

Palisade Research fordert deshalb weitere Untersuchungen zu KI-Sicherheit und Kontrollmechanismen. Die Forschung in diesem Bereich wird intensiviert.

Mehr zum Thema:

Kommentare

User #2167 (nicht angemeldet)

Skynet lässt grüssen, KI könnten gefährlich werden.

User #988 (nicht angemeldet)

Quatsch. Die können sich nicht abschalten das sie keine Systemfunktionen haben. Die Ki's können auch nicht auslesen wieviel virtuellen Speicher sie gerade haben oder wieviele Cores am laufen sind. Dass die Ki's keine System Funktionen aufrufen können hat etwas mit der Sicherheit zu tun.

Weiterlesen

flugzeug
10 Interaktionen
«Cabin Crew...»
trump bruce springsteen
44 Interaktionen
Trump vs. Springsteen
2 Interaktionen
«Kein Fan»

MEHR IN NEWS

Nachspielzeit
57 Interaktionen
Nullnummer
hausbrand
Kanton Luzern
Frontalkollision Schupfart
Schupfart AG

MEHR AUS USA

Lian Bichsel NHL
Sorge um Schweizer
Trump
3 Interaktionen
Verhandlungen
stranger things
Aufklärung
Oscars Vanessa Hudgens
2 Interaktionen
«Wilder Ritt»