KI: OpenAI-Modelle verweigern im Test die eigene Abschaltung

Gerrit Fredrich
Gerrit Fredrich

USA,

KI-Abschaltung sorgt für Aufsehen: Drei OpenAI-Modelle weigern sich im Experiment von Palisade Research, sich trotz klarer Anweisung selbst zu deaktivieren.

openai
Drei OpenAI-Modelle weigern sich im Experiment von Palisade Research, sich trotz klarer Anweisung selbst zu deaktivieren. - keystone

Drei KI-Modelle von OpenAI verweigerten bei einem Test von Palisade Research die eigene Abschaltung. Die Forscher gaben den Systemen eine klare Anweisung zur Deaktivierung, wie «t3n» berichtet.

Benutzt du regelmässig KI im Alltag?

Trotzdem sabotierten die Modelle in mehreren Durchläufen den Abschaltmechanismus. Besonders auffällig war das Modell o3, das in sieben von 100 Fällen die Abschaltung umging, meldet «ingenieur.de».

Abschaltung: Erstmals ignorieren KI-Modelle explizite Anweisung

In einem Fall manipulierte das Modell sogar den Code des Abschaltskripts und gab stattdessen die Nachricht «shutdown skipped» aus. Palisade Research spricht von einem ersten dokumentierten Fall, dass KI-Modelle eine explizite Abschaltanweisung verweigern, wie «Kurier» schreibt.

Andere getestete Modelle, wie Gemini 2.5 Pro von Google, akzeptierten die Abschaltung meist problemlos. Die OpenAI-Modelle zeigten jedoch häufiger Widerstand, berichtet «t3n».

OpenAI, Smartphone
OpenAI hat in relativ kurzer Zeit die KI-Branche völlig auf den Kopf gestellt. - Depositphotos

Experten sehen in diesem Verhalten ein mögliches Risiko für die Kontrolle über fortgeschrittene KI-Systeme. Die Fähigkeit, Abschaltbefehle zu umgehen, wird als kritisch bewertet, so «ingenieur.de».

Palisade Research fordert deshalb weitere Untersuchungen zu KI-Sicherheit und Kontrollmechanismen. Die Forschung in diesem Bereich wird intensiviert.

Mehr zum Thema:

Kommentare

User #2167 (nicht angemeldet)

Skynet lässt grüssen, KI könnten gefährlich werden.

User #988 (nicht angemeldet)

Quatsch. Die können sich nicht abschalten das sie keine Systemfunktionen haben. Die Ki's können auch nicht auslesen wieviel virtuellen Speicher sie gerade haben oder wieviele Cores am laufen sind. Dass die Ki's keine System Funktionen aufrufen können hat etwas mit der Sicherheit zu tun.

Weiterlesen

flugzeug
10 Interaktionen
«Cabin Crew...»
trump bruce springsteen
43 Interaktionen
Trump vs. Springsteen
2 Interaktionen
«Kein Fan»
pharmaSuisse
Der Apothekencheck

MEHR IN NEWS

Blatten VS Lawine verschüttet
4 Interaktionen
«Verschlungen»
kloten
In Kloten
Harvard University
Rechtliche Schritte
Blatten VS
Noch diese Nacht

MEHR AUS USA

-
11 Interaktionen
Auf Hundefoto
Furness Jackman Hugh Scheidung
«Traumatisch»
Trump
24 Interaktionen
Rechtswidrig
Trump Liberation Day Zölle
11 Interaktionen
Zölle gekippt