Computer

Gemini 3.5 Flash steuert Computer jetzt eigenständig

Sandra Neumann
Sandra Neumann

USA,

Gemini 3.5 Flash erhält eine integrierte Computersteuerung für KI-Agenten. So können Anwendungen selbstständig Aufgaben auf verschiedenen Geräten ausführen.

gemini 3.5
Gemini 3.5 Flash ermöglicht KI-Agenten die eigenständige Bedienung von Computern, Browsern und Smartphones. - Google

Google integriert die bisher separate Computersteuerung direkt in Gemini 3.5 Flash und erweitert damit die Fähigkeiten des KI-Modells deutlich. Entwickler benötigen dadurch kein zusätzliches Modell mehr und können Anwendungen einfacher automatisieren.

Die neue Funktion ermöglicht KI-Agenten, Browser, Desktop-Programme und mobile Anwendungen eigenständig zu bedienen. Gleichzeitig soll das Modell Aufgaben erkennen, planen und plattformübergreifend ausführen können.

Zusätzlich erweitert Google die Sicherheitsmechanismen für den Unternehmenseinsatz und schützt besser vor möglichen Angriffen auf KI-Agenten. Wie «ComputerBase» berichtet, gehören Nutzerbestätigungen und zusätzliche Schutzmassnahmen künftig zum Sicherheitskonzept.

Gemini 3.5 Flash übernimmt die Computersteuerung

Statt fester Programmabläufe analysiert die KI Benutzeroberflächen anhand von Bildschirmaufnahmen und erkennt eigenständig den jeweiligen Zusammenhang. Anschliessend klickt sie Schaltflächen an, füllt Formulare aus oder übernimmt wiederkehrende Dateneingaben.

Würdest du einer KI erlauben, deinen Computer selbstständig zu bedienen?

Auch komplexe Arbeitsabläufe lassen sich mit einem einzigen Befehl starten und anschliessend automatisch im Hintergrund ausführen. Das soll Entwicklern die Erstellung leistungsfähiger Software-Agenten deutlich erleichtern.

Zusätzlich erhält Chrome 149 eine Funktion zum schnellen Erfassen von Bildschirmausschnitten für KI-Anfragen. «Schmidtis Blog» zufolge gelangen markierte Inhalte dadurch ohne Zwischenschritte direkt in den Prompt.

Neue Einsatzmöglichkeiten für Entwickler

Gemini 3.5 Flash eignet sich unter anderem für Softwaretests, Wissensarbeit und weitere automatisierte Unternehmensprozesse. Die Computersteuerung funktioniert dabei auf Computern, Browsern und Smartphones gleichermassen.

API gemini 3.5
Gemini 3.5 Flash steht Entwicklern über die Gemini API für autonome KI-Anwendungen zur Verfügung. - Google

Im OSWorld-Benchmark erreicht das Modell bessere Ergebnisse als mehrere konkurrierende KI-Systeme und verbessert sich gegenüber seinem Vorgänger deutlich. Entwickler erhalten die Funktion ausserdem über die Gemini API und die Enterprise Agent Platform.

Wie «The Decoder» berichtet, stehen zusätzlich eine Demo-Umgebung und eine Referenz-Implementierung für erste Projekte bereit. Damit soll der Einstieg in die Entwicklung autonomer KI-Agenten deutlich einfacher gelingen.

Mehr zum Thema:

Kommentare

User #3505 (nicht angemeldet)

Jetzt gehts schlag auf schlag zu skynet

Weiterlesen

google
3 Interaktionen
Entwicklung
google gemini intelligence
2 Interaktionen
KI-Assistent
Pixel Watch 5
Erweiterung

MEHR IN NEWS

Schreibtisch
Studie zeigt
iphone ultra
Foldable-Markt
a
2 Interaktionen
Venezuela-Beben
2 Interaktionen
Zürich

MEHR COMPUTER

Champions League
2 Interaktionen
Prognose
Hufschmiede
1 Interaktionen
SwissSkills
schnellster Computer Europas
10 Interaktionen
«Jupiter»
gedanken computer
8 Interaktionen
Neue Technik

MEHR AUS USA

WM 2026 Deutschland Ecuador
139 Interaktionen
Skandal-Treffer!
d
3 Interaktionen
WM 2026
eddie murphy
«Shrek»-Star