OpenAI macht mit künstlicher Intelligenz aus Text Bilder

Mit 12 Milliarden Parametern kann «Dall-E» des Unternehmens OpenAI nun Bilder aus Text erzeugen. Die Ergebnisse reichen dabei von abstrakt bis zu realistisch.

«Dall-E» ist ein Tool von OpenAI, welches mithilfe von künstlicher Intelligenz Bilder aus Text generiert. - OpenAI

Das Wichtigste in Kürze

  • Das Unternehmen OpenAI hat eine KI geschaffen, welche mit reinem Text-Input «zeichnet».
  • Das GTP-3-trainierte Programm visualisiert selbstständig Wörter oder ganze Sätze.
  • Die dabei entstehenden Bilder können, abstrakt, realistisch oder auch unerkennbar sein.

In der Welt von künstlichen Intelligenzen entstehen je länger je mehr verschiedene Anwendungsfälle und Umsetzungsmöglichkeiten. Manche sind dabei sinnvoller und erfolgreicher als andere. Das Unternehmen OpenAI stellte kürzlich das neue Programm «Dall-E» vor, welches Text in Bilder verwandeln kann. Bei diesem Vorhaben ist die künstliche Intelligenz auch mehrheitlich erfolgreich.

Das Modell wurde vom Unternehmen mit GTP-3 trainiert, und greift bei der Arbeit auf 12 Milliarden Parameter zurück. Somit kann Dall-E selbstständig verschiedene Ausgaben erzeugen, von künstlerischen Illustrationen, bis zu fotorealistischen Motiven ist alles vorhanden. Hierfür erhält das Programm pro Umwandlung 1280 Tokens, wobei 256 auf den Text und 1024 auf das Bild bezogen sind. Die dabei entstehenden Bilder können sich im Grossen und Ganzen auch sehen lassen.

Hier generiert Dall-E von OpenAI mit mehr oder weniger Erfolg ein grünes Stoppschild in der Form eines Quadrats. - OpenAI

So ganz perfekt funktioniert das Tool aber dann doch nicht, wie so oft bei künstlicher Intelligenz. Hin und wieder entstehen Bilder, bei denen sich nur erahnen lässt, was dargestellt werden soll. Und vor allem bei langen, verschachtelten Sätzen scheint Dall-E noch Probleme zu haben. Nichtsdestotrotz gibt es sicherlich Potenzial für die Arbeit, welche Unternehmen wie OpenAI hier verrichten.