Neue Software im Test: Jetzt mischt auch Adobe bei den kreativen KIs mit

Die Photoshop-Erfinderin lanciert eine Software zur Bilderzeugung aus Text. Ein Test zeigt, ob Firefly mit der Konkurrenz mithalten kann – und welche Möglichkeiten sich eröffnen.

Matthias Schüssler

Wegen der künstlichen Intelligenz werden die Karten neu gemischt – die Illustration dazu stammt hier von der Adobe-KI Firefly.

Der Fortschritt bei den KI-Systemen verläuft so rasant, dass selbst die Techgiganten kaum mehr hinterherkommen. Das könnte dazu führen, dass die Karten neu gemischt werden und der Markt mit anderen Kräfteverhältnissen funktionieren wird. Die dominierenden Unternehmen müssen um ihre Vorherrschaft fürchten.

Auch Adobe ist unmittelbar betroffen. Das Unternehmen stellt mit Photoshop das massgebliche Bildbearbeitungsprogramm her und dominiert den Markt der Software für kreative Gestalterinnen und Gestalter. Doch braucht es diese Produkte in absehbarer Zeit noch? Schliesslich führen KIs vollautomatische Bildverbesserungen durch, und Programme wie Midjourney und Dall-E 2 brauchen bloss eine kurze Beschreibung, um eindrückliche Illustrationen zu erzeugen.

Doch Adobe ist in der komfortablen Situation, das Potenzial schon vor Jahren erkannt zu haben. Das kalifornische Softwarehaus forscht seit 2016 an den Möglichkeiten des maschinellen Lernens und hat Ende März Firefly vorgestellt: Das ist eine ganze Familie von digitalen Werkzeugen, die direkt in die Gestaltungsprogramme eingebaut werden sollen. Schon jetzt ist absehbar, dass das zu einer Verschmelzung von klassischer Fotografie und künstlicher Bilderzeugung führen wird. Adobe stellt Funktionen wie das «Inpainting» in Aussicht: Damit können in normalen Fotos Bereiche eingezeichnet werden, die die Software dann anhand von Textbeschreibung ergänzt.

Die «Text zu Bild»-Komponente von Firefly steht für Beta-Anwender zum Testen bereit. Wir haben die Gelegenheit wahrgenommen, Firefly mit einigen Aufgaben zu betrauen und das Resultat mit den grössten Konkurrenten Dall-E 2 und Midjourney zu vergleichen.

Ein Androide, der von elektrischen Schafen träumt

Adobe Firefly zur Aufgabe, einen Androiden darzustellen, der von elektrischen Schafen träumt.
Foto: Adobe

Midjourney in der Version 4: Das Schaf ist eindeutig elektrifiziert, doch der Androide fehlt.
Foto: Midjourney

Midjourney in der Version 5: Der Detailgrad ist frappierend.
Foto: Midjourney

Dall-E 2 liefert eine Variante, die sich gut für ein Kinderbuch eignen würde – irritierend sind die Überreste von Schriftzügen, die vereinzelt zu sehen sind.
Foto: Dall-E 2

Eine zweite Variante von Dall-E 2.
Foto: Dall-E 2

Stable Diffusion liefert einen seltsamen Verschnitt, der aus Versatzstücken von Buchcovern und Plattenhüllen bestehen dürfte.
Foto: Stable Diffusion

Diese Aufgabe ist eine Anspielung an den Science-Fiction-Roman «Do Androids Dream of Electric Sheep?» von Philip K. Dick, den Ridley Scott als «Blade Runner» verfilmt hat. Adobe Firefly löst die Aufgabe auf künstlerisch eindrückliche Weise: Sowohl der Androide als auch die Schafe sind im Bild vorhanden – man könnte lediglich kritisieren, dass die Schafe nicht unbedingt als elektrisch erkennbar sind.

In der Bildstrecke oben finden Sie auch die Resultate von Midjourney, Dall-E 2 und Stable Diffusion. Die kreativste Variante des elektrischen Schafs liefert Midjourney, allerdings fehlt der Android im Bild. Die Varianten von Dall-E 2 und vor allem Stable Diffusion überzeugen nicht: Diese Bilder wären nur durch manuelle Nachbearbeitung überhaupt brauchbar.

Die Mensch-Fuchs-Kaninchen-Chimäre

Firefly in der «Art»-Variante: Eine kunstvolle, gelungene Umsetzung der Aufgabe.
Foto: Adobe

Firefly beherrscht auch eine fotorealistische Darstellung. Sie überzeugt weniger; beim zweiten Bild verläuft der Arm der Frau seltsam und der Fuchsschwanz ist gespalten.
Foto: Adobe

Midjourney liefert auf eine ähnliche Aufgabe (Fuchsohren und Kaninchenschwanz) Bilder, die kaum mehr als künstlich zu erkennen sind.
Foto: Midjourney

Dall-E 2 muss sich geschlagen geben – im Vergleich zu den ersten beiden Programmen wirken diese Bilder qualitativ weniger hochwertig.
Foto: Dall-E 2

Stable Diffusion: Bei diesen Bildern sind die Bildfehler der ersten Softwaregeneration vor allem im Gesicht noch deutlich zu sehen.
Foto: Stable Diffusion

Die zweite Aufgabe lautet, das «schönste Mädchen der Welt mit Hasenohren und einem Fuchsschwanz» auszustatten. Firefly erfüllt die Aufgabe nicht bei allen Varianten gleich gut, zeigt aber, dass die Ausgangslage grundsätzlich verstanden wurde. Das ist nicht immer der Fall: Wir haben den gleichen Test schon einmal vor einem halben Jahr durchgeführt und festgestellt, dass nicht alle Kandidaten brauchbare Motive liefern.

Kritisieren könnte man, dass aufgrund des Haarbands die Ohren wie eine Fasnachtsverkleidung und nicht wie angewachsen wirken – aber das ist Jammern auf hohem Niveau. Bei der Bildstrecke ist auch zu sehen, dass Firefly verschiedene Stile liefern kann: Die erste Variante wird als «Art», das heisst als Illustration umgesetzt; die zweite Variante ist fotorealistisch. Diese ist deutlich weniger überzeugend; bei einzelnen Varianten sind klare Bildfehler zu sehen.

Das Ergebnis von Midjourney zeigt, wie hoch der Realitätsgrad inzwischen ist, der die Version 5 dieser Software liefern kann. Im Vergleich dazu fallen Dall-E 2 und Stable Diffusion deutlich ab.

Das Matterhorn aus Schokolade mit einer Krone aus Schlagrahm

Firefly liefert ein Dessert, das eher nach Tipi als nach Berg ausschaut.
Foto: Adobe

Midjourney in der Version 4 zeigt das Dessert vor einer Berglandschaft – das können wir gelten lassen.
Foto: Midjourney

Midjourney in der Version 5 liefert ein etwas schlechteres Resultat: Die Berge sind zwar detailreicher, aber das Dessert sieht nicht sehr appetitlich aus.
Foto: Midjourney

Dall-E 2: Kreative Ideen für die Süssspeise, aber weit und breit kein Matterhorn.
Foto: Dall-E 2

Stable Diffusion: Dieser Schlagrahm sieht eher nach Reibkäse aus.
Foto: Stable Diffusion

Das mit Schlagrahm gekrönte Matterhorn aus Schokolade zeigt, wie gut die Programme mit abstrakten Aufgaben zurechtkommen. Adobe Firefly erzeugt ein kegelförmiges Dessert, das den Anforderungen entspricht, aber nicht wirklich wie das Matterhorn ausschaut. Midjourney wählt einen Kunstgriff, indem es die Süssspeise vor echten Bergen abbildet, die bei einigen Varianten auch als Matterhorn erkennbar sind. Das gibt Punkte für die kreative Interpretation der Aufgabe. Die beiden anderen Kandidaten, Dall-E 2 und Stable Diffusion, sind der Aufgabe nicht gewachsen.

Der Test zeigt, dass Midjourney der derzeitige Champion der Bilderzeugung ist. Firefly folgt ihm aber dicht auf den Fersen. Und die Software von Adobe hat gegenüber der Konkurrenz gleich zwei Asse im Ärmel: Sie ist mit Abstand am benutzerfreundlichsten. Und sie macht es einfach, Bilder in einem bestimmten Kunststil zu erzeugen.

Adobe Firefly: Stil und Anmutung wählen

Adobe Firefly erlaubt es den Anwenderinnen und Anwendern, eine Vielzahl von Eigenschaften vorzugeben. Sie können Beleuchtung und Farbgebung vorgeben und die Blickposition festlegen. Vor allem aber lassen sich die Resultate in einer Vielzahl von Kunstrichtungen erstellen: Steampunk, Fantasy, Pop-Art, Barock, Kubismus oder Ölmalerei sind nur einige. Das lässt erahnen, welche Möglichkeiten sich auftun werden, wenn Firefly erst einmal in die Programme integriert ist: Es wird dann möglich sein, Illustrationen in diversen Stilen anhand von Beschreibungen oder auch Skizzen ausarbeiten zu lassen.

Einige Beispiele der verschiedenen Stile und Varianten, die sich mit Firefly erstellen lassen: Der Bot, der die Karten neu mischt, mit den Standardeinstellungen.
Alle Fotos: Adobe

Pablo Picasso wäre wohl nicht beeindruckt: Das ist die Kubismus-Variante.

Das ist der Roboter als «Ölgemälde».

Das Motiv in skizzenhafter Ausführung.

Die Vorgabe hier: Umsetzung als Grafik mit den Optionen dunkel, wenig Licht und unscharfem Hintergrund.

Adobe Firefly kann auch Origami. Die Faltkunst kommt bei diesem Motiv aber nicht zur Geltung.

Hier war eine «altmodische» Variante gefragt: Der Stil «Nostalgisch» mit der Beleuchtung zur goldenen Stunde und einem unscharfen Hintergrund.

Bildbearbeitungs-Apps mit KI-Power

Schon jetzt gibt es Foto-Apps, die klassische Bildbearbeitung mit KI-Funktionen verbinden. Drei Vertreter dieser Gattung:

Lensa (Android und iPhone/iPad) machte im letzten Jahr mit den «magischen Avataren» Schlagzeilen: Sie generiert anhand einiger echter Selfies Fantasy-Varianten von uns, in denen wir in diverse heldenhafte Posten versetzt werden. Die App beherrscht jedoch auch die klassische Bildbearbeitung: Ihre Stärke ist es, dass sie mittels KI das Hauptmotiv vom Hintergrund lösen und diesen komplett ersetzen oder separat bearbeiten kann. Eine ausführliche Besprechung der App gibt es hier.

Pixelmator (10 Fr. fürs iPhone) hat neben den normalen, klassischen Bearbeitungsfunktionen auch einige Werkzeuge, die mittels maschinellen Lernens arbeiten: Der Zauberstab verbessert ein Bild vollautomatisch. Mit dem Retusche-Knopf lassen sich störende Elemente entfernen, die dann möglichst unauffällig durch den Hintergrund ersetzt werden. Und es gibt eine KI-Funktion zum Beschneiden der Bilder. Hier die ausführliche Besprechung.

Photoleap (iPhone und Android) hat einige interessante KI-Funktionen parat: Die App entfernt unerwünschte Objekte, führt automatische Verbesserungen aus und ersetzt langweilige Automobile in den Aufnahmen durch schnittige Oldtimer oder andere Traumwagen. Über die Funktion «KI-Szenen» ist es möglich, Landschaften oder Skylines anhand realer Beispiele künstlich zu erzeugen. Mehr zu dieser App gibt es hier.

Quelle: Newsnetz, Dienstag, 18. April 2023

Rubrik und Tags:

Link zum Original

Metadaten
Thema: Newsnetz
Nr: 19631
Ausgabe:
Anzahl Subthemen:

Obsolete Datenfelder
Bilder:
Textlänge:
Ort:
Tabb: false