Donnerstag, 5. September 2024

KI-Kunst-Explosion: Imagen 3, ChatGPT-4 und Bing Copilot im Vergleich - Meine ersten Gehversuche mit Prompt Engineering


Heute war es aufregend bei meinen immer offenen Browsertabs :D

Der leere Raum meines Gehirnes und den Fenstern zum Wissen
Die Erklärung zum Bild am Blogende.



Gemini wurde mit Imagen 3 aufgepeppt ! und ich kann grenzenlos Bilder damit erstellen (im Abo).


UND chatGPT4 wurde mit Erinnerungen ausgestattet. Das ist ja auch sehr hilfreich. Hier hab ich jedoch kein Abo momentan, und kann 2 Bilder am tag mit DALL-E 3 erstellen. Und ich kann mich über dieses Bild dann noch etwas unterhalten mit GPT4. Soweit sind die Unterhaltungen sehr lehrreich.

Da 2 Bilder aber nicht viel sind - muss ich Euch etwas verraten - Bing Copilot verwendet auch DALL-E 3 und dort könnt ihr scheinbar unbeschränkt Bilder erstellen, jeweils 4 Stück pro Prompt! Auch dort habe ich kein Abo.

Nun gut, zurück zu Gemini und Imagen und einem gefundenen Prompt :
[animal] in the wild shot with Kodak Gold film using a Canon EOS R8 with f/8 aperture setting.

Daraus habe ich dann mit Geminis Hilfe dieses Prompt gebastelt :

Prompt anzeigen A tiger in the jungle, in the morning around 11 o'clock. The light of the already high sun falls from behind and to the left, shining through the clearly visible leaves and making them gleam golden. There is foliage in the undergrowth on the ground, there are bushes between slender trees with climbing plants on the trunks. Ferns fill the rest of the open spaces. The tiger is seen almost frontally, at a slight angle of 5 to 10 degrees. Shot with Kodak Gold film and a Canon EOS R8 with an aperture setting of f/8.

Die 2 daraus entstanden Bilder sind genial - sie sind 2048 x 2048 px und bis zu 300dpi. also wirklich schon ein unterschied zu den DALL-E ´Bildern mit 1024 x 1024 px und 96 dpi.

Ein ausgewachsener Tiger in leichter seitenansicht im sommerlichen Dschungel.Ein ausgewachsener Tiger im sommerlichen Dschungel.

Dann habe ich probiert, das technische Zeug wegzulassen und habe mir dieses Bild erstellen lassen :

Prompt anzeigen A tiger in the jungle, in the morning around 11 o'clock. The light of the already high sun falls from behind and to the left, shining through the clearly visible leaves and making them gleam golden. There is foliage in the undergrowth on the ground, there are bushes between slender trees with climbing plants on the trunks. Ferns fill the rest of the open spaces. The tiger is seen almost frontally, at a slight angle of 5 to 10 degrees.
         
Erwachsener Tiger liegt in Seitenansicht im sommerlichen Dschungel

Hier wurde eindeutig der Winkel ignoriert :D
Und es gibt ein leichtes Rauschen im verschwommen, belichteten Teil des Blattwerks.

Natürlich habe ich auch in Bing dieses Prompt versucht :

Tiger im Dschungel von Bing erstellt, viel DschungelatmosphäreTiger im Dschungel von Bing erstellt, viel DschungelatmosphäreTiger im Dschungel von Bing erstellt, viel Dschungelatmosphäre

Hier gelingt es Bing  eine dichte und stimmungsvolle Dschungelatmosphäre zu vermitteln jedoch ist der Tiger nicht das Hauptmotiv.


Wow, was für ein Tag voller KI-Überraschungen und kreativer Experimente! Es ist faszinierend zu sehen, wie sich die Technologie rasant weiterentwickelt und uns immer neue Möglichkeiten eröffnet, unsere Ideen visuell zum Leben zu erwecken. Von den atemberaubenden Bildern von Imagen 3 bis hin zu den lehrreichen Gesprächen mit Gemini und ChatGPT-4 – die Zukunft der KI-Kunst sieht vielversprechend aus!


Was sind eure Erfahrungen mit den neuesten KI-Tools? Habt ihr schon mit Imagen 3, ChatGPT-4 oder Bing Copilot experimentiert? Teilt eure Gedanken, Fragen und Ergebnisse gerne in den Kommentaren! Ich freue mich darauf, von euren kreativen Abenteuern zu hören.

Das war nur der Anfang meiner Reise in die Welt des Prompt-Engineerings. Ich werde weiterhin fleißig üben und experimentieren, um meine Fähigkeiten zu verbessern und noch beeindruckendere Bilder zu generieren. Bleibt dran für weitere Updates und Einblicke in meine kreative KI-Odyssee!

Abonniert doch meinen Blog, um keine zukünftigen Beiträge zu verpassen.

Seid ihr auch gerade dabei, Prompt Engineering zu lernen wie ich, oder seid ihr schon Profis? Ich bin über Tipps wie ich meine Suche erleichtern kann, sehr dankbar! Habt Ihr Fragen ? oder Themenvorschläge ? Lasst es mich wissen !

Ihr könnt mich auch auf Facebook finden.





Und Hier die versprochene Erklärung zu dem EröffnungsBildes.
Ich bat Gemini um ein Bild das diesen heutigen Blogpost zusammenfasst und beschreibt.
Ich gestehe, ich hatte den Zusammenhang nicht kapiert. Also hier die Erklärung zu seinem Bild von Gemini :

Das Bild, das ich generiert habe, sollte eine abstrakte Darstellung des Lernprozesses und der kreativen Erkundung sein, die in deinem Blogpost beschrieben werden.

Hier meine Gedanken zu den Elementen im Bild:

Der weite, offene Raum: Er symbolisiert die unendlichen Möglichkeiten, die sich durch KI-Kunst und Prompt-Engineering eröffnen. Es ist ein Raum, in dem du deine Kreativität frei entfalten und neue Ideen erforschen kannst.

Das Fenster zur Außenwelt: Es repräsentiert die Inspiration, die du aus der Welt um dich herum schöpfst, sowie die Möglichkeit, deine Kunst mit anderen zu teilen und Feedback zu erhalten. Es ist eine Verbindung zwischen deinem inneren kreativen Prozess und der äußeren Welt.

Die Leere: Sie kann auf zwei Arten interpretiert werden. Zum einen kann sie die anfängliche Leere darstellen, die du fühlst, wenn du dich einem neuen Projekt oder einer neuen Technologie näherst. Zum anderen kann sie auch die Freiheit symbolisieren, die du hast, um diese Leere mit deinen eigenen Ideen und Visionen zu füllen.

Insgesamt soll das Bild eine Atmosphäre der Offenheit, des Potenzials und der kreativen Freiheit vermitteln. Es soll den Betrachter dazu ermutigen, sich auf die Reise des Lernens und Entdeckens einzulassen, so wie du es in deinem Blogpost beschrieben hast.


Keine Kommentare:

Kommentar veröffentlichen